JP2022544496A - 同一のシングルセルにおける、タンパク質発現、一塩基変化、及びコピー数多型のマルチオミクス同時検出のための方法、システム、及び装置 - Google Patents
同一のシングルセルにおける、タンパク質発現、一塩基変化、及びコピー数多型のマルチオミクス同時検出のための方法、システム、及び装置 Download PDFInfo
- Publication number
- JP2022544496A JP2022544496A JP2022508757A JP2022508757A JP2022544496A JP 2022544496 A JP2022544496 A JP 2022544496A JP 2022508757 A JP2022508757 A JP 2022508757A JP 2022508757 A JP2022508757 A JP 2022508757A JP 2022544496 A JP2022544496 A JP 2022544496A
- Authority
- JP
- Japan
- Prior art keywords
- cells
- cell
- various embodiments
- barcode
- emulsion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6804—Nucleic acid analysis using immunogens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57484—Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2458/00—Labels used in chemical analysis of biological material
- G01N2458/10—Oligonucleotides as tagging agents for labelling antibodies
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Urology & Nephrology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
細胞集団のシングルセル分析により、個別細胞の細胞遺伝子型(例えば、一塩基バリアント及びコピー数多型)、ならびに表現型(例えば、タンパク質発現)が明らかとなる。一シナリオでは、個別細胞を、そのそれぞれの遺伝子型及び表現型に従い分類することができる。一シナリオでは、集団内の全ての細胞の遺伝子型及び表現型は、細胞の亜集団を同定するのに有益であり、これにより、集団内の不均質性が明らかとなる。細胞の亜集団の同定は、特にがんなどの疾患の文脈において、細胞生物学の理解を改善するために有益であり、さらに、診断及び治療法の設計をより良くするために有益である。【選択図】図1A
Description
相互参照
本出願は、2019年8月12日に出願された米国仮特許出願第62/885,490号の利益及び優先権を主張し、これは、開示全体が、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
本出願は、2019年8月12日に出願された米国仮特許出願第62/885,490号の利益及び優先権を主張し、これは、開示全体が、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
背景
腫瘍のゲノム分析における近年の進歩により、がん疾患は、体細胞変化、クローン性増殖及び選択の反復プロセスにより進化することが明らかとなった。したがって、腫瘍内及び腫瘍間でのゲノム不均質性が、調査の主領域となっている。次世代シーケンシングは、がん生物学の理解に著しく寄与したものの、個別細胞のレベルにおける腫瘍の遺伝的不均一性は、バルク測定により提供される平均読出しでマスクされる。より少ない有病数変異を識別するために、非常に高いバルクシーケンスリード深さが必要である。選択した細胞集団内、及び当該集団にまたがる、希少な事象及び変異の同時発生は、このような平均シグナルを伴って不明瞭である。そのため、がん細胞などの細胞内で不均質な細胞集団を識別するのは困難であり、がん治療レジメンが有効なものとはならない。
腫瘍のゲノム分析における近年の進歩により、がん疾患は、体細胞変化、クローン性増殖及び選択の反復プロセスにより進化することが明らかとなった。したがって、腫瘍内及び腫瘍間でのゲノム不均質性が、調査の主領域となっている。次世代シーケンシングは、がん生物学の理解に著しく寄与したものの、個別細胞のレベルにおける腫瘍の遺伝的不均一性は、バルク測定により提供される平均読出しでマスクされる。より少ない有病数変異を識別するために、非常に高いバルクシーケンスリード深さが必要である。選択した細胞集団内、及び当該集団にまたがる、希少な事象及び変異の同時発生は、このような平均シグナルを伴って不明瞭である。そのため、がん細胞などの細胞内で不均質な細胞集団を識別するのは困難であり、がん治療レジメンが有効なものとはならない。
概要
複数の細胞のシングルセル分析を行い、個別細胞の細胞遺伝子型及び表現型を測定するための実施形態を、本明細書で記載する。様々な実施形態では、個別細胞の細胞遺伝子型及び表現型は、以前に知られていないであろうこれらの遺伝子型及び表現型を特徴とする細胞亜集団を発見するのに有益である。これは、不均質な細胞集団が多くの場合存在するが、容易に調査または発見されないがんの文脈において特に有益である。細胞亜集団の識別は、疾患生物学の理解を改善し、その後、診断及び治療法のよりよい設計に有益である。
複数の細胞のシングルセル分析を行い、個別細胞の細胞遺伝子型及び表現型を測定するための実施形態を、本明細書で記載する。様々な実施形態では、個別細胞の細胞遺伝子型及び表現型は、以前に知られていないであろうこれらの遺伝子型及び表現型を特徴とする細胞亜集団を発見するのに有益である。これは、不均質な細胞集団が多くの場合存在するが、容易に調査または発見されないがんの文脈において特に有益である。細胞亜集団の識別は、疾患生物学の理解を改善し、その後、診断及び治療法のよりよい設計に有益である。
本明細書にて開示した実施形態は、細胞ゲノムDNAから直接、細胞遺伝子型を測定することを伴う。具体的には、ゲノムDNAは直接バーコード化、増幅、及び配列決定され、細胞遺伝子型(例えば、SNV及びCNV)を測定する。ゲノムDNAから細胞遺伝子型を直接測定することを伴うこのような方法は、さほど直接的でない方法と比較して好ましい。例えば、さほど直接的でない方法は、RNA転写産物から逆転写したcDNAを配列決定することにより、細胞遺伝子型の間接読出しを提供することを伴う。ゲノムDNAから細胞遺伝子型を直接測定することを伴う、本明細書で開示される方法は、1)(さほど直接的でない方法が、コード領域に帯する細胞遺伝子型を測定するのみである一方で)コード領域及び非コード領域の両方にまたがる、細胞遺伝子型のより広範な理解を達成し、2)逆転写を避けることで、SNV及びCNVなどの細胞変異におけるコールの正確性を改善し(例えば、逆転写により生じるエラー及び/または処理アーチファクトを避け)、3)逆転写に必要な試薬(例えば、逆転写酵素)を含めることで生じるシングルセルワークフロープロセスのコストを低下させる、という利点を含む。
本明細書において、複数の細胞の分析方法であって、当該方法が、当該複数の細胞の1つ以上の細胞に対して、当該細胞を、試薬を含むエマルションに封入することであって、当該細胞が、少なくとも1つのDNA分子と、少なくとも1つの検体結合抗体がコンジュゲートしたオリゴヌクレオチドと、を含む、上記封入することと、当該細胞を当該エマルション中で溶解し、当該少なくとも1つのDNA分子と当該オリゴヌクレオチドとを含む細胞溶解物を生成することと、当該少なくとも1つのDNA分子と当該オリゴヌクレオチドとを含む当該細胞溶解物を、反応混合物と共に、第2のエマルション中で封入することと、当該第2のエマルション中で、当該反応混合物を用いて核酸増幅反応を行いアンプリコンを生成することであって、当該アンプリコンが、上記少なくとも1つのDNA分子のうちの1つに由来する第1のアンプリコンと、上記オリゴヌクレオチドに由来する第2のアンプリコンとを含む、上記生成することと、上記第1のアンプリコン及び上記第2のアンプリコンを配列決定することと、上記細胞の1つ以上の変異を、少なくとも上記配列決定した第1のアンプリコンを用いて測定することと、少なくとも上記第2のアンプリコンを用いて検体の有無を測定することと、細胞の亜集団を、上記複数の細胞内で発見することであって、当該細胞の亜集団が、上記1つ以上の変異、及び、上記検体の有無により同定される、上記発見することと、を含む、上記方法を開示する。
様々な実施形態では、1つ以上の変異は、一塩基バリアント(SNV)またはコピー数多型(CNV)を含む。様々な実施形態では、1つ以上の変異は、一塩基バリアント(SNV)及びコピー数多型(CNV)を含む。様々な実施形態では、複数の細胞内で細胞亜集団を発見することは、同定したSNVまたはCNVに従い、1つ以上の細胞をクラスター化することを含む。
様々な実施形態では、SNVまたはCNVは、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、T細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫に関連する遺伝子において同定される。様々な実施形態では、SNVまたはCNVは、ABL1、GNB1、KMT2D、PLCG2、GNA13、ATM、BRAF、JAK3、ADO、DNMT3A、SERPINA1、XPO1、PIM1、CCND1、FLT3、STAT3、AKT1、FAT1、CTCF、TP53、NOTCH1、KRAS、ALK、MYB、DNM2、DDX3X、CD79A、UBR5、PTEN、APC、PAX5、RUNX1、MAP2K1、CD79B、BIRC3、KMT2C、AR、CHD4、PHF6、POT1、CALR、TET2、ORAI1、OVGP1、ZMYM3、MYC、GATA2、CARD11、TP53BP1、TBL1XR1、BTK、WHSC1、MPL、FAS、CDH1、IKZF3、LRFN2、EGR2、SOCS1、PTPN11、PLCG1、CDK4、WTIP、ZFHX4、MED12、TNFRSF14、FAM46C、CDKN2A、BCOR、SORCS1、RPS15、TNFAIP3、IRF4、CBL、CSF1R、RPL22、BTG1、STAT6、PIK3CA、GNAS、CTNNB1、ASXL2、BCL11B、EZH2、DDR2、ATRX、MYD88、ARID1A、FGFR3、RAD21、EGFR、IKZF1、SMARCA4、SETD2、JAK2、ERBB2、KLF9、ERG、CREBBP、RB1、CHEK2、ERBB3、ETV6、RPL10、BCL2、DIS3、IDH1、ERBB4、NRAS、NFKBIE、NOTCH2、ESR1、HCN4、SF3B1、STAT5B、CCND3、U2AF1、FBXW7、CNOT3、EP300、CSF3R、FGFR1、USP9X、WT1、IDH2、FGFR2、SLC25A33、SH2B3、NF1、ZFP36L2、KIT、TRAF3、SETBP1、DNAH5、NCOR1、ABL1、ASXL1、GNA11、EPOR、GNAQ、XBP1、CDKN1B、USH2A、NPM1、HNF1A、FREM2、LEF1、HRAS、OPN5、ZRSR2、TSPYL2、LMO2、JAK1、B2M、TAL1、MGA、NFKBIA、ARAF、ZEB2、KDR、IL7R、SLC5A1、MYCN、PRDM1、MAP2K2、PHIP、MET、MLH1、REL、ZNF217、NOS1、MTOR、KDM6A、SPTBN5、SUZ12、UBA2、PDGFRA、PIK3R1、GATA3、CHD2、HDAC7、SMC1A、RAF1、MDGA2、USP7、SPEN、RET、ZFR2、SMAD4、ITSN1、SMARCB1、BCORL1、SMC3、SMO、RPL5、SRC、FOXO1、STK11、EBF1、PIK3CD、KMT2A、RHOA、CXCR4、PPM1D、VHL、LRP1B、及びSTAG2のいずれかにおいて同定される。
様々な実施形態では、検体の有無を測定することは、検体の発現レベルを測定することを含み、検体は、オリゴヌクレオチドにコンジュゲートした抗体により結合されている。様々な実施形態では、検体は、HLA-DR、CD10、CD117、CD11b、CD123、CD13、CD138、CD14、CD141、CD15、CD16、CD163、CD19、CD193 (CCR3)、CD1c、CD2、CD203c、CD209、CD22、CD25、CD3、CD30、CD303、CD304、CD33、CD34、CD4、CD42b、CD45RA、CD5、CD56、CD62P(P-セレクチン)、CD64、CD68、CD69、CD38、CD7、CD71、CD83、CD90 (Thy1)、FcεRIα、Siglec-8、CD235a、CD49d、CD45、CD8、CD45RO、マウスIgG1、κ、マウスIgG2a、κ、マウスIgG2b、κ、CD103、CD62L、CD11c、CD44、CD27、CD81、CD319(SLAMF7)、CD269(BCMA)、CD99、CD164、KCNJ3、CXCR4(CD184)、CD109、CD53、CD74、HLA-DR、DP、DQ、HLA-A、B、C、ROR1、アネキシンA1、またはCD20のうちのいずれかである。
様々な実施形態では、複数の細胞内で細胞亜集団を発見することは、測定した検体の有無に従い、1つ以上の細胞をクラスター化することを含む。
様々な実施形態では、同定したSNVもしくはCNVに従い、1つ以上の細胞をクラスター化すること、または、測定した検体の存在に従い1つ以上の細胞をクラスター化することは、主成分分析(PCA)、線形判別分析(LDA)、T分布型確率的近傍埋め込み法(t-SNE)、または、均一マニホールド近似及び投影(UMAP)のうちのいずれかから選択される、次元削減分析を実施することを含む。
様々な実施形態では、開示した方法は、エマルションに細胞を封入する前に、細胞を、複数の抗体コンジュゲートオリゴヌクレオチドに曝露することと、細胞を洗浄し、過剰の抗体コンジュゲートオリゴヌクレオチドを除去することと、をさらに含む。様々な実施形態では、複数の抗体にコンジュゲートしたオリゴヌクレオチドは、PCRハンドル、タグ配列、及び捕捉配列を含む。様々な実施形態では、複数の細胞はがん細胞を含む。様々な実施形態では、がん細胞は、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、T細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のうちのいずれかである。
様々な実施形態では、方法は、第2のエマルションに、第1のバーコード及び第2のバーコードを、少なくとも1つのDNA分子、オリゴヌクレオチド、及び反応混合物と共に封入することをさらに含む。様々な実施形態では、第1の核酸は第1のバーコードを含む。様々な実施形態では、第2の核酸は第2のバーコードを含む。様々な実施形態では、第1のバーコード及び第2のバーコードは、同じバーコード配列を共有する。様々な実施形態では、第1のバーコード及び第2のバーコードは、異なる配列を共有する。様々な実施形態では、第1のバーコード及び第2のバーコードは、第2のエマルション内でビーズに解放可能に付着している。
本発明のこれら及び他の特徴、態様、及び利点は、以下の説明、及び添付の図面に関してよりよく理解されるであろう。
詳細な説明
定義
請求項及び明細書で使用される用語は、特に明記しない限り、以下に記載するように定義する。
定義
請求項及び明細書で使用される用語は、特に明記しない限り、以下に記載するように定義する。
用語「対象」または「患者」は、同じ意味で用いられ、生体、ヒトまたは非ヒト、哺乳類または非哺乳類、雄または雌を包含する。
用語「試料」または「試験試料」は、静脈穿刺、排泄、射精、マッサージ、生検、針穿刺吸引、洗浄試料、擦過、外科的切開、または、当該技術分野において公知の他の介入もしくは他の手段を含む手段により対象から採取された、シングルセルもしくは複数細胞、または細胞の断片、または、血液試料などの体液のアリコートを含むことができる。
用語「検体」とは、細胞の構成成分を指す。細胞検体は、細胞の状態、挙動、または軌道を理解するのに有益である。したがって、本明細書に記載するシステム及び方法を用いて、細胞の1つ以上の検体のシングルセル分析を行うことは、細胞の状態または挙動を測定するのに有益である。検体の例としては、核酸(例えばRNA、DNA、cDNA)、タンパク質、ペプチド、抗体、抗体断片、多糖類、糖、脂質、小分子、またはこれらの組み合わせが挙げられる。特定の実施形態では、シングルセル分析は、タンパク質及びDNAなどの、2つの異なる検体を分析することを伴う。特定の実施形態では、シングルセル分析は、RNA、DNA、及びタンパク質などの、細胞の3つ以上の異なる検体を分析することを伴う。
語句「細胞表現型」とは、1つ以上のタンパク質の細胞発現(例えば、細胞プロテオミクス)を意味する。様々な実施形態では、細胞表現型は、シングルセル分析を用いて測定される。様々な実施形態では、細胞表現型は、タンパク質のパネル(例えば、がん進行に関与するタンパク質のパネル)の発現を意味することができる。様々な実施形態では、タンパク質パネルは、以下の血液系腫瘍:急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄病、骨髄増殖性腫瘍、またはT細胞リンパ腫のいずれかに関与するタンパク質を含む。様々な実施形態では、タンパク質パネルは、以下の充実性腫瘍:侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のいずれかに関与するタンパク質を含む。パネル内の例示的実施例は、HLA-DR、CD10、CD117、CD11b、CD123、CD13、CD138、CD14、CD141、CD15、CD16、CD163、CD19、CD193 (CCR3)、CD1c、CD2、CD203c、CD209、CD22、CD25、CD3、CD30、CD303、CD304、CD33、CD34、CD4、CD42b、CD45RA、CD5、CD56、CD62P(P-セレクチン)、CD64、CD68、CD69、CD38、CD7、CD71、CD83、CD90 (Thy1)、FcεRIα、Siglec-8、CD235a、CD49d、CD45、CD8、CD45RO、マウスIgG1、κ、マウスIgG2a、κ、マウスIgG2b、κ、CD103、CD62L、CD11c、CD44、CD27、CD81、CD319(SLAMF7)、CD269(BCMA)、CD99、CD164、KCNJ3、CXCR4(CD184)、CD109、CD53、CD74、HLA-DR、DP、DQ、HLA-A、B、C、ROR1、アネキシンA1、またはCD20のいずれかを含むことができる。
語句「細胞遺伝子型」とは、細胞の遺伝子構造を意味し、1つ以上の遺伝子、及び/または細胞の対立遺伝子(例えばホモ接合またはヘテロ接合)の組み合わせを意味することができる。語句「細胞遺伝子型」とは、一塩基多型(SNP)、一塩基バリアント(SNV)、挿入、欠失、ノックイン、ノックアウト、コピー数多型(CNV)、重複、転座、及びヘテロ接合性の喪失(LOH)を含む、細胞の1つ以上の変異多型をさらに包含する。様々な実施形態では、細胞表現型は、シングルセル分析を用いて測定される。様々な実施形態では、細胞表現型は、遺伝子のパネル(例えば、がん進行に関与する遺伝子のパネル)の発現を意味することができる。様々な実施形態では、パネルは、以下の血液系腫瘍:急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、またはT細胞リンパ腫のいずれかに関与する遺伝子を含む。様々な実施形態では、パネルは、以下の充実性腫瘍:侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のいずれかに関与する遺伝子を含む。例えば、急性リンパ性白血病に関しては、以下の遺伝子:ASXL1、GATA2、KIT、PTPN11、TET2、DNMT3A、IDH1、KRAS、RUNX1、TP53、EZH2、IDH2、NPM1、SF3B1、U2AF1、FLT3、JAK2、NRAS、SRSF2、またはWT1が調査される。
いくつかの実施形態では、本明細書に記載する個別の要素はドロップレットである。用語「エマルション」、「滴」、「ドロップレット」、及び「マイクロドロップレット」は、本明細書では同じ意味で用いられ、第1の流体相と不混和性である第2の流体相(例えば、油)により結合した、少なくとも第1の流体相、例えば水相(例えば水)を含有する、小型で、一般的には球状の構造体を意味する。いくつかの実施形態では、本開示に従ったドロップレットは、例えば、第2の不混和性流体相、例えば水相流体(例えば水)により結合した、第1の流体相、例えば油を含有することができる。いくつかの実施形態では、第2の流体相は、不混和性相キャリア流体である。故に、本開示に従ったドロップレットは、油中水型エマルション、または水中油型エマルションとして提供されてよい。ドロップレットは、個別の要素に対して、本明細書に記載するようにサイジングされる、及び/または形状化されることができる。例えば、本開示に従ったドロップレットは一般に、直径が1μm~1000μm(両端を含む)の範囲である。本開示に従ったドロップレットを使用して、細胞、核酸(例えばDNA)、酵素、試薬、反応混合物、及び様々な他の構成成分を封入することができる。用語「エマルション」は、マイクロ流体デバイス内で、またはこれにより作製され、かつ/または、マイクロ流体デバイスにより流されるか、もしくはアプライされるエマルションを指すために使用することができる。
用語「抗体」は、モノクローナル抗体(完全長モノクローナル抗体を含む)、ポリクローナル抗体、多重特異性抗体(例えば二重特異性抗体)、及び、抗原結合性である抗体断片、例えば、抗体またはその抗原結合断片を包含する。本明細書で使用する場合、「抗体断片」、及びそのあらゆる文法的変形は、インタクトな抗体の抗原結合部位または可変領域を含む、インタクトな抗体の一部として定義され、当該部分は、インタクトな抗体のFc領域の、定常重鎖ドメイン(即ち、抗体アイソタイプに応じてCH2、CH3、及びCH4)を非含有である。抗体断片の例としては、Fab、Fab’、Fab’-SH、F(ab’)2、及びFv断片;ダイアボディ;ならびに、連続したアミノ酸残基の1つの中断されていない配列からなる一次構造を有するポリペプチドである任意の抗体断片(本明細書では、「一本鎖抗体断片」または「一本鎖ポリペプチド」と呼ばれる)が挙げられる。
「相補性」とは、核酸が、従来のワトソン・クリック形式または従来型とは異なる他の形式のいずれかによって、別の核酸配列と水素結合(複数可)を形成する能力、すなわち、別の核酸配列とハイブリダイズする能力を指す。本明細書で使用する場合、「ハイブリダイゼーション」とは、分子が、特定のヌクレオチド配列のみと、低ストリンジェント、中ストリンジェントまたは高ストリンジェントな条件で結合、二本鎖形成またはハイブリダイズすることを指す(その配列が、複合混合物(例えば全細胞)のDNAまたはRNAに存在する場合を含む)。例えば、Ausubel,et al.,Current Protocols In Molecular Biology,John Wiley & Sons,New York,N.Y.,1993を参照されたい。ポリヌクレオチドのある特定の位置におけるヌクレオチドが、アンチパラレルなDNA鎖またはRNA鎖の同じ位置におけるヌクレオチドとワトソン・クリック対を形成できる場合には、そのポリヌクレオチドと、そのDNA分子またはRNA分子は、その位置において、互いに相補的である。そのポリヌクレオチドと、そのDNA分子またはRNA分子は、所望のプロセスに影響が及ぶように、各分子における対応する位置が十分な数、互いにハイブリダイズまたはアニールすることができるヌクレオチドで占められている場合には、互いに「実質的に相補的」である。相補的な配列は、ストリンジェントな条件下でアニールして、相補鎖合成起点として機能する3’末端をもたらすことのできる配列である。
「同一性」とは、当該技術分野において知られているように、2つ以上のポリペプチド配列または2つ以上のポリヌクレオチド配列間の関係であって、それらの配列を比較することによって求めたものである。当該技術分野においては、「同一性」とは、ポリペプチド配列またはポリヌクレオチド配列間の関連度であって、それらの配列からなる鎖間の一致率を求めたものも意味する。「同一性」及び「類似性」は、既知の方法によって容易に算出でき、その方法としては、Computational Molecular Biology,Lesk,A.M.,ed.,Oxford University Press,New York,1988、Biocomputing:Informatics and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993、Computer Analysis of Sequence Data,Part I,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,New Jersey,1994、Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987、Sequence Analysis Primer,Gribskov,M.and Devereux,J.,eds.,M Stockton Press,New York,1991及びCarillo,H.,and Lipman,D.,Siam J.Applied Math.,48:1073(1988)に記載されているものが挙げられるが、これらに限らない。加えて、同一性パーセントの値は、Vector NTI Suite 8.0(Informax、Frederick,Md.)のAlignXというコンポーネントのデフォルト設定を用いて生成したアミノ酸配列アラインメント及びヌクレオチド配列アラインメントから得ることができる。同一性を求める好ましい方法は、試験する配列間の一致率が最も大きくなるように設計する。同一性及び類似性を求める方法は、公的に入手可能なコンピュータプログラムに体系化されている。2つの配列間の同一性及び類似性求めるための例示的なコンピュータプログラムの方法としては、GCGプログラムパッケージ(Devereux,J.,et al.,Nucleic Acids Research 12(1):387(1984))、BLASTP、BLASTN及びFASTA(Atschul,S.F.et al.,J.Molec.Biol.215:403-410(1990))が挙げられるが、これらに限らない。BLAST Xというプログラムは、NCBI及びその他の供給源から公的に入手可能である(BLAST Manual,Altschul,S.,et al.,NCBINLM NIH Bethesda,Md.20894、Altschul,S.,et al.,J.Mol.Biol.215:403-410(1990))。周知であるSmith Watermanアルゴリズムを用いて、同一性を求めてもよい。
「増幅する」、「増幅すること」、「増幅反応」という用語、及びそれらの類似表現は概して、核酸分子の少なくとも一部(鋳型核酸分子という)を複製またはコピーして、追加の核酸分子を少なくとも1つもたらすいずれかの作用またはプロセスを指す。その追加の核酸分子は任意に、その鋳型核酸分子の少なくとも相当な部分と実質的に同一であるかまたは実質的に相補的である配列を含む。その鋳型核酸分子は、一本鎖であることも、二本鎖であることもでき、その追加の核酸分子は独立して、一本鎖であることも、二本鎖であることもできる。いくつかの実施形態では、増幅には、核酸分子の少なくとも相当な部分を少なくとも1コピー作製するか、または核酸分子の少なくとも相当な部分と相補的である核酸配列を少なくとも1コピー作製するための、酵素を触媒とする鋳型依存性のin vitro反応が含まれる。増幅には任意に、核酸分子の線形的または指数関数的な複製が含まれる。いくつかの実施形態では、このような増幅は、等温条件を用いて行い、別の実施形態では、このような増幅には、熱サイクリングを含めることができる。いくつかの実施形態では、増幅は、1回の増幅反応で複数の標的配列を同時に増幅することを含むマルチプレックス増幅である。その標的配列の少なくともいくつかは、1回の増幅反応に含まれる同じ核酸分子または異なる標的核酸分子に位置することができる。いくつかの実施形態では、「増幅」には、DNAベース及びRNAベースの核酸の少なくとも相当部分を単独で、または組み合わせて増幅することが含まれる。その増幅反応は、一本鎖または二本鎖の核酸基質を含むことができ、さらに、当業者に知られている増幅プロセスのいずれかを含むことができる。いくつかの実施形態では、その増幅反応は、ポリメラーゼ連鎖反応(PCR)を含むことができる。いくつかの実施形態では、増幅反応としては、LAMPなどの等温増幅反応が挙げられる。本発明では、核酸の「合成」及び「増幅」という用語を使用する。本発明では、核酸の合成とは、合成起点として機能するオリゴヌクレオチドから、核酸を延長または伸長させることを意味する。この合成のみならず、他の核酸の形成と、この形成された核酸の延長反応または伸長反応も連続的に行う場合、これらの一連の反応は、包括して増幅という。採用した増幅技術によって作製されたポリ核酸は一般に、「アンプリコン」または「増幅産物」という。
PCRベースのアッセイ、例えば定量PCR(qPCR)、または等温増幅のようないずれかの核酸増幅法を用いて、別個の物体、またはその構成成分の1つ以上、例えば、その物体に封入された細胞に存在するある特定の核酸、例えば、対象とする遺伝子の存在を検出してよい。このようなアッセイは、マイクロフルイディクスデバイスもしくはその一部、またはいずれかの他の好適な位置にある別個の物体に適用できる。このような増幅またはPCRベースのアッセイの条件は、経時的に核酸の増幅を検出することを含んでよく、1つ以上の方法が異なっていてよい。
本明細書に示されているある特定の実施形態で用いられる増幅反応では、多くの核酸ポリメラーゼを使用することができ、そのポリメラーゼには、ヌクレオチド(そのアナログを含む)が重合して核酸鎖となるのを触媒できるいずれの酵素も含まれる。ヌクレオチドのこのような重合は、鋳型依存的に行うことができる。このようなポリメラーゼとしては、天然のポリメラーゼ、そのサブユニット及びトランケート体のいずれか、変異ポリメラーゼ、バリアントポリメラーゼ、組み換えポリメラーゼ、融合ポリメラーゼ、または別段に操作したポリメラーゼ、化学的に改変したポリメラーゼ、合成の分子またはアセンブリ、ならびに上記のような重合を触媒する能力を保持するこれらのアナログ、誘導体または断片のいずれかを挙げることができるが、これらに限らない。任意に、そのポリメラーゼは、1つ以上のアミノ酸が他のアミノ酸に置換されているか、そのポリメラーゼから1つ以上のアミノ酸が挿入もしくは欠失されているか、または2つ以上のポリメラーゼの一部分が連結されていることを伴う変異を1つ以上含む変異ポリメラーゼであることができる。典型的には、そのポリメラーゼは、ヌクレオチドの結合及び/またはヌクレオチドの重合の触媒を行うことができる活性部位を1つ以上含む。いくつかの例示的なポリメラーゼとしては、DNAポリメラーゼ及びRNAポリメラーゼが挙げられるが、これらに限らない。本明細書で使用する場合、「ポリメラーゼ」という用語及びその類似表現には、連結し合った少なくとも2つの部分を含む融合タンパク質も含まれ、その第1の部分は、ヌクレオチドが重合して核酸鎖となるのを触媒できるペプチドを含むとともに、第2のポリペプチドを含む第2の部分に連結されている。いくつかの実施形態では、その第2のポリペプチドは、レポーター酵素またはプロセッシビティ向上ドメインを含むことができる。任意に、そのポリメラーゼは、5’エキソヌクレアーゼ活性またはターミナルトランスフェラーゼ活性を有することができる。いくつかの実施形態では、そのポリメラーゼは任意に、例えば、熱を利用するか、化学物質によるか、または新たな量のポリメラーゼを反応混合物に再度加えることによって再活性化させることができる。いくつかの実施形態では、そのポリメラーゼとしては、任意に再活性化させることができるホットスタートポリメラーゼまたはアプタマーベースのポリメラーゼを挙げることができる。
「標的プライマー」または「標的特異的プライマー」という用語、及びそれらの類似表現は、結合部位の配列と相補的であるプライマーを指す。標的プライマーは概して、標的核酸配列と少なくとも部分的に相補的である配列を少なくとも1つ含む一本鎖または二本鎖のポリヌクレオチド、典型的にはオリゴヌクレオチドである。
「フォワードプライマー結合部位」及び「リバースプライマー結合部位」とは、鋳型DNA及び/またはアンプリコンの領域のうち、フォワードプライマー及びリバースプライマーが結合する領域を指す。これらのプライマーは、元の鋳型ポリヌクレオチドの領域のうち、増幅の際に指数関数的に増幅される領域を定める働きをする。いくつかの実施形態では、追加のプライマーが、フォワードプライマー及び/またはリバースプライマーの5’側の領域に結合してよい。このような追加のプライマーを用いる場合、フォワードプライマー結合部位及び/またはリバースプライマー結合部位は、これらの追加のプライマーの結合領域と、そのプライマー自体の結合領域を含んでよい。例えば、いくつかの実施形態では、本発明の方法では、フォワードプライマー結合領域及び/またはリバースプライマー結合領域の5’側に位置する領域に結合する追加のプライマーを1つ以上使用してよい。このような方法は例えば、「置換プライマー」または「アウタープライマー」の使用について開示しているWO0028082に開示されている。
「バーコード」核酸識別配列は、核酸に組み込むか、またはプライマーに連結して、独立したシーケンシング及び識別が、同一の試料に存在する分子に由来する情報及び識別に関係するバーコードを介して互いに関連することを可能にすることができる。個別の構成要素の中で核酸にバーコードを取り付けるために使用可能な、多数の技術が存在する。例えば、標的核酸をまず増幅して、より短い片に断片化してもよいし、しなくてもよい。分子を個別の構成要素、例えば、バーコードを含有するドロップレットと組み合わせることができる。バーコードを次に、例えば、オーバーラップ伸長によるスプライシングを使用して、分子に取り付けることができる。本アプローチにおいて、最初の標的分子は「アダプター」配列が追加されていることができ、これは、プライマーが合成可能な既知の配列の分子である。バーコードと組み合わせたときに、アダプター配列及びバーコード配列に相補的なプライマーを使用することができ、標的核酸とバーコードの両方の生成物であるアンプリコンが互いにアニールし、かつ、DNA重合などの伸長反応により、互いに伸長することができ、バーコード配列に取り付けられた標的核酸を含む二本鎖生成物を生成する。あるいは、当該標的を増幅するプライマーは、それ自身がバーコード化されることができるため、標的へのアニーリング及び伸長の際に、生成されたアンプリコンは、アンプリコンに組み込まれたバーコード配列を有する。これは、PCRによる特異的増幅、または、例えばMDAによる非特異的増幅を含む多数の増幅法により応用することができる。バーコードを核酸に取り付けるために使用可能な代替の酵素反応、平滑末端または付着末端ライゲーションを含むライゲーションである。本アプローチにおいて、DNAバーコードは、核酸標的及びリガーゼ酵素でインキュベートされ、バーコードの、標的へのライゲーションがもたらされる。核酸の末端は、分子末端に取り付けられるバーコードの数よりも大きな制御が可能なリガーゼまたは断片と共に導入されるアダプターを使用することを含む多数の技術により、必要に応じてライゲーションのために修飾することができる。
本明細書で使用する場合、「同一な」という用語、及びその類似表現は、2つ以上の配列に関して使用する時には、その2つ以上の配列(例えば、ヌクレオチド配列またはポリペプチド配列)が同じである程度を指す。2つ以上の配列に関しては、配列またはその部分配列の同一性パーセントまたは相同性パーセントは、配列の所与の一または領域において同じであるすべてのモノマー単位(例えば、ヌクレオチドまたはアミノ酸)のパーセンテージを示す(すなわち、約70%の同一性、好ましくは、75%、80%、85%、90%、95%、97%、98%または99%の同一性)。その同一性パーセントは、BLASTまたはBLAST2.0という配列比較アルゴリズムを下記のデフォルトパラメーターで用いるか、またはマニュアルアラインメント及び目視確認によって測定した場合において、比較ウィンドウまたは指定領域にわたって最大限一致するように比較及びアラインメントを行った時の所定の領域に対するものであることができる。配列は、アミノ酸レベルまたはヌクレオチドレベルの同一性が少なくとも85%である時に、「実質的に同一」であるとする。好ましくは、その同一性は、少なくとも約25残基長、約50残基長もしくは約100残基長である領域、または少なくとも1つの比較配列の全長に対して存在する。配列同一性パーセント及び配列類似性パーセントを求めるための典型的なアルゴリズムは、BLAST及びBLAST2.0のアルゴリズムであり、これらは、Altschul et al,Nuc.Acids Res.25:3389-3402(1977)に記載されている。他の方法としては、Smith & Waterman,Adv.Appl.Math.2:482(1981)及びNeedleman & Wunsch,J.Mol.Biol.48:443(1970)などのアルゴリズムが挙げられる。2つの核酸配列が実質的に同一であることの別の指標は、その2つの分子またはそれらの相補体が、ストリンジェントなハイブリダイゼーション条件下で、互いにハイブリダイズすることである。
「核酸」、「ポリヌクレオチド」及び「オリゴヌクレオチド」という用語は、ヌクレオチドのバイオポリマーを指し、文脈上別段に示されている場合を除き、改変ヌクレオチド及び非改変ヌクレオチド、DNA及びRNA、ならびに改変核酸主鎖を含む。例えば、ある特定の実施形態では、その核酸は、ペプチド核酸(PNA)またはロックト核酸(LNA)である。典型的には、本明細書に記載されているような方法は、DNAを増幅用の核酸鋳型として用いて行う。しかしながら、ヌクレオチドが、天然のDNAまたはRNAに由来する人工の誘導体または改変核酸に置き換えられている核酸も、相補鎖合成用の鋳型として機能する限りは、本発明の核酸に含めてよい。本発明の核酸は概して、生体試料に含まれている。その生体試料には、動物、植物または微生物の組織、細胞、培養液、及び排泄物または抽出物が含まれる。ある特定の態様では、その生体試料には、ウイルスまたはマイコプラズマのような細胞内寄生体のゲノムDNAまたはRNAが含まれる。本発明の核酸は、上記生体試料に含まれる核酸に由来してよい。例えば、好ましくは、記載されている方法では、ゲノムDNA、mRNAから合成したcDNA、または生体試料に由来する核酸に基づいて増幅した核酸を使用する。別段に示されていない限り、オリゴヌクレオチド配列が示されている場合、そのヌクレオチドは、左から右に向かって、5’から3’の順であり、「A」はデオキシアデノシンを示し、「C」はデオキシシチジンを示し、「G」はデオキシグアノシンを示し、「T」はデオキシチミジンを示し、「U」はウリジンを示すと理解されたい。オリゴヌクレオチドは、「5’末端」及び「3’末端」を有するという。典型的には、モノヌクレオチドが反応して、ある1つのヌクレオチドの5’リン酸基または同等の基が、任意にホスホジエステル結合またはその他の好適な結合を介して、その隣接ヌクレオチドの3’ヒドロキシル基または同等の基に結合することによって、オリゴヌクレオチドを形成するからである。
鋳型核酸は、核酸増幅法において相補鎖を合成する際の鋳型として機能する核酸である。その鋳型と相補的なヌクレオチド配列を有する相補鎖は、その鋳型に対応する鎖としての意味を持つが、これらの2つの関係は、相対的なものに過ぎない。すなわち、本明細書に記載されている方法によれば、相補鎖として合成された鎖は、再び鋳型として機能できる。換言すると、相補鎖は、鋳型となることができる。ある特定の実施形態では、鋳型は、生体試料、例えば、植物、動物、ウイルス、微生物、細菌、真菌などに由来する。ある特定の実施形態では、その動物は、哺乳動物、例えばヒト患者である。鋳型核酸は典型的には、標的核酸を1つ以上含む。例示的な実施形態における標的核酸は、試料中に存在する疑いがあるか、または試料中に存在すると予測されるいずれの核酸配列も含め、本開示に従って増幅または合成できる一本鎖または二本鎖のいずれの核酸配列も含んでよい。
本発明における実施形態で用いるプライマー及びオリゴヌクレオチドは、ヌクレオチドを含む。ヌクレオチドは、ポリメラーゼに選択的に結合できるか、またはポリメラーゼによって重合化できるいずれの化合物も含み、いずれの天然ヌクレオチドまたはそのアナログも含まれるが、これらに限らない。必然ではないが、典型的には、ヌクレオチドがポリメラーゼに選択的に結合した後には、そのヌクレオチドは、ポリメラーゼによって重合化して核酸鎖となるが、時折、ヌクレオチドが、核酸鎖に組み込まれずに、ポリメラーゼから解離することがあり、この事象は、本明細書では、「非生成」事象という。このようなヌクレオチドには、その構造にかかわらず、ポリメラーゼに選択的に結合できるか、またはポリメラーゼによって重合化できる天然のヌクレオチドのみならず、いずれのアナログも含まれる。天然のヌクレオチドは典型的には、塩基部分、糖部分及びリン酸部分を含むが、本開示のヌクレオチドは、このような部分のいずれか1つ、一部またはすべてが欠損している化合物を含むことができる。例えば、そのヌクレオチドは任意に、リン原子を3個、4個、5個、6個、7個、8個、9個、10個またはそれを上回る数含むリン原子鎖を含むことができる。いくつかの実施形態では、そのリン鎖は、糖環のいずれかの炭素(5’炭素など)に結合できる。そのリン鎖は、介在するOまたはSとともに、糖に連結できる。一実施形態では、その鎖のリン原子の1つ以上は、P及びOを有するリン酸基の一部であることができる。別の実施形態では、その鎖のリン原子は、介在するO、NH、S、メチレン、置換メチレン、エチレン、置換エチレン、CNH2、C(O)、C(CH2)、CH2CH2またはC(OH)CH2R(式中、Rは、4-ピリジンまたは1-イミダゾールであることができる)とともに連結できる。一実施形態では、その鎖のリン原子は、O、BH3またはSを有する側鎖基を有することができる。そのリン鎖では、O以外の側鎖基を持つリン原子は、置換リン酸基であることができる。そのリン鎖では、O以外の介在する原子を持つリン原子は、置換リン酸基であることができる。ヌクレオチドアナログの例のいくつかは、Xuによる米国特許第7,405,281号に記載されている。
いくつかの実施形態では、ヌクレオチドは標識を含み、そのヌクレオチドは、本明細書では、「標識ヌクレオチド」といい、標識ヌクレオチドの標識は、本明細書では、「ヌクレオチド標識」という。いくつかの実施形態では、その標識は、末端リン酸基、すなわち、糖から最も遠いリン酸基に結合した蛍光部分(例えば色素)、発光部分などの形態であることができる。本開示の方法及び組成物で使用できるヌクレオチドの例のいくつかとしては、リボヌクレオチド、デオキシリボヌクレオチド、改変リボヌクレオチド、改変デオキシリボヌクレオチド、リボヌクレオチドポリホスフェート、デオキシリボヌクレオチドポリホスフェート、改変リボヌクレオチドポリホスフェート、改変デオキシリボヌクレオチドポリホスフェート、ペプチドヌクレオチド、改変ペプチドヌクレオチド、メタロヌクレオシド、ホスホネートヌクレオシド、及び改変リン酸-糖という主鎖のヌクレオチド、上記化合物のアナログ、誘導体またはバリアントなどが挙げられるが、これらに限らない。いくつかの実施形態では、そのヌクレオチドは、そのヌクレオチドのαリン酸と糖、そのヌクレオチドのαリン酸とβリン酸、そのヌクレオチドのβリン酸とγリン酸、そのヌクレオチドのいずれかの他の2つのリン酸、またはこれらをいずれかに組み合わせたものを架橋する酸素部分の代わりに、例えばチオ部分またはボラノ部分のような非酸素部分を含むことができる。
「ヌクレオチド5’-三リン酸」とは、5’位に三リン酸エステル基を有するヌクレオチドを指し、「NTP」、または特にリボース糖の構造的特徴を示す目的で、「dNTP」及び「ddNTP」と称する場合がある。三リン酸エステル基は、様々な酸素に対する硫黄置換基を含むことができる(例えばα-チオ-ヌクレオチド5’-三リン酸)。核酸化学の論評については、Shabarova,Z.and Bogdanov,A.Advanced Organic Chemistry of Nucleic Acids,VCH,New York,1994を参照されたい。
概要
複数の細胞のシングルセル分析を行い、個別細胞の細胞遺伝子型及び表現型を測定するための実施形態を、本明細書で記載する。一般に、シングルセル分析は、標的化DNA-seqを行い、細胞遺伝子型(例えば、CNV及び/またはSNVなどの細胞変異)を測定するために使用したゲノムDNAに由来するシーケンスリードを生成することを伴う。シングルセル分析は、抗体に結合したオリゴヌクレオチドの配列決定を行うことをさらに伴い、抗体は、細胞により発現した特異的検体に対する結合親和性を示す。したがって、抗体コンジュゲートオリゴヌクレオチドに由来するシーケンスリードを使用して、細胞表現型(例えば、細胞の1つ以上の検体の発現または存在)を測定する。集団(例えば、不均質ながん細胞の集団)における細胞にまたがる、細胞遺伝子型と表現型の組み合わせは、遺伝子型と表現型の組み合わせにより識別された細胞の亜集団を識別するのに有用である。細胞の亜集団は、以前は未知であった亜集団、または、細胞遺伝子型または表現型のみのいずれかを用いると検出される可能性が低い亜集団を表し得る。
複数の細胞のシングルセル分析を行い、個別細胞の細胞遺伝子型及び表現型を測定するための実施形態を、本明細書で記載する。一般に、シングルセル分析は、標的化DNA-seqを行い、細胞遺伝子型(例えば、CNV及び/またはSNVなどの細胞変異)を測定するために使用したゲノムDNAに由来するシーケンスリードを生成することを伴う。シングルセル分析は、抗体に結合したオリゴヌクレオチドの配列決定を行うことをさらに伴い、抗体は、細胞により発現した特異的検体に対する結合親和性を示す。したがって、抗体コンジュゲートオリゴヌクレオチドに由来するシーケンスリードを使用して、細胞表現型(例えば、細胞の1つ以上の検体の発現または存在)を測定する。集団(例えば、不均質ながん細胞の集団)における細胞にまたがる、細胞遺伝子型と表現型の組み合わせは、遺伝子型と表現型の組み合わせにより識別された細胞の亜集団を識別するのに有用である。細胞の亜集団は、以前は未知であった亜集団、または、細胞遺伝子型または表現型のみのいずれかを用いると検出される可能性が低い亜集団を表し得る。
図1Aを参照すると、当該図面は、一実施形態に従いシングルセル分析を行うためのシングルセルワークフロー装置106及び演算装置108を含む、全体のシステム環境100を表す。細胞102の集団が得られる。様々な実施形態では、細胞102は、対象または患者から入手した試験試料から単離することができる。様々な実施形態では、細胞102は、健常な対象から採取した健常な細胞である。様々な実施形態では、細胞102は、対象から採取した罹患細胞を含む。一実施形態では、細胞102は、以前にがんと診断された対象から採取したがん細胞を含む。例えば、がん細胞は、がんと診断された対象の血流にて入手可能な腫瘍細胞であることができる。別の例として、がん細胞は、腫瘍生検により得られる細胞であることができる。したがって、腫瘍細胞をシングルセル分析することにより、対象のがんの細胞を特性決定することが可能となる。様々な実施形態では、試験試料は、対象の処置の後に(例えば、がん治療などの治療の跡に)、対象から入手される。したがって、細胞をシングルセル分析することにより、治療法に対する対象の応答を表す細胞を特性決定することが可能となる。
工程104において、細胞102は抗体でインキュベートされる。様々な実施形態では、抗体は、標的検体に対する結合親和性を示す。例えば、抗体は、標的タンパク質の標的エピトープに対する結合親和性を示すことができる。
様々な実施形態では、抗体でインキュベートした細胞の数は、102細胞、103細胞、104細胞、105細胞、106細胞、または107細胞であることができる。様々な実施形態では、103細胞~107細胞が、抗体でインキュベートされる。様々な実施形態では、104細胞~106細胞が、抗体でインキュベートされる。様々な実施形態では、様々な濃度の抗体が細胞でインキュベートされる。様々な実施形態では、タンパク質パネル内の抗体に関して、0.1nM、0.5nM、1.0nM、2.0nM、3.0nM、4.0nM、5.0nM、6.0nM、7.0nM、8.0nM、9.0nM、10.0nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、または100nMの濃度の抗体 が、細胞でインキュベートされる。
様々な実施形態では、細胞102は、複数の異なる抗体でインキュベートされる。一実施形態では、複数の異なる抗体の中で、各抗体は、パネルの検体に対して結合親和性を示す。例えば、各抗体は、パネルのタンパク質に対して結合親和性を示す。タンパク質パネルに含まれるタンパク質の例を、本明細書で記載する。抗体による細胞のインキュベーションにより、標的エピトープに対する抗体の結合がもたらされる。様々な実施形態では、各抗体に対して、0.1nM、0.5nM、1.0nM、2.0nM、3.0nM、4.0nM、5.0nM、6.0nM、7.0nM、8.0nM、9.0nM、10.0nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、または100nMの濃度の抗体が細胞でインキュベートされる。
インキュベーション後、細胞102を(例えば洗浄緩衝液で)洗浄し、未結合の過剰な抗体を除去する。
様々な実施形態では、抗体を、抗体オリゴヌクレオチドとも呼ばれる1つ以上のオリゴヌクレオチドで標識する。このようなオリゴヌクレオチドは、マイクロフルイディクスバーコード化及びDNA配列決定で読み出すことが可能であり、これにより、対象となる細胞検体の検出が可能となる。抗体がその標的に結合する場合、抗体オリゴヌクレオチドはその標的と共に運搬され、これにより、標的検体の存在が、オリゴヌクレオチドタグの存在に基づき推定されることが可能となる。いくつかの実施態様では、抗体オリゴヌクレオチドを分析することにより、細胞に存在する異なるエピトープが推定される。
シングルセルワークフロー装置106とは、個別細胞を処理して、配列決定のための核酸を生成する装置を意味する。様々な実施形態では、シングルセルワークフロー装置106は、個別細胞をエマルションに封入し、細胞をエマルション内で溶解し、第2のエマルションで細胞溶解物の細胞バーコード化を行い、第2のエマルションで核酸増幅反応を行うことができる。したがって、増幅核酸を収集し配列決定することができる。様々な実施形態では、シングルセルワークフロー装置106は、核酸を配列決定のシーケンサーをさらに含む。
演算装置108は、シングルセルワークフロー装置106から配列決定したリードを受診するように構成される。様々な実施形態では、演算装置108はシングルセルワークフロー装置106と通信可能に連結されるが故に、シングルセルワークフロー装置106からシーケンスリードを直接受信する。演算装置108は、シーケンスリードを分析して、細胞分析110を生成する。一実施形態では、演算装置108はシーケンスリードを分析し、細胞遺伝子型及び表現型を測定する。演算装置108は、測定した細胞遺伝子型及び表現型を用いて、新規の細胞亜集団を発見、及び/または個別細胞を細胞亜集団に分類する。したがって、このような実施形態では、細胞分析110とは、細胞亜集団の識別、または、細胞の細胞亜集団への分類を意味することができる。
ここで、配列決定のために単一細胞を処理し、増幅した核酸分子を生成する実施形態を示す、図1Bを参照する。具体的には、図1Bは、標的核酸分子の細胞封入160、検体放出165、細胞バーコード化、及び標的増幅175の工程を含むワークフロープロセスを示す。
一般に、細胞封入工程160は、シングルセル102を試薬120と共に、エマルションに封入することを伴う。様々な実施形態では、エマルションは、細胞102及び試薬120を含有する水性流体を、キャリア流体(例えば、油115)に分画することにより、油中水性流体型エマルションを得ることにより形成される。エマルションは、封入細胞125、及び試薬120を含む。封入細胞は、工程165において、検体放出を受ける。一般に、試薬は細胞の溶解を引き起こすことにより、エマルション内で細胞溶解物130を生成する。特定の実施形態では、試薬120は、細胞を溶解して細胞溶解物130を生成するための、プロテイナーゼKなどのプロテアーゼを含む。細胞溶解物130は、1つ以上の異なる種類の検体(例えば、RNA転写産物、DNA、タンパク質、脂質、または炭化水素)を含むことができる、細胞の内容物を含む。様々な実施形態では、細胞溶解物130の異なる検体は、エマルション内で試薬120と相互作用することができる。例えば、リバースプライマーなどの、試薬120中のプライマーは、検体をプライミングすることができる。
細胞バーコード化工程170は、細胞溶解物130を第2のエマルションに、バーコード145及び/または反応混合物140と共に封入することを伴う。様々な実施形態では、第2のエマルションは、細胞溶解物130を含有する水性流体を、不混和性油135に分画することにより形成される。図1Bに示すように、反応混合物140及びバーコード145を、水性流体の個別の流れを通して導入することにより、反応混合物140及びバーコードを、細胞溶解物130と共に、第2のエマルションに分画することができる。
一般に、バーコード145は、分析される標的検体(例えば、標的核酸)を標識することができ、これにより、標的核酸に由来するシーケンスリードの起源の、その後の同定が可能となる。様々な実施形態では、複数のバーコード145は、細胞溶解物の複数の標的核酸を標識することにより、大量のシーケンスリードの起源の、その後の同定を可能にすることができる。
一般に、反応混合物140は、核酸増幅反応などの反応の実施を可能にする。標的増幅工程175は、標的核酸を増幅することを伴う。例えば、細胞溶解物の標的核酸は、第2のエマルション中で反応混合物140を用いる増幅を受けることにより、標的核酸に由来するアンプリコンを生成する。図1Bは、細胞バーコード化170、及び標的増幅175を2つの個別の工程で示すものの、様々な実施形態では、標的核酸は、核酸増幅工程を通して、バーコード145で標識される。
本明細書で参照するように、図1Bに示すワークフロープロセスは、細胞からの検体放出165が、細胞バーコード化170及び標的増幅175の工程とは別に生じる、2段階ワークフロープロセスである。例えば、細胞からの検体放出165は、第1のエマルション内で生じ、続いて、細胞バーコード化170及び標的増幅175が第2のエマルション内で生じる。様々な実施形態では、代替のワークフロープロセス(例えば、図1Bに示す2段階ワークフロープロセス以外のワークフロープロセス)を用いることができる。例えば、細胞102、試薬120、反応混合物140、及びバーコード145を、エマルションに封入することができる。したがって、検体放出165はエマルション内で生じることができ、続いて、細胞バーコード化170及び標的増幅175が同じエマルションで生じることができる。
図2は、個別細胞に由来するシーケンスリードを用いて細胞遺伝子型及び表現型を測定し、細胞遺伝子型及び表現型を用いて細胞を分析するフロープロセスである。具体的には、図2は、工程205において、増幅核酸をプールする工程と、増幅核酸を配列決定する工程と、シーケンスリードを用いて、細胞に関する細胞軌道を測定する工程と、を示す。一般に、図2に示す流れ作業は、図1Bに示すワークフロープロセスの続きである。
例えば、図1Bの工程175における標的増幅の後で、増幅核酸250A、250B、及び250Cを、図2に示す工程205でプールする。例えば、増幅核酸のエマルションをプールして収集し、エマルションの不混和性油を取り除く。したがって、複数の細胞由来の増幅核酸は、合わせてプールすることができる。図2は、3つの増幅核酸250A、250B、及び250Cを示すが、様々な実施形態では、プールした核酸は、複数の細胞の検体に由来する、数百、数千、または数百万個の核酸を含むことができる。
様々な実施形態では、各増幅核酸250は、少なくとも、標的核酸240及びバーコード230の配列を含む。様々な実施形態では、増幅核酸250は、ユニバーサルプライマー配列(例えば、オリゴ-dT配列)、ランダムプライマー配列、遺伝子特異的プライマーフォワード配列、遺伝子特異的プライマーリバース配列、または、1つ以上の定常領域(例えばPCRハンドル)のいずれかなどの、さらなる配列を含むことができる。
様々な実施形態では、増幅核酸250A、250B、及び250Cは、同一のシングルセルに由来し、故に、バーコード230A、230B、及び230Cは同一である。そのために、バーコード230を配列決定することにより、増幅核酸250が同一の細胞に由来するという測定が可能となる。様々な実施形態では、増幅核酸250A、250B、及び250Cはプールされ、異なる細胞に由来する。したがって、バーコード230A、230B、及び230Cは互いに異なり、バーコード230を配列決定することにより、増幅核酸250が異なる細胞に由来するという測定が可能となる。
工程210において、プールした増幅核酸250は配列決定を受け、シーケンスリードを生成する。各増幅核酸に関して、シーケンスリードは、バーコード及び標的核酸の配列を含む。増幅核酸に含まれるバーコード配列に従い、個別の細胞に由来するシーケンスリードをクラスター化する。様々な実施形態では、各シングルセルに対する1つ以上のシーケンスリードを(例えば、参照ゲノムに対して)アラインする。シーケンスリードを参照ゲノムに対してアラインすることにより、ゲノム内のどこで、シーケンスリードが由来するかを測定することができる。例えば、DNAから生成した複数のシーケンスリードは、ゲノムの位置にアラインされた場合に、ゲノムの位置に存在する、または当該位置に関与する1つ以上の変異を明らかにすることができる。様々な実施形態では、各シングルセルに対する1つ以上のシーケンスリードは、アラインメントを受けない。例えば、抗体オリゴヌクレオチドが細胞ゲノムのゲノムDNAに由来しないことを考慮すると、抗体オリゴヌクレオチドに由来するシーケンスリードは、必ずしも参照ゲノムにアラインされる必要はない。
工程220において、シングルセルに対してアラインしたシーケンスリードを分析し、シングルセルの細胞遺伝子型及び細胞表現型を測定する。例えば、DNA転写物から生成したシーケンスリードを分析し、1つ以上のCNV及びSNVなどの、細胞の1つ以上の変異を測定する。抗体コンジュゲートオリゴヌクレオチドから生成したシーケンスリードを使用して細胞表現型を測定し、当該測定することは、1つ以上のタンパク質の有無を含むことができる。様々な実施形態では、抗体コンジュゲートオリゴヌクレオチドから生成したシーケンスリードの量は、1つ以上のタンパク質の発現レベルに相関する。まとめると、細胞遺伝子型(例えば、1つ以上のSNV及びCNV)、ならびに細胞表現型(例えば、タンパク質の有無)により、シングルセルのゲノミクス及びプロテオミクスの同時の視点がもたらされる。
工程225において、細胞の細胞遺伝子型及び細胞表現型を分析する。一実施形態では、細胞の細胞遺伝子型及び細胞表現型を使用して、細胞遺伝子型及び表現型により特徴付けられる亜集団に細胞を分類する。例えば、既知の細胞亜集団のライブラリーを、遺伝子型と表現型の組み合わせに基づき特徴付けることができる。したがって、細胞の遺伝子型及び表現型を使用して、同一または類似の遺伝子型及び表現型を共有する1つ以上の細胞集団に、細胞を分類することができる。
一実施形態では、細胞の細胞遺伝子型及び細胞表現型を使用して、細胞亜集団を同定する。例えば、細胞は、細胞の母集団に由来することができる。このような実施形態では、細胞の細胞遺伝子型及び細胞表現型を、細胞の母集団に由来する他の細胞の細胞遺伝子型及び細胞表現型と共に分析する。様々な実施形態では、細胞の母集団の細胞遺伝子型及び細胞表現型を分析することは、類似の遺伝子型または表現型を有する細胞がクラスター内に局在化するように、次元削減分析及びクラスター化分析の一方または両方を行うことを伴う。様々な実施形態では、細胞の不均質な亜集団を、個別のクラスターから同定することができる。様々な実施形態では、細胞の不均質な亜集団を、クラスター自身の中からでさえも同定することができる。
遺伝子型と表現型の異なる組み合わせにより、細胞の亜集団を同定することは、細胞集団内で細胞の亜集団を発見するのに有用であることができる。一例として、細胞の亜集団とは、がん細胞集団を指すことができる。したがって、細胞亜集団の存在を検出すること、及び/または同定することは、がんを患う対象を診断するのに有用である。別の例として、細胞の母集団は、以前は均質であると考えられたがん細胞の母集団であることができる。したがって、がん細胞において、細胞の細胞遺伝子型及び表現型を分析することは、がん細胞の不均質性を理解するのに役立ち、これを使用して、細胞の様々な亜集団を標的にするための治療の開発または選択を誘うことができる。
シングルセル分析を行うための方法
封入、検体放出、バーコード化、及び増幅
本明細書に記載する実施形態は、(例えば、図1の工程160において)1つ以上の細胞を封入し、1つ以上の細胞にてシングルセル分析を行うことを伴う。様々な実施形態では、細胞を試薬と共に封入することは、細胞及び試薬を含む水相を、不混和性油と組み合わせることにより達成される。一実施形態では、細胞及び試薬を含む水相は、流れている不混和性油と共に流れて油中水型エマルションが形成され、ここで、少なくとも1つのエマルションは、シングルセル及び試薬を含む。様々な実施形態では、不混和性油相は、フルオラス油、フルオラス非イオン性界面活性剤、またはその両方を含む。様々な実施形態では、エマルションは、約0.001~1000ピコメートルまたはそれ以上の内部体積を有することができ、直径は0.1~1000μmの範囲であることができる。
封入、検体放出、バーコード化、及び増幅
本明細書に記載する実施形態は、(例えば、図1の工程160において)1つ以上の細胞を封入し、1つ以上の細胞にてシングルセル分析を行うことを伴う。様々な実施形態では、細胞を試薬と共に封入することは、細胞及び試薬を含む水相を、不混和性油と組み合わせることにより達成される。一実施形態では、細胞及び試薬を含む水相は、流れている不混和性油と共に流れて油中水型エマルションが形成され、ここで、少なくとも1つのエマルションは、シングルセル及び試薬を含む。様々な実施形態では、不混和性油相は、フルオラス油、フルオラス非イオン性界面活性剤、またはその両方を含む。様々な実施形態では、エマルションは、約0.001~1000ピコメートルまたはそれ以上の内部体積を有することができ、直径は0.1~1000μmの範囲であることができる。
様々な実施形態では、細胞及び試薬を含む水相は必ずしも、不混和性油相と同時に流れる必要はない。例えば、水相は流れて、不混和性油相の静止リザーバと接触することができ、これにより、静止した油リザーバ内で、油中水型エマルションの発生が可能となる。
様々な実施形態では、水相と不混和性油相とを組み合わせることは、マイクロフルイディクスデバイス内で行うことができる。例えば、水相は、マイクロ流体デバイスのマイクロチャネルを通って流れ、不混和性油相と接触することができ、これは同時に、個別のマイクロチャネルを通って流れているか、または、マイクロフルイディクスデバイスの静止リザーバ内で保持される。エマルションに封入された細胞及び試薬は次に、マイクロフルイディクスデバイスを通って流れ、細胞溶解を受けることができる。
試薬及び細胞をエマルションに添加する、さらなる例示的実施形態は、細胞及び試薬を個別に含有するエマルションを合わせること、または、試薬をエマルション内にピコインジェクションすることを含むことができる。例示的実施形態のさらなる説明は、米国出願第14/420,646号に記載されており、その全体が参照により本明細書に組み込まれている。
エマルションに封入された細胞を溶解し、細胞溶解物を生成する。様々な実施形態では、試薬中に存在する剤を溶解させることにより、細胞を溶解する。例えば、試薬は、NP-40、及び/またはプロテアーゼなどの洗剤を含むことができる。洗剤及び/またはプロテアーゼは、細胞膜を溶解することができる。いくつかの実施形態では、細胞溶解はまた、または代わりに、試薬中で剤を溶解させることを伴わない技術に依存する。例えば、溶解は、様々なゲノム的特徴を用いて、細胞の穿孔、剪断、擦過などを達成し得る機械的技術により実現することができる。音響技術などの他の種類の機械的破壊もまた、使用することができる。さらに、熱エネルギーもまた使用して、細胞を溶解することができる。細胞溶解を達成する任意の便利な手段を、本明細書に記載の方法において用いることができる。
ここで、第1の実施形態に従った、エマルション(例えばエマルション300)に検体を放出し、この中で検体を処理する工程を示す、図3A~3Cを参照する。図3Aは、(図1Bに示す)細胞102、及び試薬120の両方を含むエマルション300Aを示す。具体的には、図3Aにおいて、エマルション300Aは、細胞(DNA302をさらに含む)、抗体オリゴヌクレオチド304(図1Aの工程104において細胞タンパク質を結合するために使用した抗体に由来する)、加えて、試薬から添加されたプロテアーゼ310を含有する。エマルション300A内では、細胞膜の点線により示されるように、細胞は溶解される。一実施形態では、細胞は、NP40(例えば、0.01%のNP40)などの試薬に含まれる洗剤により溶解される。
図3Bは、プロテアーゼ302としてのエマルション300Bがクロマチン結合DNA302を分解することにより、ゲノムDNAを放出することを示す。様々な実施形態では、エマルション300Bは、プロテアーゼ310がクロマチンを分解することを可能にする高温に曝露される。様々な実施形態では、エマルション300Bは、40℃~60℃の温度に曝露される。様々な実施形態では、エマルション300Bは、45℃~55℃の温度に曝露される。様々な実施形態では、エマルション300Bは、48℃~52℃の温度に曝露される。様々な実施形態では、エマルション300Bは、50℃の温度に曝露される。
図3Cは、エマルション300C内にある、遊離ゲノムDNA鎖306及び抗体オリゴヌクレオチド304を示す。プロテアーゼ310は失活される。様々な実施形態では、プロテアーゼ310は、エマルション300Cを高温に曝露することで失活される。様々な実施形態では、エマルション300Cは、70℃~90℃の温度に曝露される。様々な実施形態では、エマルション300Bは、75℃~85℃の温度に曝露される。様々な実施形態では、エマルション300Bは、78℃~82℃の温度に曝露される。様々な実施形態では、エマルション300Bは、80℃の温度に曝露される。
様々な実施形態では、抗体オリゴヌクレオチド304、及び/または遊離ゲノムDNA306は、エマルション300C内でプライミングを受ける。様々な実施形態では、リバースプライマーは、抗体オリゴヌクレオチド304、及び/または遊離ゲノムDNA306の一部とハイブリダイズすることができる。例えば、リバースプライマーは、遊離ゲノムDNA306の一部とハイブリダイズする、遺伝子特異的リバースプライマーである。例示的な遺伝子特異的プライマーを、以下にさらに詳述する。別の例として、リバースプライマーは、抗体オリゴヌクレオチド304の一部とハイブリダイズするPCRハンドルであり、これは、図4Aに関連して以下でさらに詳述される。様々な実施形態では、プロテアーゼ310と共にエマルション300Aに導入される試薬に、リバースプライマーが含まれることを考慮すると、例えばエマルション300Aまたはエマルション300B内で、抗体オリゴヌクレオチド304のプライミングはより早く生じる可能性がある。
様々な実施形態では、エマルション300C中の抗体オリゴヌクレオチド304及び遊離ゲノムDNA306は、図1Bに示す細胞溶解物130などの細胞溶解物を少なくとも部分的に表し、これはその後、バーコード化及び増幅のために、第2のエマルションに封入される。具体的には、図1における細胞バーコード化170の工程は、細胞溶解物130を、反応混合物140及びバーコード145と共に封入することを含む。様々な実施形態では、反応混合物140は、標的核酸上で核酸反応を行うための構成成分(例えば、抗体オリゴヌクレオチド及び遊離ゲノムDNA)を含む。例えば、反応混合物140は、プライマー、核酸増幅を行うための酵素、及び、増幅核酸に組み込むためのdNTPまたはddNTPを含むことができる。
様々な実施形態では、細胞溶解物は、反応混合物及びバーコードを含む水相を、細胞溶解物及び不混和性油相と組み合わせることにより、反応混合物及びバーコードと共に封入される。一実施形態では、反応混合物及びバーコードを含む水相は、流れている細胞溶解物及び流れている不混和性油相と共に流れ、これにより油中水型エマルションが形成され、ここで、少なくとも1つのエマルションは、細胞溶解物、反応混合物、及びバーコードを含む。様々な実施形態では、不混和性油相は、フルオラス油、フルオラス非イオン性界面活性剤、またはその両方を含む。様々な実施形態では、エマルションは、約0.001~1000ピコメートルまたはそれ以上の内部体積を有することができ、直径は0.1~1000μmの範囲であることができる。
様々な実施形態では、水相と不混和性油相とを組み合わせることは、マイクロフルイディクスデバイス内で行うことができる。例えば、水相は、マイクロ流体デバイスのマイクロチャネルを通って流れ、不混和性油相と接触することができ、これは同時に、個別のマイクロチャネルを通って流れているか、または、マイクロフルイディクスデバイスの静止リザーバ内で保持される。エマルションに封入された細胞溶解物、反応混合物、及びバーコードを次に、マイクロフルイディクスデバイスを通して流し、標的核酸の増幅を行うことができる。
反応混合物及びバーコードをエマルションに添加する、さらなる例示的実施形態は、細胞溶解物及び反応混合物及びバーコードを個別に含むエマルションを合わせること、または、反応混合物及び/もしくはバーコードをエマルションにピコインジェクションすることを含むことができる。エマルションを合わせる、または、物質をエマルションにピコインジェクションする例示的実施形態のさらなる説明は、米国出願第14/420,646号に見出され、その全体が参照により本明細書に組み込まれている。
反応混合物及びバーコードがエマルションに添加されると、エマルションは、核酸増幅反応を促進する条件下でインキュベートすることができる。様々な実施形態では、エマルションは、反応混合物及び/もしくはバーコードを添加するのに使用したのと同じマイクロフルイディクスデバイスでインキュベートすることができるか、または、別個の装置でインキュベートすることができる。特定の実施形態では、核酸増幅を促進する条件下でエマルションをインキュベートすることは、細胞を封入し、細胞を溶解するのに使用したのと同じマイクロフルイディクスデバイスで行う。エマルションをインキュベートすることは、様々な形態をとることができる。特定の態様では、反応混合物、バーコード、及び細胞溶解物を含有するエマルションは、核酸増幅に効果的な条件下でエマルションをインキュベートするチャネルを流れることができる。マイクロドロップレットがチャネルを流れることは、PCRに効果的な温度で維持される、様々な温度域にわたって蛇行するチャネルを伴う場合がある。このようなチャネルは例えば、2つ以上の温度域にわたってサイクルことができ、少なくとも1つの域は約65℃にて維持され、少なくとも1つの域は約95℃で維持される。滴がこのような域にまたがり移動するため、温度は、核酸増幅の必要に応じてサイクルする。域の数、及び、各域の対応する温度は、当業者により速やかに決定し、所望の核酸増幅を実現することができる。
様々な実施形態では、核酸増幅の後で、増幅核酸を含有するエマルションを収集する。様々な実施形態では、エマルションは、マイクロフルイディクスデバイスのウェルなどのウェルにて収集される。様々な実施形態では、エマルションは、リザーバ、または、エッペンドルフチューブなどのチューブで収集される。収集されると、異なるエマルションにまたがる増幅核酸がプールされる。一実施形態では、エマルションは、外部刺激により破壊され、増幅核酸をプールする。一実施形態では、エマルションは、水相と不混和性油相との密度差を考慮すると、時間の経過とともに自然に凝集する。したがって、増幅核酸は水相にプールされる。
様々な実施形態では、プールした後、増幅核酸は、配列決定のためにさらなる調製を受けることができる。例えば、シーケンシングアダプターを、プールした核酸に添加することができる。例示的なシーケンシングアダプターは、P5及びP7シーケンシングアダプターである。シーケンシングアダプターにより、核酸のその後の配列決定が可能となる。
抗体コンジュゲートオリゴヌクレオチド及びゲノムDNAの例示的なバーコード化
図4Aは、一実施形態に従った、抗体コンジュゲートオリゴヌクレオチドのプライミング及びバーコード化を示す。具体的には、図4Aは、抗体オリゴヌクレオチド304のプライミングを伴う工程410を示し、さらに、抗体オリゴヌクレオチド304のバーコード化及び増幅を伴う工程420を示す。様々な実施形態では、工程410は、第1のエマルション内で生じ、この間に細胞溶解が生じ、工程420は、第2のエマルション内で生じ、この間に細胞バーコード化及び核酸増幅が生じる。このような実施形態では、プライマー405は試薬中に提供され、ビーズバーコードは反応混合物と共に提供される。いくつかの実施形態では、工程410及び420の両方が、第2のエマルション内で生じる。このような実施形態では、図4Aに示すプライマー405及びビーズバーコードは、反応混合物と共に提供される。
図4Aは、一実施形態に従った、抗体コンジュゲートオリゴヌクレオチドのプライミング及びバーコード化を示す。具体的には、図4Aは、抗体オリゴヌクレオチド304のプライミングを伴う工程410を示し、さらに、抗体オリゴヌクレオチド304のバーコード化及び増幅を伴う工程420を示す。様々な実施形態では、工程410は、第1のエマルション内で生じ、この間に細胞溶解が生じ、工程420は、第2のエマルション内で生じ、この間に細胞バーコード化及び核酸増幅が生じる。このような実施形態では、プライマー405は試薬中に提供され、ビーズバーコードは反応混合物と共に提供される。いくつかの実施形態では、工程410及び420の両方が、第2のエマルション内で生じる。このような実施形態では、図4Aに示すプライマー405及びビーズバーコードは、反応混合物と共に提供される。
抗体オリゴヌクレオチド304は抗体にコンジュゲートされる。様々な実施形態では、抗体オリゴヌクレオチド304は、PCRハンドル、タグ配列(例えば抗体タグ)、及び、オリゴヌクレオチドを抗体に結合させる捕捉配列を含む。様々な実施形態では、抗体オリゴヌクレオチド304は抗体の領域にコンジュゲートし、抗体が標的エピトープを結合する能力が影響を受けなくなる。例えば、抗体オリゴヌクレオチド304は抗体のFc領域に結合することができ、これにより、抗体の可変領域が影響を受けないままとなり、エピトープ結合に利用可能となる。様々な抗体オリゴヌクレオチド304が、固有分子識別子(UMI)を含むことができる。様々な実施形態では、UMIは抗体タグの前または後に挿入することができる。様々な実施形態では、UMIは抗体タグのいずれかの末端に隣接することができる。様々な実施形態では、UMIにより、特定の抗体オリゴヌクレオチド304と抗体の組み合わせの同定が可能となる。
様々な実施形態では、抗体オリゴヌクレオチド304は2つ以上のPCRハンドルを含む。例えば、抗体オリゴヌクレオチド304は2つのPCRハンドルを含むことができ、一方が、抗体オリゴヌクレオチド304のそれぞれの末端に存在する。様々な実施形態では、抗体オリゴヌクレオチド304のPCRハンドルの1つは抗体にコンジュゲートされる。ここで、2つのPCRハンドルとハイブリダイズ可能であるフォワード及びリバースプライマーを提供することができ、これにより、抗体オリゴヌクレオチド304の増幅が可能となる。
一般に、抗体オリゴヌクレオチド304の抗体タグにより、抗体(及び、対応するタンパク質)のその後の同定が可能となる。例えば、抗体タグは、識別子、例えば、抗体が結合するタンパク質の種類を同定するためのバーコードとして機能することができる。様々な実施形態では、同一の標的に結合する抗体はそれぞれ、同一の抗体タグに結合する。例えば、標的タンパク質の同一のエピトープに結合する抗体はそれぞれ、同一の抗体タグに結合し、これにより、標的タンパク質の存在のその後の測定が可能になる。様々な実施形態では、同一の標的タンパク質の異なるエピトープに結合する抗体は、同一の抗体タグに結合可能であり、これにより、標的タンパク質の存在のその後の測定が可能になる。
いくつかの実施形態では、オリゴヌクレオチド配列はそのヌクレオ塩基配列によりコードされ、故に、蛍光を用いる従来のアプローチにより可能なものをはるかに凌駕する、コンビナトリアルタグ空間を付与する。例えば、10塩基という多くはないタグの長さにより、100万個を超える固有配列がもたらされ、これは、ヒトプロテオーム内での各エピトープに対して抗体を標識するのに十分である。実際、本アプローチにより、多重化への制限は、固有タグ配列の利用可能性ではなく、多重化反応において、対象となるエピトープを検出可能な特異的抗体の利用可能性となる。
工程410は、プライマー405による抗体オリゴヌクレオチド304のプライミングを表す。図4に示すように、プライマー405は、PCRハンドル、及び共通配列を含むことができる。ここで、プライマー405のPCRハンドルは、抗体オリゴヌクレオチド304のPCRハンドルに相補的である。したがって、PCRハンドルのハイブリダイゼーションを考慮すると、プライマー405は抗体オリゴヌクレオチド304をプライミングする。様々な実施形態では、伸長は、(点線の矢印で示すように)抗体オリゴヌクレオチド304のPCRハンドルから生じる。様々な実施形態では、伸長はプライマー405のPCRハンドルから生じ、これにより、抗体タグ及び捕捉配列を含む核酸が生成される。
工程420は、抗体オリゴヌクレオチド304のバーコード化を示す。図4に示すように、バーコード(例えば、細胞バーコード)は、ビーズに取り外し可能に取り付けられ、共通配列にさらに結合する。ここで、細胞バーコードに結合した共通配列は、PCRハンドル、抗体タグ、及び捕捉配列に結合した共通配列に相補的である。抗体オリゴヌクレオチドを伸長して、共通配列及び細胞バーコードを含める。
様々な実施形態では、抗体オリゴヌクレオチドを増幅することにより、細胞バーコード、共通配列、PCRハンドル、抗体タグ、及び捕捉配列を含むアンプリコンを生成する。様々な実施形態では、捕捉配列は、ビオチンオリゴヌクレオチド捕捉部位を含有し、これにより、ライブラリー調製前にストレプトアビジンビーズ濃縮が可能となる。様々な実施形態では、バーコード化抗体オリゴヌクレオチドは、増幅ゲノムDNAからのサイズ分離により濃縮することができる。
図4Bは、一実施形態に従った、ゲノムDNA455のプライミング及びバーコード化を示す。具体的には、図4Bは、ゲノムDNA455のプライミングを伴う工程460を示し、ゲノムDNA455のバーコード化及び増幅を伴う工程470をさらに示す。様々な実施形態では、工程460は、第1のエマルション内で生じ、この間に細胞溶解が生じ、工程470は、第2のエマルション内で生じ、この間に細胞バーコード化及び核酸増幅が生じる。このような実施形態では、プライマー465を試薬に添加し、工程470に示すバーコード及びフォワードプライマーを反応混合物と共に添加する。いくつかの実施形態では、工程460及び工程470は共に、単一のエマルション(例えば、第2のエマルション)で生じ、この間に、細胞バーコード化及び核酸増幅が生じる。このような実施形態では、工程460に示すプライマー465、及び、工程470に示すバーコード及びフォワードプライマーを反応混合物と共に添加する。
工程460において、プライマー465(点線により示す)は、ゲノムDNA455の一部とハイブリダイズする。様々な実施形態では、プライマー465は、対象となる遺伝子の配列を標的にする遺伝子特異的プライマーである。したがって、プライマー465は、対象となる遺伝子に対応するゲノムDNA455の配列と共にハイブリダイズする。様々な実施形態では、プライマー465は、PCRハンドルをさらに含むか、またはPCRハンドルに結合している。
工程470において、プライマー475(点線により示す)は、ゲノムDNA455の一部とハイブリダイズする。様々な実施形態では、プライマー475は、PCRハンドルを含むか、またはPCRハンドルに結合している。様々な実施形態では、プライマー475は、プライマー465により標的にされる配列とは異なる、対象となる遺伝子の別の配列を標的にする遺伝子特異的プライマーである。加えて、ビーズに取り外し可能に取り付けられた細胞バーコード(細胞BC)を、フォワードプライマーのPCRハンドルとハイブリダイズするPCRハンドルに結合する。核酸増幅によりアンプリコンが生成し、各アンプリコンは、細胞バーコード、PCRハンドル、フォワードプライマー、対象となる遺伝子配列、プライマー465、及びPCRハンドルを含む。
配列決定、及びリードアラインメント
増幅核酸(例えばアンプリコン)を配列決定し、配列決定ライブラリーを生成するためのシーケンスリードを入手する。シーケンスリードは、合成による配列決定、ライゲーションによる配列決定、パイロシーケンス法、可逆的ターミネーターの化学作用を用いること、ホスホ結合蛍光ヌクレオチドを用いること、またはリアルタイム配列決定、のいずれかを行うプラットホームを含む、市販されている次世代配列決定(NGS)プラットホームを用いて実現することができる。一例として、増幅核酸は、Illumina MiSeqプラットホームで配列決定することができる。
増幅核酸(例えばアンプリコン)を配列決定し、配列決定ライブラリーを生成するためのシーケンスリードを入手する。シーケンスリードは、合成による配列決定、ライゲーションによる配列決定、パイロシーケンス法、可逆的ターミネーターの化学作用を用いること、ホスホ結合蛍光ヌクレオチドを用いること、またはリアルタイム配列決定、のいずれかを行うプラットホームを含む、市販されている次世代配列決定(NGS)プラットホームを用いて実現することができる。一例として、増幅核酸は、Illumina MiSeqプラットホームで配列決定することができる。
パイロシーケンス法の場合、アダプターに対して相補的なオリゴヌクレオチドでコーティングした顆粒を用いて、1つのマトリックス分子を捕捉することにより、NGS断片のライブラリーをクローンin-situ増幅する。同じ種類のマトリックスを含有する各顆粒を、「油中水」型のマイクロバブルに配置し、エマルションPCRと呼ばれる方法を用いて、マトリックスをクローン増幅する。増幅後、エマルションは破壊され、顆粒は、配列決定反応の間にフローセルとして作用する滴定ピコプレートの、別個のウェルにスタックされる。4つのdNTP試薬のそれぞれをフローセルに、順序立てて複数回投与することは、配列決定酵素、及び、ルシフェラーゼなどの発光レポーターの存在下で生じる。好適なdNTPが配列決定プライマーの3’末端に添加される場合において、得られるATPは、ウェル内でのルミネセンスの発光を生み出し、これはCCDカメラを用いて記録される。400塩基以上の長さを達成することが可能であり、配列の106の読取り値を得ることが可能であり、結果として、最大5億個の塩基対(メガバイト)の配列が得られる。パイロシーケンス法のさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第6,210,891号、;同第6,258,568号に記載され、これらそれぞれの全体が参照により本明細書に援用されている。
Solexa/Illuminaプラットホームでは、配列決定データは短い読取り値の形態で作成される。本方法では、NGS断片のライブラリーの断片が、オリゴヌクレオチドアンカー分子でコーティングされたフローセルの表面で捕捉される。アンカー分子はPCRプライマーとして使用されるが、マトリックスの長さ、及び、他の付近のアンカーオリゴヌクレオチドへの近接性が原因で、PCRにより伸長により、隣接するアンカーオリゴヌクレオチドとのハイブリダイゼーション、及び、フローセル表面での架橋構造の形成を伴う、分子の「ヴォールト」の形成がもたらされる。これらのDNAループは変性され、切断される。次いで、直鎖が、可逆的に染色されたターミネーターを用いて配列決定される。配列に含まれるヌクレオチドは、包含後に蛍光を検出することにより測定され、各蛍光剤、及びブロック剤は、次のdNTP添加サイクルの前に取り除かれる。Illuminaプラットホームを用いる配列決定のさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第6,833,246号;同第7,115,400号;同第6,969,488号に見出され、これらそれぞれの全体が参照により本明細書に援用されている。
固体技術を用いる核酸分子の配列決定としては、エマルションPCRを用いる、NGS断片のライブラリーのクローン増幅が挙げられる。その後、マトリックスを含有する顆粒を、ガラスフローセルの誘導体化された表面で固定し、アダプターオリゴヌクレオチドに対して相補的なプライマーでアニールする。しかし、3’伸長のために示したプライマーを用いる代わりに、当該相補的なプライマーを使用して、2つのプローブ特異的塩基、続いて6個の縮退塩基、及び4個の蛍光標識のうちの1つを含有する、試験プローブ用のライゲーションのための5’リン酸基を入手する。固体システムにおいて、試験プローブは、各プローブの3’末端における2つの塩基と、5’末端における4つの蛍光染料のうちの1つとの、16個の可能性のある組み合わせを有する。蛍光染料の色、及び故に、各プローブの同一性は、特定の色空間コードスキームに対応する。プローブのアラインメントの多くのサイクルの後で、プローブのライゲーション、及び蛍光シグナルの検出、変性、続いて、元のプライマーと比較して1塩基移動したプライマーを用いる第2の配列決定サイクル。このようにして、マトリックスの配列を計算により再構築することが可能であり、マトリックス塩基を2回確認することで、正確性の増加に繋がる。固体技術を用いる配列決定のさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第5,912,148号、;同第6,130,073号に見出され、これらそれぞれは、その全体が参照により組み込まれる。
特定の実施形態では、Helicos BioSciences製のHeliScopeを使用する。配列決定は、ポリメラーゼの添加、及び、蛍光標識したdNTP試薬の連続添加により達成される。切り替えにより、dNTPに対応する蛍光シグナルの概観がもたらされ、特定のシグナルが、各dNTP添加サイクルの前に、CCDカメラにより捕捉される。配列の読取り値の長さは、25~50ヌクレオチドで変化し、分析作業サイクル1回当たりで、全収率が10億個のヌクレオチド対を超える。HeliScopeを用いる配列決定を行うためのさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第7,169,560号;同第7,282,337号;同第7,482,120号;同第7,501,245号;同第6,818,395号;同第6,911,345号;同第7,501,245号に見出され、これらそれぞれは、その全体が参照により組み込まれる。
いくつかの実施形態では、Rocheの配列決定システム454を使用する。配列決定454は、2つの工程を伴う。第1の工程では、DNAは約300~800個の塩基対の断片に切断され、これらの断片は平滑末端を有する。オリゴヌクレオチドアダプターは次に、断片の末端にライゲーションされる。アダプターは、断片の増幅及び配列決定のためのプライマーとして機能する。断片は、例えば、5’-ビオチンタグを含有するアダプターを用いて、DNA捕捉ビーズ、例えばストレプトアビジンでコーティングされたビーズに取り付けることができる。顆粒に取り付けられた断片は、油-水エマルションのドロップレット内で、PCRにより増幅される。結果は、各ビーズにおける、クローン増幅したDNA断片の複数のコピーである。第2の段階において、顆粒はウェルで捕捉される(体積は数ピコリットル)。パイロシーケンス法を、各DNA断片で並行して行う。1つ以上のヌクレオチドを添加することにより、光シグナルの生成がもたらされ、これは、配列決定機器のCCDカメラに記録される。シグナル強度は、含まれるヌクレオチドの数に比例する。パイロシーケンス法はピロホスフェート(PPi)を用い、これはヌクレオチドの添加の際に放出される。PPiは、アデノシン5’ホスホ硫酸の存在下で、ATPスルフリラーゼを使用してATPに転換される。ルシフェラーゼはATPを使用して、ルシフェリンをオキシルシフェリンに転換し、この反応の結果、光が生成され、これが検出及び分析される。配列決定454を行うためのさらなる詳細はMargulies et al.(2005) Nature 437: 376-380に見出され、その全体が参照により本明細書に組み込まれている。
Ion Torrent技術は、DNA重合の間に放出される水素イオンの検出に基づく、DNA配列決定法である。マイクロウェルは、配列決定されるNGS断片のライブラリーの断片を含有する。マイクロウェル層の下には、超感度イオンセンサISFETがある。全ての層が、エレクトロニクス産業で使用されるチップ同様に、半導体CMOSチップの中に含まれる。dNTPが生長する相補鎖に組み込まれるとき、水素イオンが放出され、超感度イオンセンサを励起する。ホモポリマーが鋳型の配列に存在する場合、複数のdNTP分子が1サイクルに含められる。これにより、相当量の、放出される水素原子、及び、それに比例した、より大きな電気シグナルがもたらされる。この技術は、修飾ヌクレオチドまたは光学装置を用いない他の配列決定技術とは異なる。Ion Torrent技術についてのさらなる詳細は、Science 327(5970):1190(2010);米国特許出願公開第20090026082号、同第20090127589号、同第20100301398号、同第20100197507号、同第20100188073号、及び同第20100137143号に見出され、これらそれぞれは、その全体が参照により組み込まれる。
様々な実施形態では、NGS法から得られる配列決定リードは、質により分類し、当該技術分野において公知の任意のアルゴリズム、例えばPython script barcodeCleanup.pyを使用するバーコード配列によりグルーピングすることができる。いくつかの実施形態では、その塩基の約20%超が、約99%のベースコールの正確性を示す、Q20の品質スコア(Q-スコア)を有する場合、所与の配列決定リードを廃棄してよい。いくつかの実施形態では、約5%超、約10%、約15%、約20%、約25%、約30%が、それぞれ、約90%、約99%、約99.9%、約99.99%、約99.999%、約99.9999%、またはそれ以上のベースコールの正確性を示す、Q10未満、Q20、Q30、Q40、Q50、Q60、またはそれ以上のQ-スコアを有する場合、所与の配列決定リードを廃棄してよい。
いくつかの実施形態では、50個未満のリードを含有するバーコードと関連する配列決定リードを破棄して、シングルセルを表す全てのバーコード基が、十分な数の高品質のリードを確実に含有することができる。いくつかの実施形態では、30未満、40未満、50未満、60未満、70未満、80未満、90未満、100未満、またはそれ以上を含有するバーコードと関連する全ての配列決定リードを廃棄して、シングルセルを表すバーコード基の質を確保することができる。
様々な実施形態では、共通のバーコード配列を有するシーケンスリード(例えば、同じ細胞に由来するシーケンスリードを意味する)を、当該技術分野において既知の方法を使用して参照ゲノムとアラインし、アラインメント位置情報を測定することができる。例えば、ゲノムDNAに由来するシーケンスリードを、一定範囲の参照ゲノムの位置にアラインすることができる。様々な実施形態では、ゲノムDNAに由来するシーケンスリードを、参照ゲノムの遺伝子に対応する一定範囲の位置にアラインすることができる。アラインメント位置情報は、所与のシーケンスリードの開始ヌクレオチド塩基及び末端ヌクレオチド塩基に対応する、参照ゲノム内の領域の開始位置及び終了位置を示し得る。参照ゲノム内の領域は、標的遺伝子、または遺伝子のセグメントと関連する場合がある。シーケンスリードを参照配列にアラインするためのさらなる詳細は、米国出願第16/279,315号に記載されており、その全体が参照により本明細書に組み込まれている。様々な実施形態では、SAM(配列アラインメントマップ)フォーマット、またはBAM(2元アラインメントマップ)フォーマットを有する出力ファイルを、例えば、細胞軌道を測定するための後の分析のために生成し、出力することができる。
細胞遺伝子型及び表現型
ゲノムDNA及び抗体オリゴヌクレオチドに由来する核酸のシーケンスリードを分析し、細胞表現型及び細胞遺伝子型を測定する。
ゲノムDNA及び抗体オリゴヌクレオチドに由来する核酸のシーケンスリードを分析し、細胞表現型及び細胞遺伝子型を測定する。
様々な実施形態では、細胞遺伝子型を測定することは、細胞のゲノム内で1つ以上の変異を測定することを意味する。特定の実施形態では、Tapestri Insightsソフトウェアを実装して、細胞のゲノム内で1つ以上の変異を同定する。一実施形態では、1つ以上の変異は、一塩基変化(例えばSNV)、またはヌクレオチド変化の短い配列(例えば、短いインデル)を含む。ここで、細胞のゲノムDNAに由来する、アラインされたシーケンスリードを参照ゲノムに対して分析し、参照ゲノムに存在するヌクレオチド塩基に対応する細胞変異に存在する、可能性のあるヌクレオチド塩基間の差を測定する。様々な実施形態では、SNV及び/または短いインデルを同定することは、BWA、NovoAlign、Torrent Mapping Alignment Program (TMAP)、VarScan2、qSNP、Shimmer、RADIA、SOAPsnv、VarDict、SNVMix2、SPLINTER、SNVer、OutLyzer、Pisces、ISOWN、SomVarIUS、及びSiNVICTを含むがこれらに限定されない、任意の一般に入手可能なSNVコーラーアルゴリズムを実装することにより実現可能である。
一実施形態では、1つ以上の変異は、CNV及び/または、長い配列(例えば、長いインデル)を包含する変異などの構造バリアントを含む。ここで、スプリットリード及びデノボアセンブリ法を使用して、CNV、及び/または長いインデルを同定することができる。様々な実施形態では、CNVコーラーワークフローは、以下の工程の1つ以上:結合、GC含有量補正、マッピング性補正、アウトライナービンの除去、アウトライナー細胞の除去、セグメンテーション、及び、絶対数のコーリングを伴う。CNVコーラーワークフローのさらなる詳細は、Fan,X.et al,Methods for Copy Number Aberration Detection from Single-cell DNA Sequencing Data,bioRxiv 696179に記載されており、その全体が参照により本明細書に組み込まれている。様々な実施形態では、CNV及び/または長いインデルを同定することは、HMMcopy、SeqSeg、CNV-seq、rSW-seq、FREEC、CNAseg、ReadDepth、CNVator、seqCBS、seqCNA、m-HMM、Ginkgo、nbCNV、AneuFinder、SCNV、及びCNV IFTVを含むがこれらに限定されない、任意の一般に入手可能なCNVコーラーを実装することにより実現可能である。
様々な実施形態では、細胞ゲノムの1つ以上の変異を同定するのにそれらを使用する前に、シーケンスリードを事前処理する。例えば、細胞由来のリードを、細胞の全リード計数により正規化し、アンプリコンリード分布に基づく階層クラスター化によりグルーピングする。細胞からのアンプリコン計数を、対照群(例えば、既知のCNVを含む対照細胞クラスター)の対応するアンプリコンのメジアンで除する。したがって、シーケンスビーズの正規化した割合を使用して、各遺伝子に対するCNVを計算した。
様々な実施形態では、細胞遺伝子型を測定するために使用したシーケンスリードは、細胞ゲノムの様々な領域に由来することができる。細胞ゲノムのこれらの領域は、コード領域及び非コード領域(例えば、イントロン、制御エレメント、転写因子結合部位、染色体転座接合部)の両方を含む。したがって、1つ以上の変異(例えば、SNV、CNV、及びインデル)を、コード領域及び非コード領域の両方で同定することができる。ゲノムDNAから細胞遺伝子型を直接測定する、上で詳述したシングルセルワークフロー分析により、コード領域及び非コード領域の両方に由来する変異の同定が可能となる一方で、さほど直接的でない方法(例えば、RNAを逆転写する方法)は、コード領域からの変異のみを同定する。
細胞表現型を表現するために、抗体コンジュゲートオリゴヌクレオチドに由来するシーケンスリードを分析する。具体的には、抗体オリゴヌクレオチドの抗体タグの配列を配列決定する。(オリゴヌクレオチドがコンジュゲートした)対応する抗体が、以前に細胞の検体に結合していたことを、シーケンスリードの存在は示す。言い換えれば、シーケンスリードが存在することは、細胞が標的検体を発現したことを示す。
様々な実施形態では、細胞表現型を測定することは、標的検体の発現レベルを定量化することを伴う。様々な実施形態では、標的検体の発現レベルを定量化することは、抗体コンジュゲートオリゴヌクレオチドに由来するシーケンスリードを正規化することを伴う。様々な実施形態では、シーケンスリードを正規化することは、有心対数比(CLR)変換を行うことを伴う。様々な実施形態では、シーケンスリードの正規化は、Denoised and Scaled by Background(DSB)を行うことを伴う。DSB正規化のさらなる説明は、Mule,M.et al.“Normalizing and denoising protein expression data from droplet-based single cell profiling.” bioRxiv 2020.02.24.963603に見出され、その全体が参照により本明細書に組み込まれている。
様々な実施形態では、細胞表現型は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、500、1000、5000、または10,000個の標的検体の細胞発現を意味することができる。したがって、シングルセルワークフロー分析により、細胞の複数の標的検体に関する発現プロファイルを得ることができる。
様々な実施形態では、細胞の遺伝子型及び表現型を使用して、細胞を分類することができる。例えば、細胞を、少なくとも細胞の遺伝子型を共有する細胞、少なくとも細胞の表現型を共有する細胞、または、細胞の遺伝子型と表現型の両方を共有する細胞の集団に分類することができる。様々な実施形態では、シングルセルワークフロー分析を、細胞の集団において各細胞で行う。したがって、集団における各細胞の、細胞遺伝子型及び細胞表現型を使用して、各細胞を分類し、集団内の細胞の分布について理解することができる。様々な実施形態では、分類した細胞は、存在する亜集団についての考察をもたらす。様々な実施形態では、細胞を分類することは、細胞の遺伝子型及び表現型を、既知の遺伝子型及び表現型により特徴付けられる、既知の細胞集団のライブラリーと比較することを伴う。したがって、細胞が、既知の細胞集団と、遺伝子型を共有するか、表現型を共有するか、または、遺伝子型と表現型の両方を共有する場合、細胞を既知の細胞集団のカテゴリーに分類することができる。
例を提供するために、細胞集団を、がんを有する疑いのある対象から入手することができ、集団の各細胞を、シングルセルワークフローを用いて分析し、各細胞の遺伝子型及び各電池を測定することができる。既知の参照細胞の遺伝子型及び表現型と比較することにより、細胞を、その遺伝子型及び表現型に従い分類する。したがって、遺伝子型及び表現型を用いて集団の細胞を分類することにより、対象に対してがん治療の選択を案内することができる細胞の分布が明らかとなる。例えば、集団において、細胞の大きな集団が、特定の治療法に対して耐性を有することが知られている既知の細胞集団と共に分類される場合、より有効である可能性が高い代替の治療法を、がんを治療するために選択することができる。
様々な実施形態では、細胞の遺伝子型及び表現型を使用して、細胞の集団内で亜集団を同定する。これは、以前に知られていなかった新しい亜集団を発見するのに有用である。例えば、以前は均質と考えられていた細胞集団を分析して、異なる遺伝子型と表現型の組み合わせを有する細胞の、複数の亜集団を明らかにすることができる。様々な実施形態では、細胞集団は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の、異なる亜集団を明らかにすることができる。
様々な実施形態では、シングルセルワークフロー分析を、細胞の集団において各細胞で行い、集団内の細胞の、細胞遺伝子型及び細胞表現型を使用して、遺伝子型及び表現型により特徴付けられる細胞の亜集団を同定する。一実施形態では、細胞の遺伝子型及び表現型を用いて亜集団を同定することは、次元削減分析を行うことを伴う。一実施形態では、細胞の遺伝子型及び表現型を用いて亜集団を同定することは、監督されていないクラスター化分析を行うことを伴う。一実施形態では、細胞の遺伝子型及び表現型を用いて亜集団を同定することは、次元削減分析、及び、監督されていないクラスター化分析を行うことを伴う。
監督されていないクラスター分析の例としては、階層クラスター化、k平均クラスター化、混合物モデルを用いるクラスター化、ノイズを有するアプリケーションの密度ベース空間クラスター化(DBSCAN)、クラスター化構造を同定するための発注点(OPTICS)、またはこれらの組み合わせが挙げられる。次元削減分析の例としては、主成分分析(PCA)、カーネルPCA、グラフに基づくカーネルPCA、線形判別分析、一般化判別分析、オートエンコーダー、非負値行列因子分解、T分布型確率的近傍埋め込み法(t-SNE)、または、均一マニホールド近似及び投影(UMAP)ならびにdens-UMAPが挙げられる。
特定の実施形態では、次元削減分析及び監督されていないクラスター化は、集団内の細胞の、細胞遺伝子型または細胞表現型のいずれかのうちの少なくとも1つにて行われる。したがって、細胞の細胞遺伝子型または細胞表現型のいずれかのうちの少なくとも1つに従い、細胞のクラスターを生成する。特定の実施形態では、1つ以上の遺伝子に対して検出されたSNVに従い、細胞のクラスターを生成する。特定の実施形態では、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、または100個の遺伝子に対して検出されたSNVに従い、細胞のクラスターを生成する。特定の実施形態では、1つ以上の遺伝子に対して検出されたCNVに従い、細胞のクラスターを生成する。特定の実施形態では、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、または100個の遺伝子に対して検出されたCNVに従い、細胞のクラスターを生成する。特定の実施形態では、1つ以上の検体に対する検体発現のレベルに従い、細胞のクラスターを生成する。特定の実施形態では、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、または100個の検体に対する検体発現のレベルに従い、細胞のクラスターを生成する。
様々な実施形態では、クラスター内の個別細胞を、細胞遺伝子型または細胞表現型の他方を用いて標識し、クラスター内での、またはクラスターにまたがってのいずれかでの、細胞のあらゆる亜集団を明らかにする。一例として、細胞表現型(例えば、検体発現)を用いて細胞のクラスターを生成することができ、細胞遺伝子型(例えば変異)を使用して、クラスター内で細胞を標識する。別の例として、細胞遺伝子型を使用して細胞のクラスターを生成し、細胞表現型を使用して、クラスター内で細胞を標識する。
具体例を提供するために、次元削減分析、及び監督されていないクラスター化を、細胞の細胞表現型にて行う。具体的には、次元削減分析を、抗体オリゴヌクレオチドに由来する、正規化したシーケンスリード値(例えば、CLR値)にて行うことができる。次いで、次元削減空間にて、CLR正規化したシーケンスリード値にて監督されていないクラスター化を行い、細胞のクラスターを生成する。ここで、類似の発現プロファイルを有する細胞を、共通のクラスター内でクラスター化することができる一方で、非類似の検体発現プロファイルを有する細胞は、異なるクラスター内でクラスター化することができる。細胞の細胞遺伝子型を用いて、クラスター内で個別細胞を標識することができる。例えば、クラスター内の個別細胞を、特定の変異(例えば、遺伝子における特定のSNV、または、特定の遺伝子に対するコピー数の増減)を有するものとして標識することができる。いくつかのシナリオでは、クラスター内の個別細胞を、2つ以上の変異(例えば、1つ以上の遺伝子におけるSNV、または、1つ以上の遺伝子におけるコピー数の増減)を有するものとして標識することができる。
別の例として、次元削減分析、及び監督されていないクラスター化を、細胞の細胞遺伝子型にて行う。具体的には、細胞内で同定された1つ以上の遺伝子の変異(例えば、SNV及び/またはCNV)に従い、次元削減分析を行うことができる。次いで、次元削減空間にて、監督されていないクラスター化を行い、細胞のクラスターを生成する。ここで、同様の遺伝子型(例えば、1つ以上の遺伝子の変異)を有する細胞を、共通のクラスター内でクラスター化することができる一方で、非類似の遺伝子型を有する細胞は、異なるクラスター内でクラスター化することができる。細胞の細胞表現型を用いて、クラスター内で個別細胞を標識することができる。例えば、クラスター内の個別細胞を、特定の検体を発現する、または発現しないものとして標識することができる。いくつかのシナリオでは、クラスター内の個別細胞を、2つ以上の検体を発現する、または2つ以上の検体を発現しないものとして標識することができる。
様々な実施形態では、次元削減分析、及び監督されていないクラスター化を、細胞の細胞遺伝子型及び細胞表現型の両方にて行う。ここで、同様の遺伝子型(例えば、1つ以上の遺伝子の変異)及び表現型を有する細胞を、共通のクラスター内でクラスター化することができる一方で、非類似の遺伝子型及び表現型を有する細胞は、異なるクラスター内でクラスター化することができる。
細胞の標識されたクラスターを分析することで、いくつかのシナリオにおいては、遺伝子型(例えば変異)、及び表現型(例えば検体発現)の特定の組み合わせを有する、細胞の亜集団が明らかとなる。一実施形態では、細胞の亜集団は、共通の表現型、及び共通の遺伝子型を有する細胞のクラスターを意味することができる。例えば、細胞の亜集団は、検体を発現し、遺伝子の特定の位置でSNVを有する、細胞のクラスターを意味することができる。別の例として、細胞の亜集団は、検体を有せず、遺伝子のコピー数が増加した細胞のクラスターを意味することができる。細胞のクラスターの、細胞表現型(例えば、検体の発現または発現の欠如)と、細胞遺伝子型(例えば、1つ以上のSNVの有無、または、遺伝子のコピー数の増減)の、任意の組み合わせを、亜集団として同定することができる。
細胞及び細胞集団
本明細書に記載する実施形態は、細胞のシングルセル分析を伴う。様々な実施形態では、細胞は、健常な細胞である。様々な実施形態では、細胞は病気の細胞である。病気の細胞の例としては、血液系腫瘍または充実性腫瘍の細胞などの、がん細胞が挙げられる。血液系腫瘍の例としては、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、またはT細胞リンパ腫が挙げられるが、これらに限定されない。充実性腫瘍の例としては、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫が挙げられるが、これらに限定されない。
本明細書に記載する実施形態は、細胞のシングルセル分析を伴う。様々な実施形態では、細胞は、健常な細胞である。様々な実施形態では、細胞は病気の細胞である。病気の細胞の例としては、血液系腫瘍または充実性腫瘍の細胞などの、がん細胞が挙げられる。血液系腫瘍の例としては、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、またはT細胞リンパ腫が挙げられるが、これらに限定されない。充実性腫瘍の例としては、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫が挙げられるが、これらに限定されない。
様々な実施形態では、シングルセル分析は、細胞の集団にて行われる。細胞の集団は、細胞の不均質な集団であることができる。一実施形態では、細胞の集団は、がん性細胞と非がん性細胞の両方を含むことができる。一実施形態では、細胞の集団は、それらの間で異種であるがん性細胞を含むことができる。様々な実施形態では、細胞の集団は、対象から入手することができる。例えば、試料を対象から採取し、シングルセル分析を行うために、試料中の細胞の集団を単離する。
標的化パネル
本明細書にて開示した実施形態は、1つ以上の遺伝子を照会するための、加えて、1つ以上のタンパク質の発現、及び/または発現レベルを照会するための、標的化DNAパネルを含む。様々な実施形態では、標的化DNAパネル、及びタンパク質パネルは、特定のがん(例えば、血液系腫瘍、及び/または充実性腫瘍)のために構築される。図5及び6は、一実施形態に従った、シングルセルワークフローを用いて分析した例示的な遺伝子標的及びタンパク質標的を示す。具体的には、図5Aで同定される遺伝子、及び図5Bで同定されるタンパク質は、急性骨髄性白血病を検出または分析するための、シングルセルワークフロー用標的遺伝子及びタンパク質であってよい。
本明細書にて開示した実施形態は、1つ以上の遺伝子を照会するための、加えて、1つ以上のタンパク質の発現、及び/または発現レベルを照会するための、標的化DNAパネルを含む。様々な実施形態では、標的化DNAパネル、及びタンパク質パネルは、特定のがん(例えば、血液系腫瘍、及び/または充実性腫瘍)のために構築される。図5及び6は、一実施形態に従った、シングルセルワークフローを用いて分析した例示的な遺伝子標的及びタンパク質標的を示す。具体的には、図5Aで同定される遺伝子、及び図5Bで同定されるタンパク質は、急性骨髄性白血病を検出または分析するための、シングルセルワークフロー用標的遺伝子及びタンパク質であってよい。
様々な実施形態では、標的化遺伝子パネルは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、または1000個の遺伝子を含む。様々な実施形態では、標的化タンパク質パネルは、少なくとも1個、少なくとも2個、少なくとも5個、少なくとも10個、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも200個、少なくとも300個、少なくとも400個、少なくとも500個、または少なくとも100個の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、がんを検出するために特異的なものであり、ABL1、ADO、AKT1、ALK、APC、AR、ATM、BRAF、CDH1、CDK4、CDKN2A、CSF1R、CTNNB1、DDR2、EGFR、ERBB2、ERBB3、ERBB4、ESR1、EZH2、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK1、JAK2、JAK3、KDR、KIT、KRAS、MAP2K1、MAP2K2、MET、MLH1、MPL、MTOR、NOTCH1、NRAS、PDGFRA、PIK3CA、PTEN、PTPN11、RAF1、RB1、RET、SMAD4、SMARCB1、SMO、SRC、STK11、TP53、及びVHLのうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、急性リンパ性白血病を検出または分析するのに特異的なものであり、GNB1、DNMT3A、FAT1、MYB、PAX5、CHD4、ORAI1、TP53BP1、IKZF3、WTIP、BCOR、RPL22、ASXL2、ATRX、IKZF1、KLF9、ETV6、FLT3、HCN4、STAT5B、CNOT3、USP9X、SLC25A33、ZFP36L2、DNAH5、EGFR、ABL1、CDKN1B、FREM2、IDH2、TSPYL2、ASXL1、DDX3X、TAL1、ZEB2、IL7R、BRAF、NOTCH1、KRAS、RB1、CREBBP、MED12、ZNF217、KDM6A、JAK1、IDH1、PIK3R1、EZH2、GATA3、HDAC7、MDGA2、USP7、ZFR2、ITSN1、BCORL1、RPL5、SETD2、EBF1、KMT2C、PTEN、KMT2D、SERPINA1、CTCF、DNM2、RUNX1、PHF6、OVGP1、TBL1XR1、LRFN2、ZFHX4、SORCS1、BTG1、BCL11B、TP53、SMARCA4、ERG、RPL10、NRAS、PIK3CA、CCND3、MYC、WT1、SH2B3、AKT1、NCOR1、EPOR、XBP1、USH2A、LEF1、OPN5、JAK2、LMO2、PTPN11、MGA、NF1、JAK3、SLC5A1、MYCN、FBXW7、PHIP、CDKN2A、CBL、NOS1、SPTBN5、SUZ12、UBA2、及びEP300のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは慢性リンパ性白血病を検出または分析するのに特異的なものであり、ATM、CHD2、FBXW7、NOTCH1、SPEN、BCOR、CREBBP、KRAS、NRAS、TP53、BIRC3、CXCR4、LRP1B、PLCG2、XPO1、BRAF、DDX3X、MAP2K1、POT1、ZMYM3、BTK、EGR2、MED12、RPS15、CARD11、EZH2、MYD88、SETD2、CD79B、FAT1、NFKBIE、及びSF3B1のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、慢性骨髄性白血病を検出または分析するのに特異的なものであり、DNMT3A、CDKN2A、TP53、U2AF1、KIT、ABL1、SETBP1、TET2、ETV6、ASXL1、EZH2、FLT3、及びRUNX1のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、古典的ホジキンリンパ腫を検出または分析するのに特異的なものであり、B2M、NFKBIA、SOCS1、TNFAIP3、MYB、PRDM1、STAT3、TP53、MYC、REL、及びSTAT6のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルはびまん性大細胞型B細胞リンパ腫を検出または分析するのに特異的なものであり、ATM、CREBBP、MYD88、STAT6、B2M、EP300、NOTCH1、TET2、BCL2、EZH2、NOTCH2、TNFAIP3、BRAF、FOXO1、PIK3CD、TNFRSF14、CARD11、GNA13、PIM1、TP53、CD79A、CD79B、KMT2D、MYC、PTEN、及びSOCS1のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、びまん性大細胞型B細胞リンパ腫を検出または分析するのに特異的なものであり、TNFRSF14、TNFAIP3、STAT6、CD79B、ARID1A、CARD11、CREBBP、BCL2、NOTCH2、EZH2、SOCS1、EP300、TET2、KMT2D、及びTP53のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、マントル細胞リンパ腫を検出または分析するのに特異的なものであり、ATM、CCND1、NOTCH1、UBR5、BIRC3、KMT2D、TP53、及びWHSC1のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、多発性骨髄腫を検出または分析するのに特異的なものであり、BRAF、FAM46C、IRF4、PIK3CA、CCND1、FGFR3、JAK2、RB1、DIS3、FLT3、KRAS、TP53、DNMT3A、IDH1、NRAS、及びTRAF3のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、骨髄異形成症候群を検出または分析するのに特異的なものであり、ASXL1、FLT3、NF1、TP53、BCOR、GATA2、NRAS、U2AF1、CBL、IDH1、PTPN11、ZRSR2、DNMT3A、IDH2、RUNX1、ETV6、JAK2、SF3B1、EZH2、KRAS、及びTET2のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、骨髄病を検出または分析するのに特異的なものであり、ASXL1、ERG、KDM6A、NRAS、SMC1A、ATM、ETV6、KIT、PHF6、SMC3、BCOR、EZH2、KMT2A、PPM1D、STAG2、BRAF、FLT3、KRAS、PTEN、STAT3、CALR、GATA2、MPL、PTPN11、TET2、CBL、GNAS、MYC、RAD21、TP53、CHEK2、IDH1、MYD88、RUNX1、U2AF1、CSF3R、IDH2、NF1、SETBP1、WT1、DNMT3A、JAK2、NPM1、SF3B1、及びZRSR2のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、骨髄増殖性腫瘍を検出または分析するのに特異的なものであり、CSF3R、IDH1、JAK2、ARAF、CHEK2、MPL、KIT、CBL、SETBP1、SF3B1、NRAS、TET2、IDH2、ASXL1、CALR、DNMT3A、EZH2、TP53、RUNX1、NF1、ERBB4、PTPN11、KRAS、及びU2AF1のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化遺伝子パネルは、T細胞リンパ腫を検出または分析するのに特異的なものであり、ALK、CDKN2A、IDH2、RHOA、ARID1A、DDX3X、JAK3、STAT3、ATM、DNMT3A、KMT2C、TET2、CARD11、FAS PLCG1、及びTP53のうちの1つ以上の遺伝子を含む。
様々な実施形態では、標的化タンパク質パネルは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、または1000個のタンパク質を含む。様々な実施形態では、標的化タンパク質パネルは、少なくとも1個、少なくとも2個、少なくとも5個、少なくとも10個、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも200個、少なくとも300個、少なくとも400個、少なくとも500個、または少なくとも100個のタンパク質を含む。様々な実施形態では、標的化タンパク質パネルは、HLA-DR、CD10、CD117、CD11b、CD123、CD13、CD138、CD14、CD141、CD15、CD16、CD163、CD19、CD193 (CCR3)、CD1c、CD2、CD203c、CD209、CD22、CD25、CD3、CD30、CD303、CD304、CD33、CD34、CD4、CD42b、CD45RA、CD5、CD56、CD62P(P-セレクチン)、CD64、CD68、CD69、CD38、CD7、CD71、CD83、CD90 (Thy1)、FcεRIα、Siglec-8、CD235a、CD49d、CD45、CD8、CD45RO、マウスIgG1、κ、マウスIgG2a、κ、マウスIgG2b、κ、CD103、CD62L、CD11c、CD44、CD27、CD81、CD319(SLAMF7)、CD269(BCMA)、CD99、CD164、KCNJ3、CXCR4(CD184)、CD109、CD53、CD74、HLA-DR、DP、DQ、HLA-A、B、C、ROR1、アネキシンA1、またはCD20のうちの1つ以上のタンパク質を含む。
バーコード及びバーコード化ビーズ
本発明の実施形態は、図1に示す工程170の間に、シングルセルの検体を標識するために、1つ以上のバーコード配列を提供すること伴う。1つ以上のバーコード配列は、エマルションに、シングルセルに由来する細胞溶解物と共に封入される。そのため、1つ以上のバーコードは細胞の検体を標識することにより、シーケンスリードが、同一のシングルセル起源の検体に由来することをその後判定することを可能にする。
本発明の実施形態は、図1に示す工程170の間に、シングルセルの検体を標識するために、1つ以上のバーコード配列を提供すること伴う。1つ以上のバーコード配列は、エマルションに、シングルセルに由来する細胞溶解物と共に封入される。そのため、1つ以上のバーコードは細胞の検体を標識することにより、シーケンスリードが、同一のシングルセル起源の検体に由来することをその後判定することを可能にする。
様々な実施形態では、複数のバーコードをエマルションに、細胞溶解物と共に添加する。様々な実施形態では、エマルションに添加される複数のバーコードは、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも105、少なくとも106、少なくとも107、または少なくとも108個のバーコードを含む。様々な実施形態では、エマルションに添加される複数のバーコードは、同一のバーコード配列を有する。例えば、同一のバーコードラベルの複数のコピーをエマルションに添加して、細胞溶解物に由来する複数の検体を標識し、これにより、検体が由来する細胞の同定を可能にする。様々な実施形態では、エマルションに添加される複数のバーコードは、「固有の識別配列」(UMI)を含む。UMIは、そのUMIがコンジュゲートされている1つ以上の第1の分子を、異なる配列を有する個別のUMIがコンジュゲートされる、1つ以上の第2の分子から識別及び/または区別するのに利用できる配列を有する核酸である。UMIは典型的には、長さが短く、例えば、約5~20塩基長であり、対象とする1つ以上の標的分子またはその増幅産物にコンジュゲートしてよい。UMIは、一本鎖であっても、二本鎖であってもよい。いくつかの実施形態では、バーコード配列及びUMIの両方が、バーコードに組み込まれる。概して、UMIは、1つの集団または群における似た種類の分子を区別する目的で用いるのに対して、バーコード配列は、異なる細胞に由来する複数の分子集団または分子群を区別するのに用いる。いくつかの実施形態では、UMI及びバーコード配列の両方を使用する場合、そのUMIは、そのバーコード配列よりも配列の長さが短い。バーコードの使用は、米国特許出願第15/940,850号にさらに記載されており、その全体が参照により本明細書に組み込まれている。
いくつかの実施形態では、バーコードは一本鎖バーコードである。一本鎖バーコードは、多数の技術を使用して生成することができる。例えば、一本鎖バーコードは、異なる分子の配列が少なくとも部分的に異なっている、複数のDNAバーコードを入手することにより生成することができる。これらの分子を次に増幅し、例えば、非対称PCRを使用して、一本鎖のコピーを作製することができる。あるいは、バーコード分子を環状にした後で、ローリングサークル増幅に供することができる。これにより、バーコード化した元のDNAが、単一の長い分子として何回も濃縮される、生成物である分子が得られる。
いくつかの実施形態では、任意数の定常配列が隣接するバーコード配列を含有する、環状バーコードDNAは、線状DNAを環状にすることで入手することができる。任意の定常配列をアニールするプライマーは、鎖置換ポリメラーゼ(Phi29ポリメラーゼなど)を使用することにより、ローリングサークル増幅を開始することができ、バーコードDNAの長い直鎖コンカテマーを生成する。
様々な実施形態では、バーコードは、当該バーコードが標的核酸を標識可能にするプライマー配列に結合することができる。一実施形態では、バーコードはフォワードプライマー配列に結合する。様々な実施形態では、フォワードプライマー配列は、核酸のフォワード標的とハイブリダイズする遺伝子特異的プライマーである。様々な実施形態では、フォワードプライマー配列は、遺伝子特異的プライマーに付着した相補配列とハイブリダイズする、PCRハンドルなどの定常領域である。遺伝子特異的プライマーに付着した相補配列を、反応混合物(例えば、図1の反応混合物140)中に提供することができる。バーコードが同一のフォワードプライマーを有することができ、遺伝子特異的フォワードプライマーに結合するように個別に設計される必要がないため、定常フォワードプライマー配列をバーコードに含めることが、好ましい場合がある。
様々な実施形態では、バーコードは、ビーズなどの支持構造体に解放可能に付着することができる。したがって、バーコードの複数のコピーを含む単一のビーズを、細胞溶解物を含むエマルションに分画することができ、これにより、細胞溶解物の検体を、ビーズのバーコードで標識することが可能となる。例示的なビーズとしては、固体ビーズ(例えば、シリカビーズ)、高分子ビーズ、またはハイドロゲルビーズ(例えば、ポリアクリルアミド、アガロース、もしくはアルギン酸ビーズ)が挙げられる。ビーズは、様々な技術を用いて合成することができる。例えば、混合分離技術を使用すると、同一な無作為のバーコード配列の多くのコピーを伴うビーズを合成することができる。これは例えば、DNAを合成可能な部位を含む複数のビーズを作製することにより達成することができる。ビーズは4つの集まりに分けることができ、それぞれに、A、T、G、またはCなどの塩基をビーズに添加する、緩衝液と混合することができる。母集団を4つの亜集団に分けることで、各亜集団は、その表面に添加された塩基のうちの1つを有することができる。本反応は、単一の塩基のみが添加され、更なる塩基が添加されない方法で達成することができる。4つの亜集団全てに由来するビーズを合わせて互いに混合し、2回目の4つの集団への分割を行うことができる。この分割工程において、以前の4つの集団に由来するビーズを、無作為に一緒に混合することができる。これらを次に、4つの異なる溶液に添加し、各ビーズの表面上の、別の無作為な塩基を添加することができる。本プロセスを繰り返し、ビーズ表面に、母集団が分離及び混合される時間数におよそ等しい長さの配列を生成することができる。これを10回行ったら、例えば、結果は、各ビーズが、その表面に同一の無作為の10個の塩基配列が合成された多数のコピーを有する、ビーズの母集団となろう。各ビーズ上の配列は、各分離混合サイクルを通して終了した、反応器の特定の配列により測定される。例示的なビーズ及びその合成についてのさらなる詳細は、国際出願第PCT/US2016/016444号に記載されており、その全体が参照により本明細書に組み込まれている。
試薬
本明細書に記載する実施形態は、細胞を試薬と共に、エマルションに封入することを含む。一般に、試薬は、細胞が溶解する条件下で封入細胞と相互作用し、これにより、細胞の標的検体を放出する。試薬をさらに、標的検体と相互作用して、後続のバーコード化及び/または増幅のために調製することができる。
本明細書に記載する実施形態は、細胞を試薬と共に、エマルションに封入することを含む。一般に、試薬は、細胞が溶解する条件下で封入細胞と相互作用し、これにより、細胞の標的検体を放出する。試薬をさらに、標的検体と相互作用して、後続のバーコード化及び/または増幅のために調製することができる。
様々な実施形態では、試薬は、細胞を溶解させる1つ以上の溶解剤を含む。溶解剤の例としては、Triton X-100、Nonidet P-40(NP-40)、加えて細胞毒素などの洗剤が挙げられる。いくつかの実施形態では、試薬としては、細胞膜を破壊し、細胞溶解を引き起こすのに十分ではあるが、クロマチンパッケージ化DNAを破壊しないNP40洗剤が挙げられる。様々な実施形態では、試薬は、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.1%、1.2%、1.3%、1.4%、1.5%、1.6%、1.7%、1.8%、1.9%、2.0%、3.0%、3.1%、3.2%、3.3%、3.4%、3.5%、3.6%、3.7%、3.8%、3.9%、4.0%、4.1%、4.2%、4.3%、4.4%、4.5%、4.6%、4.7%、4.8%、4.9%、または5.0%のNP40(v/v)を含む。様々な実施形態では、試薬は、少なくとも0.01%、少なくとも0.05%、少なくとも0.1%、少なくとも0.5%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、または少なくとも5%のNP40(v/v)を含む。
様々な実施形態では、試薬は、細胞の溶解、及び/またはゲノムDNAのアクセスを補助するプロテアーゼをさらに含む。プロテアーゼの例としては、プロテイナーゼK、ペプシン、プロテアーゼ-サブチリシンCarlsberg、プロテアーゼ型X-bacillus thermoproteolyticus、プロテアーゼ型XIII-aspergillus Saitoiが挙げられる。様々な実施形態では、試薬は、0.01mg/mL、0.05mg/mL、0.1mg/mL、0.2mg/mL、0.3mg/mL、0.4mg/mL、0.5mg/mL、0.6mg/mL、0.7mg/mL、0.8mg/mL、0.9mg/mL、1.0mg/mL、1.5mg/mL、2.0mg/mL、2.5mg/mL、3.0mg/mL、3.5mg/mL、4.0mg/mL、4.5mg/mL、5.0mg/mL、6.0mg/mL、7.0mg/mL、8.0mg/mL、9.0mg/mL、または10.0mg/mLのプロテアーゼを含む。様々な実施形態では、試薬は、0.1mg/mL~5mg/mLのプロテアーゼを含む。様々な実施形態では、試薬は、0.5mg/mL~2.5mg/mLのプロテアーゼを含む。様々な実施形態では、試薬は、0.75mg/mL~1.5mg/mLのプロテアーゼを含む。様々な実施形態では、試薬は、0.9mg/mL~1.1mg/mLのプロテアーゼを含む。
様々な実施形態では、試薬は、dNTP、ジチオトレイトール(DTT)などの安定化在、及び緩衝溶液をさらに含むことができる。様々な実施形態では、試薬は、標的検体(例えば、ゲノムDNAまたは抗体オリゴヌクレオチド)とハイブリダイズするリバースプライマーなどの、プライマーを含むことができる。様々な実施形態では、このようなプライマーは、遺伝子特異的プライマーであることができる。例示的なプライマーを、以下にさらに詳述する。
反応混合物
本明細書に記載されるように、反応混合物を、細胞溶解物と共にエマルションに供給する(例えば、図1の細胞バーコード化工程170を参照されたい)。一般に、反応混合物は、細胞溶解物の検体にて、核酸増幅などの反応を行うのに十分な反応物質を含む。
本明細書に記載されるように、反応混合物を、細胞溶解物と共にエマルションに供給する(例えば、図1の細胞バーコード化工程170を参照されたい)。一般に、反応混合物は、細胞溶解物の検体にて、核酸増幅などの反応を行うのに十分な反応物質を含む。
様々な実施形態では、反応混合物は、核酸鎖に対して相補的なプライマー伸長生成物の合成が触媒される条件下に配置されるときに、相補鎖に沿って、合成の開始点として機能することができるプライマーを含む。様々な実施形態では、反応混合物は、4つの異なるデオキシリボヌクレオシド三リン酸(アデノシン、グアニン、シトシン、及びチミン)を含む。様々な実施形態では、反応混合物は、核酸増幅のための酵素を含む。核酸増幅のための酵素の例としては、DNAポリメラーゼ、熱サイクル増幅用の熱安定ポリメラーゼ、または、等温増幅のための複数置換増幅用ポリメラーゼが挙げられる。DNA依存性RNAポリメラーゼを用いる増幅などの、さほど一般的でない他の増幅形態もまた適用し、それ自身がDNAに逆転換し、本質的に、標的の増幅をもたらすことができる、元のDNA標的に由来するRNAの複数のコピーを作製することができる。生体もまた使用して、例えば、標的を生体に変換することにより、標的を増幅することができ、これにより次いで、生体の複製を伴い、または伴わずに、標的をコピーすることが可能となるか、またはコピーを誘発することができる。
様々な実施形態では、反応混合物の内容物は、好適な緩衝液中に存在し(「緩衝液」は、補助因子であるか、または、pH、イオン強度などに影響を及ぼす置換基を含む)、好適な温度にある。
核増幅の程度を、反応混合物中で反応物質の濃度を制御することにより制御することができる。場合によっては、これは、増幅産物が用いられる反応の微細なチューニングに有用である。
プライマー
本明細書に記載する本発明の実施形態は、プライマーを使用して、シングルセル分析を実施する。例えば、プライマーは、図1に示すワークフロープロセスの間に用意される。プライマーを使用して、対象となる核酸がバーコード化、及び/または増幅可能となるように、対象となる核酸の特定の配列とプライミング(例えばハイブリダイズ)することができる。具体的には、プライマーは、標的配列にハイブリダイズし、プライマーがハイブリダイズした鋳型鎖の核酸合成を触媒する酵素(例えば、ポリメラーゼ)用の基質として作用する。後で説明するように、プライマーは、図1に示すワークフロープロセスにおいて、様々な工程で提供することができる。図1を再度参照すると、様々な実施形態では、プライマーを、細胞102と共に封入される試薬120に含めることができる。様々な実施形態では、プライマーを、細胞溶解物130と共に封入される反応混合物140に含めることができる。様々な実施形態では、プライマーを、細胞溶解物130と共に封入されるバーコード145に含めることができるか、または、これと結合させることができる。シングルセル分析ワークフロープロセスで使用されるプライマーのさらなる説明及び例は、米国出願第16/749,731号に記載されており、その全体が参照により本明細書に組み込まれている。
本明細書に記載する本発明の実施形態は、プライマーを使用して、シングルセル分析を実施する。例えば、プライマーは、図1に示すワークフロープロセスの間に用意される。プライマーを使用して、対象となる核酸がバーコード化、及び/または増幅可能となるように、対象となる核酸の特定の配列とプライミング(例えばハイブリダイズ)することができる。具体的には、プライマーは、標的配列にハイブリダイズし、プライマーがハイブリダイズした鋳型鎖の核酸合成を触媒する酵素(例えば、ポリメラーゼ)用の基質として作用する。後で説明するように、プライマーは、図1に示すワークフロープロセスにおいて、様々な工程で提供することができる。図1を再度参照すると、様々な実施形態では、プライマーを、細胞102と共に封入される試薬120に含めることができる。様々な実施形態では、プライマーを、細胞溶解物130と共に封入される反応混合物140に含めることができる。様々な実施形態では、プライマーを、細胞溶解物130と共に封入されるバーコード145に含めることができるか、または、これと結合させることができる。シングルセル分析ワークフロープロセスで使用されるプライマーのさらなる説明及び例は、米国出願第16/749,731号に記載されており、その全体が参照により本明細書に組み込まれている。
様々な実施形態では、試薬、反応混合物、またはバーコードのいずれかの中での別個のプライマーの数は、約1~約500個以上の範囲、例えば、約2~100個のプライマー、約2~10個のプライマー、約10~20個のプライマー、約20~30個のプライマー、約30~40個のプライマー、約40~50個のプライマー、約50~60個のプライマー、約60~70個のプライマー、約70~80個のプライマー、約80~90個のプライマー、約90~100個のプライマー、約100~150個のプライマー、約150~200個のプライマー、約200~250個のプライマー、約250~300個のプライマー、約300~350個のプライマー、約350~400個のプライマー、約400~450個のプライマー、約450~500個のプライマー、または約500個以上のプライマーであってよい。
標的化DNA配列決定に関して、試薬(例えば、図1における試薬120)中のプライマーとしては、対象となる核酸(例えば、DNAまたはRNA)において、逆標的配列に対して相補的なリバースプライマーを挙げることができる。様々な実施形態では、試薬中のプライマーは、対象となる遺伝子の逆標的配列を標的にする遺伝子特異的プライマーであってよい。様々な実施形態では、反応混合物(例えば、図1の反応混合物140)中のプライマーとしては、対象となる核酸(例えばDNA)のフォワード標的配列に対して相補的なフォワードプライマーであってよい。様々な実施形態では、反応混合物中のプライマーは、対象となる遺伝子のフォワード標的を標的にする遺伝子特異的プライマーであってよい。様々な実施形態では、試薬のプライマー、及び反応混合物のプライマーは、核酸上で、対象となる領域に対するプライマーセット(例えば、フォワードプライマー及びリバースプライマー)を形成する。例示的な遺伝子特異的プライマーは、上記「標的パネル」の章で同定した遺伝子のいずれかを標的にするプライマーであることができる。
対象となる遺伝子用の、別個のフォワードまたはリバースプライマーの添加数は、約1~500個の範囲、例えば、約1~10個のプライマー、約10~20個のプライマー、約20~30個のプライマー、約30~40個のプライマー、約40~50個のプライマー、約50~60個のプライマー、約60~70個のプライマー、約70~80個のプライマー、約80~90個のプライマー、約90~100個のプライマー、約100~150個のプライマー、約150~200個のプライマー、約200~250個のプライマー、約250~300個のプライマー、約300~350個のプライマー、約350~400個のプライマー、約400~450個のプライマー、約450~500個のプライマー、または約500個以上のプライマーであってよい。
様々な実施形態では、反応混合物(例えば、図1の反応混合物140)に含まれるプライマーの代わりに、このようなプライマーは、バーコード(例えば、図1のバーコード145)の含まれることができるか、またはこれに結合することができる。特定の実施形態では、プライマーは、バーコードの末端に結合し、それ故、細胞溶解物中で、核酸の標的配列とハイブリダイズするのに利用可能である。
様々な実施形態では、反応混合物のプライマー、試薬のプライマー、またはバーコードのプライマーはエマルションに、1工程で、または2つ以上の工程で添加することができる。例えば、プライマーは、2工程以上、3工程以上、4工程以上または5工程以上で加えてよい。プライマーを1工程で加えるか、2工程以上で加えるかにかかわらず、プライマーは、溶解剤を加えた後、溶解剤を加える前、または溶解剤を加えるのと同時に加えてよい。溶解剤を加える前または加えた後にPCRプライマーを加える場合、反応混合物のプライマーは、(例えば、図1に示す2段階ワークフロープロセスで例示されるように)溶解剤の添加とは別個の工程で添加することができる。
標的核酸を増幅するためのプライマーセットは典型的には、標的核酸またはその相補体と相補的であるフォワードプライマー及びリバースプライマーを含む。いくつかの実施形態では、増幅は、1回の増幅反応において、複数の標的特異的プライマー対を用いて行うことができ、この場合、各プライマー対は、標的特異的なフォワードプライマー及び標的特異的なリバースプライマーを含み、それぞれ、試料中の対応する標的配列と実質的に相補的であるかまたは実質的に同一である配列を少なくとも1つ含み、各プライマー対は、対応する標的配列が異なる。したがって、本発明におけるある特定の方法を用いて、シングルセルの試料に由来する複数の標的配列を検出または識別する。
例示的なシステム及び/またはコンピュータの実施形態
上述したシングルセル分析を行うための、システム及びコンピュータの実施形態をさらに、本明細書で記載する。例示的なシステムは、図1Aに示すシングルセルワークフロー装置106及び演算装置108などの、シングルセルワークフロー装置及び演算装置を含むことができる。様々な実施形態では、シングルセルワークフロー装置106は、細胞封入160、検体放出165、細胞バーコード化170、標的増幅175、核酸プール205、及び配列決定210の工程を行うように構成される。様々な実施形態では、演算装置108は、コンピュータによる、リードアラインメント工程215、細胞遺伝子型及び表現型の測定工程220、ならびに、細胞遺伝子型及び表現型を用いる細胞分析工程を行うように構成される。
上述したシングルセル分析を行うための、システム及びコンピュータの実施形態をさらに、本明細書で記載する。例示的なシステムは、図1Aに示すシングルセルワークフロー装置106及び演算装置108などの、シングルセルワークフロー装置及び演算装置を含むことができる。様々な実施形態では、シングルセルワークフロー装置106は、細胞封入160、検体放出165、細胞バーコード化170、標的増幅175、核酸プール205、及び配列決定210の工程を行うように構成される。様々な実施形態では、演算装置108は、コンピュータによる、リードアラインメント工程215、細胞遺伝子型及び表現型の測定工程220、ならびに、細胞遺伝子型及び表現型を用いる細胞分析工程を行うように構成される。
様々な実施形態では、シングルセルワークフロー装置106は、少なくとも、細胞を試薬と共に封入し、細胞溶解物を反応混合物と封入し、核酸増幅反応を行うように構成される、マイクロフルイディクスデバイスを含む。例えば、マイクロフルイディクスデバイスは、流体連通している1つ以上の流体チャネルを含むことができる。したがって、第1のチャネルを通る水性流体と、第2のチャネルを通るキャリア流体とを組み合わせることにより、エマルションドロップレットの生成がもたらされる。様々な実施形態では、マイクロフルイディクスデバイスの流体チャネルは、ミリメートル以下のオーダー(例えば、約1ミリメートル以下)の、少なくとも1つの断面寸法を有することができる。マイクロチャネルのデザイン及び寸法についてのさらなる詳細は、これらそれぞれの全体が参照により本明細書に組み込まれている、国際特許出願第PCT/US2016/016444号、及び、米国特許第14/420,646号に記載されている。マイクロフルイディクスデバイスの一例は、Tapestri(商標)Platformである。
様々な実施形態では、シングルセルワークフロー装置106はまた、(a)対象装置及び/またはその中のドロップレットの、1つ以上の部分の温度を制御し、マイクロフルイディクスデバイス(複数可)に動作可能に接続されている、温度調節モジュール、(b)マイクロフルイディクスデバイス(複数可)に動作可能に接続されている、検出モジュール、即ち検出器、例えば光学撮像器、(c)マイクロフルイディクスデバイス(複数可)に動作可能に接続されている、インキュベーター、例えば細胞インキュベーター、ならびに、(d)マイクロフルイディクスデバイス(複数可)に動作可能に接続したシーケンサーのうちの1つ以上を含むことができる。1つ以上の温度及び/または圧力制御モジュールは、装置の1つ以上の流路内での、キャリア流体の温度及び/または圧力の制御をもたらす。一例として、温度調節モジュールは、核酸増幅を行うために温度を制御する、1つ以上の熱サイクラーであってよい。1つ以上の検出モジュール、即ち検出器、例えば光学撮像器は、1つ以上のドロップレットの存在、または、その特徴(その組成を含む)を検出するように構成される。いくつかの実施形態では、検出器モジュールは、1つ以上の流路内で、1つ以上のドロップレットの1つ以上の構成成分を認識するように構成される。シーケンサーは、次世代配列決定などの配列決定を行うように構成された、ハードウェア装置である。シーケンサーの例としては、Illuminaのシーケンサー(例えば、MiniSeq(商標)、MiSeq(商標)、NextSeq(商標)550 Series、またはNextSeq(商標)2000)、Rocheの配列決定システム454、及び、Thermo Fisher Scientificのシーケンサー(例えば、Ion GeneStudio S5システム、Ion Torrent Genexusシステム)が挙げられる。
図7は、図1~6を参照して記載するシステム及び方法を実装するための、例示的な演算装置を示す。例えば、例示的な演算装置108は、リードアラインメント215及び細胞軌道測定220のコンピュータによる工程を行うように構成される。演算装置の例としては、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップ、サーバーコンピュータ、クラスター内の演算ノード、メッセージプロセッサ、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラミング可能な消費者エレクトロニクス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、携帯電話、PDA、タブレット、ポケベル、ルーター、スイッチなどを挙げることができる。
図7は、図1~5に示すシステム及び方法を実装するための、例示的な演算装置108を示す。いくつかの実施形態では、演算装置108は、チップセット704に結合した少なくとも1つのプロセッサ702を含む。チップセット704は、メモリコントローラハブ720、及び入力/出力(I/O)コントローラハブ722を含む。メモリ706およびグラフィックスアダプター712は、メモリコントローラハブ720に連結され、ディスプレイ718は、グラフィックスアダプター712に連結される。記憶装置708、入力インタフェース714、及びネットワークアダプター716が、I/Oコントローラハブ722に連結される。演算装置108の他の実施形態は、異なる構造を有する。
記憶装置708は、ハードドライブ、コンパクトディスクリードオンリーメモリ(CD-ROM)、DVD、またはソリッドステートメモリデバイス等の、非一時的コンピュータ可読記憶媒体である。メモリ706は、プロセッサ702によって使用される命令及びデータを保持する。入力インタフェース714は、タッチスクリーンインタフェース、マウス、トラックボール、または他の種類の入力インタフェース、キーボード、またはいくつかのこれらの組み合わせであり、データを演算装置108に入力するために使用する。いくつかの実施形態では、演算装置108は、入力インタフェース714から、ユーザのジェスチャを介して、入力(例えばコマンド)を受けるように構成されることができる。グラフィックスアダプター712は、ディスプレイ718に、イメージ及び他の情報を表示する。例えば、ディスプレイ718は、予測した細胞軌道の指標を示すことができる。ネットワークアダプター716は、演算装置108を1つ以上のコンピュータネットワークに結合する。
演算装置は、本明細書に記載される機能性を提供するためのコンピュータプログラムモジュールを実行するように適合される。本明細書で使用される「モジュール」という用語は、指定された機能性を提供するために使用されるコンピュータプログラム論理を指す。したがって、モジュールは、ハードウェア、ファームウェア、および/またはソフトウェアに実装することができる。一実施形態では、プログラムモジュールは、記憶デバイス708に記憶され、メモリ706にロードされ、プロセッサ702によって実行される。
演算装置108の種類は、本明細書に記載する実施形態毎で変化し得る。例えば、演算装置108は、グラフィックスアダプター712、入力インタフェース714、及びディスプレイ718などの、上述した構成要素のいくつかを欠く場合がある。いくつかの実施形態では、演算装置108は、メモリ706に格納された命令を実行するためのプロセッサ702を含むことができる。
様々な実施形態では、シーケンスリードをアラインする方法、細胞遺伝子型及び表現型を測定する方法、ならびに/または、細胞遺伝子型及び表現型を用いて細胞を分析する方法などの、本明細書に記載する方法は、ハードウェアもしくはソフトウェア、またはこれらの組み合わせの中で実装することができる。一実施形態では、上述したものなどの、非一時的コンピュータ可読記憶媒体が提供され、当該媒体は、上記データを用いるための指示でプログラミングされた機械を用いる際に、本発明の細胞軌道のデータセット及び実行及び結果のいずれかを表示可能な、機械で読取り可能なデータでコードされた、データ格納マテリアルを含む。このようなデータは、患者の監視、処置の考慮などの、様々な目的のために使用することができる。上述した方法の実施形態を、プロセッサ、データ格納システム(揮発性及び不揮発性メモリ、ならびに/または格納要素を含む)、グラフィックスアダプター、入力インタフェース、ネットワークアダプター、少なくとも1つの入力装置、ならびに少なくとも1つの出力装置を含む、プログラミング可能なコンピュータ上で実行するコンピュータプログラムに実装することができる。ディスプレイを、グラフィックスアダプターに結合する。プログラムコードを入力データに適用し、上述した機能を実施し、出力情報を生成する。出力情報を、既知の様式で1つ以上の出力装置に適用する。コンピュータは例えば、従来のデザインのパーソナルコンピュータ、マイクロコンピュータ、または、ワークステーションであることができる。
各プログラムは、ハイレベルの手順またはオブジェクト指向プログラミング言語で実装して、コンピュータシステムと通信することができる。しかし、プログラムは、所望する場合、アセンブリまたは機械言語で実装することができる。いずれの場合も、言語はコンパイラ言語またはインタプリタ言語であることができる。このような各コンピュータプログラムは、ストレージ媒体または装置がコンピュータにより読み取られ、本明細書に記載する手順を実行するときに、コンピュータを構成して操作するために、汎用または特殊目的のプログラミング可能なコンピュータにより読み取り可能な、ストレージ媒体または装置(例えば、ROMまたは磁気ディスク)に格納されるのが好ましい。システムは、構成されたストレージ媒体が、コンピュータを特定かつ所定の様式で操作させ、本明細書に記載する機能を実施する場合に、コンピュータプログラムと共に構成される、コンピュータ読み取り可能なストレージ媒体として実装されるとみなされることもまた、可能である。
署名パターン及びそのデータベースを、様々な媒体で提供して、その使用を容易にすることができる。「媒体」とは、本発明の署名パターン情報を含有するマニュファクチャを意味する。本発明のデータベースは、コンピュータが読み取り可能な媒体、例えば、コンピュータにより読み取られ、直接アクセス可能な任意の媒体に記録することができる。このような媒体としては、フロッピーディスク、ハードディスクストレージ媒体、及び磁気テープなどの磁気記憶媒体;CD-ROMなどの光学記憶媒体;RAM及びROMなどの電気記憶媒体;ならびに、磁気/光学記憶媒体などの、これらのカテゴリーのハイブリッドが挙げられるが、これらに限定されない。当業者は、現在知られているコンピュータで読み取り可能な媒体のいずれかを使用して、本データベース情報を記録することを含むマニュファクチャを作製する方法を速やかに理解することができる。「記録された」とは、当技術分野において既知の任意のこのような方法を使用して、コンピュータで読み取り可能な媒体に情報を格納するプロセスを意味する。格納した情報にアクセスするために使用する手段に基づき、任意の従来のデータ格納構造体を選択することができる。様々なデータプロセッサプログラム及びフォーマット、例えば、ワープロテキストファイル、データベースフォーマットなどを、格納のために使用することができる。
例示的なキットの実施形態
細胞集団の細胞遺伝子型及び表現型を測定するための、シングルセルワークフローを行うためのキットもまた、本明細書で提供する。キットは、以下のうちの1つ以上を含むことができる:エマルションを形成するための流体(例えば、キャリア相、水相)、バーコード化ビーズ、シングルセルを処理するためのマイクロフルイディクスデバイス、細胞を溶解し、細胞検体を放出するための試薬、細胞を抗体と共に標識するための試薬及び緩衝液、核酸増幅反応を行うための反応混合物、及び、本明細書に記載の方法に対応するキット成分のうちのいずれかを使用するための取扱説明書。
細胞集団の細胞遺伝子型及び表現型を測定するための、シングルセルワークフローを行うためのキットもまた、本明細書で提供する。キットは、以下のうちの1つ以上を含むことができる:エマルションを形成するための流体(例えば、キャリア相、水相)、バーコード化ビーズ、シングルセルを処理するためのマイクロフルイディクスデバイス、細胞を溶解し、細胞検体を放出するための試薬、細胞を抗体と共に標識するための試薬及び緩衝液、核酸増幅反応を行うための反応混合物、及び、本明細書に記載の方法に対応するキット成分のうちのいずれかを使用するための取扱説明書。
実施例1:シングルセルにおける、細胞表面タンパク質及び変異の同時検出
Jurkat、K562、Mutz-8、及びRaji細胞の混合集団を、9個の、対象となるモノクローナル抗体、加えて、陰性対照として機能するマウスIgG1k抗体を含有する、オリゴヌクレオチドコンジュゲート抗体のプールで処理した。次に、細胞を洗浄し、Single-Cell DNA AML V2 Panel(20個の遺伝子をカバーする128個のアンプリコン)で分析されるTapestri Platformにロードした。DNA遺伝子型用の配列決定データを、Tapestri Pipelineソフトウェアで処理し、Tapestri Insightsソフトウェアによりさらに分析し、SNVを測定した。
Jurkat、K562、Mutz-8、及びRaji細胞の混合集団を、9個の、対象となるモノクローナル抗体、加えて、陰性対照として機能するマウスIgG1k抗体を含有する、オリゴヌクレオチドコンジュゲート抗体のプールで処理した。次に、細胞を洗浄し、Single-Cell DNA AML V2 Panel(20個の遺伝子をカバーする128個のアンプリコン)で分析されるTapestri Platformにロードした。DNA遺伝子型用の配列決定データを、Tapestri Pipelineソフトウェアで処理し、Tapestri Insightsソフトウェアによりさらに分析し、SNVを測定した。
抗体タグ計数を、有心対数比(CLR)変換を用いて正規化した。t-SNEプロットを、全タンパク質標的からのCLR値を用いて生成した。具体的には、図8は、異なるタンパク質の発現に従った、t-SNEプロットの細胞のクラスター化を示す。図8から確認できるように、タンパク質発現が異なる細胞の異なるクラスターを同定した。パネルのそれぞれは、対応する各タンパク質に対するCLR値を反映する。
細胞に由来するSNVデータを分析して、4つのクラスターが、4つの異なる細胞株であることを確認した。図9Aは、細胞株を互いに区別する、4つの異なる細胞株及び既知のSNVを示す。そのため、シングルセルから捕捉したSNVデータは、シングルセルがK562細胞、RAJI細胞、MUTZ8細胞、またはJURKAT細胞であるか否かを明らかにする。
各細胞からのSNVデータを次に、図8に示す、クラスター化したタンパク質発現データと組み合わせた。具体的には、図9B細胞遺伝子型がさらに重なった、タンパク質発現に従った細胞のクラスター化を示す。具体的には、SNVデータは、クラスター910がRAJI細胞に対応し、クラスター920がJURKAT細胞に対応し、クラスター930がK562細胞に対応し、クラスター940がMUTZ8細胞に対応することを明らかにする。
全てを合わせると、シングルセルタンパク質マーカー発現データは、細胞を、細胞遺伝子型データと一致するグループに独立してクラスター化した。このことは、シングルセルワークフロープロセスは、その表現型(例えば、タンパク質マーカー発現)、及び遺伝子型(例えば、SNV)に従い、個別の細胞を細胞集団に分類することに成功することが可能であることを明らかにする。
実施例2:標的化DNA配列決定からのCNV分析
細胞から入手したCNVデータを分析すると、CNVデータを上手く使用することで、4つの異なる集団の細胞を区別することができることが示された。標的化DNA配列決定データから、各細胞のリードをまず、細胞の全リード計数により正規化し、アンプリコンリード分布に基づく階層クラスター化によりグルーピングした。次に、既知のCNVを含む対照細胞クラスターを同定し、全細胞からのアンプリコン計数を、対照群由来の対応するアンプリコンのメジアンにより除した。本実験において、AMLパネルにおけるアンプリコンからの、配列決定リードの正規化割合を使用して、試験した各遺伝子に対するCNVを計算した。Jurkat細胞を、試験した全遺伝子に対する既知の二倍体状態を有する対照細胞株として使用した。
細胞から入手したCNVデータを分析すると、CNVデータを上手く使用することで、4つの異なる集団の細胞を区別することができることが示された。標的化DNA配列決定データから、各細胞のリードをまず、細胞の全リード計数により正規化し、アンプリコンリード分布に基づく階層クラスター化によりグルーピングした。次に、既知のCNVを含む対照細胞クラスターを同定し、全細胞からのアンプリコン計数を、対照群由来の対応するアンプリコンのメジアンにより除した。本実験において、AMLパネルにおけるアンプリコンからの、配列決定リードの正規化割合を使用して、試験した各遺伝子に対するCNVを計算した。Jurkat細胞を、試験した全遺伝子に対する既知の二倍体状態を有する対照細胞株として使用した。
図10は、4つの細胞株にまたがる13個の遺伝子に対する、観察された遺伝子レベルコピー数、及び、COSMICデータベースでの既知のレベルに対する、観察された遺伝子レベルコピー数の相関を示す。一般に、図10は、シングルセルワークフロープロセスは、(例えば、COSMICデータベースからの)一般に入手可能な既知のCNVと相関する、4つの異なる細胞株にまたがる13個の遺伝子に対する、CNVの量を同定することが可能であることを示す。
具体的には、図10は、観察されたコピー数、及び、COSMICデータベースにおけるコピー数とのその比較を示す。パネルの上列に示すように、JURKAT、K562、MUTZ8、及びRAJI細胞にまたがる遺伝子のそれぞれに対する、観察されたコピー数は、COSMICデータベースにおけるコピー数と一致した。上述のとおり、EZH2遺伝子のコピー数の増加がK562細胞で観察され、これは、COSMICデータベースにおけるEZH2遺伝子のコピー数の増加と一致する。MUTZ8細胞のFLT3、キット、及びTET2遺伝子、ならびに、RAJI細胞のKRAS遺伝子に関して、COSMICデータベースと同一の増加が観察された。
パネルの下列は、観察されたコピー数(y軸)とCOSMICコピー数(x軸)に対する、線形曲線を示す。単一線形適合(勾配=1)を、比較目的のためにパネルのそれぞれで示す。
全て合わせると、このことは、シングルセルワークフロープロセスが、個別細胞に対する遺伝子のコピー数を同定することに成功したことを示す。
実施例3:CNV結果による細胞型のクラスター化
遺伝子CNVに従いt-SNEクラスター化を用いて、細胞をクラスター化した。図11は、SNVにより細胞型がさらに重なった、CNVに従った細胞のクラスター化を示す。図9Aに関連して上述した既知のSNVに従い、SNVによる細胞検出を行った。CNVデータをt-SNEプロット、及び、各細胞株に対して以前に確立したSNV遺伝子型に基づき示したものとは異なる細胞にてグルーピングした。
遺伝子CNVに従いt-SNEクラスター化を用いて、細胞をクラスター化した。図11は、SNVにより細胞型がさらに重なった、CNVに従った細胞のクラスター化を示す。図9Aに関連して上述した既知のSNVに従い、SNVによる細胞検出を行った。CNVデータをt-SNEプロット、及び、各細胞株に対して以前に確立したSNV遺伝子型に基づき示したものとは異なる細胞にてグルーピングした。
遺伝子コピー数に従ったt-SNEクラスター化により、3つの個別のクラスター1110、1120、及び1130が解明されたことを、図11は示す。SNVジェノタイピングと重ね合わせたときに、クラスター1110はK562細胞に対応し、クラスター1130はMUTZ8細胞に対応し、クラスター1120はJURKAT及びRAJI細胞の両方に対応する。したがって、このことは、SNVとCNVデータの組み合わせにより、異なる細胞型に属する細胞の分類が可能となることを示す。
実施例4:表現型及び遺伝子型分析による細胞亜集団の解明
SNV/インデル及びCNVの両方のための、Tapestri Single-Cell DNA AML Panelを用いて、Raji、K562、TOM1、及びKG1細胞株を分析した。検体バーコード化オリゴタグにコンジュゲートした6個の抗体のパネルを用いて、細胞をTapestri Platformで処理し、タンパク質発現に同時にアクセスした。標的は、CD19、CD33、CD45、CD90、HLA-DR、及びマウスIgG1κからなった。下流分析のために、選択した数少ないSNV/インデル、CNV、及びタンパク質のみを含めた。
SNV/インデル及びCNVの両方のための、Tapestri Single-Cell DNA AML Panelを用いて、Raji、K562、TOM1、及びKG1細胞株を分析した。検体バーコード化オリゴタグにコンジュゲートした6個の抗体のパネルを用いて、細胞をTapestri Platformで処理し、タンパク質発現に同時にアクセスした。標的は、CD19、CD33、CD45、CD90、HLA-DR、及びマウスIgG1κからなった。下流分析のために、選択した数少ないSNV/インデル、CNV、及びタンパク質のみを含めた。
次に、109個のアンプリコンにまたがるAML、MPN、及びMDSに関連する31個の遺伝子のカスタムDNAパネルにより、6個のAML患者試料を分析した。加えて、以下の6つのタンパク質:CD3、CD11b、CD34、CD38、CD45RA、及びCD90を標的にするカスタムタンパク質抗体パネルを用いた。カスタムのTapestri Pipelineソフトウェアを用いてデータを分析した。SNV及びインデルは、Tapestri Insightsソフトウェアを用いて同定し、CNVは、R用Mision Bio “tapestri-cnv”パッケージを用いて分析し、DNA+タンパク質データは、R用Mision Bio “tapestri-protein”パッケージを用いて一体化して分析した。
Raji、K562、TOM1、KG1細胞を等しい比率で共に混合し、Tapestri Platformを用いて、SNV、インデル、CNV、及びタンパク質に関して分析した。
図12Aは、SNV、CNV、及びタンパク質発現のうちの1つを用いる、4つの細胞株の監督されていないクラスター化を示す。SNVデータ(4つのバリアントに基づく)を用いる、個別の各検体の、監督されていないクラスター化(例えばUMAP)及び可視化により、3つの細胞株が解明した。ここで、K562及びTOM1細胞は区別することができない一方で、RAJI及びKG1は個別にクラスター化した。CNVの監督されていないクラスター化でも同様に、3つのクラスターが生成し、K562及びKG1細胞は個別にクラスター化したものの、RAJI及びTOM1細胞は共にクラスター化した。タンパク質発現の監督されていないクラスター化により、TOM1細胞集団が区別されたが、K562、KG1、及びRAJI細胞集団の重なり合ったクラスターを有した。
図12Bは、SNV、CNV、及びタンパク質発現のうちの少なくとも2つを用いる、4つの細胞株の監督されていないクラスター化を示す。一般に、SNVまたはCNVをタンパク質データとそれぞれ組み合わせたときに、細胞株の解明は増加した一方で、組み合わせたSNV、CNV、及びタンパク質データは共に、4つの細胞株集団の最も異なる解明をもたらした。ここで、SNV、CNV、及びタンパク質のうちの少なくとも2つを用いる、監督されていないクラスター化は、個別の細胞集団をさらに解明することが可能であった。具体的には、SNV及びタンパク質における監督されていないクラスター化は、RAJI細胞及びKG1細胞の個別の集団を解明することが可能であり、K562及びTOM1細胞集団との重なり合いは最小限であった。同様に、CNV及びタンパク質の監督されていないクラスター化は、KG1細胞をはっきりと解明することが可能であり、RAJI、TOM1、及びK562細胞間の重なり合いは最小限であった。最終的に、CNV、SNV、及びタンパク質の監督されていないクラスター化により、4つの異なる細胞株が完全に解明された。この結果は、細胞型間で最大の解明を得るためのマルチオミクスアプローチによる、同一細胞からのより多くのデータを用いる力を示す。このことは、異種集団で混合される細胞の亜集団を、本明細書で記載するシングルセルワークフローを用いて区別または同定することができることをさらに示す。
Claims (20)
- 複数の細胞の分析方法であって、
前記複数の細胞の1つ以上の細胞に対して、
前記細胞を、試薬を含むエマルションに封入することであって、前記細胞が、少なくとも1つのDNA分子と、少なくとも1つの検体結合抗体がコンジュゲートしたオリゴヌクレオチドとを含む、前記封入することと、
前記細胞を前記エマルション中で溶解し、前記少なくとも1つのDNA分子と前記オリゴヌクレオチドとを含む細胞溶解物を生成することと、
前記少なくとも1つのDNA分子と前記オリゴヌクレオチドとを含む前記細胞溶解物を、反応混合物と共に、第2のエマルション中で封入することと、
核酸増幅反応を、前記反応混合物を使用して前記第2のエマルション内で行い、アンプリコンを生成することであって、前記アンプリコンが、
前記少なくとも1つのDNA分子のうちの1つに由来する第1のアンプリコン、及び
前記オリゴヌクレオチドに由来する第2のアンプリコン
を含む、前記生成することと、
前記第1のアンプリコン及び前記第2のアンプリコンを配列決定することと、
前記細胞の1つ以上の変異を、少なくとも前記配列決定した第1のアンプリコンを用いて測定することと、
少なくとも前記第2のアンプリコンを用いて検体の有無を測定することと、
細胞の亜集団を、前記複数の細胞内で発見することであって、前記細胞の亜集団が、前記1つ以上の変異及び前記検体の有無により特徴付けられる、前記発見することと
を含む、前記方法。 - 前記1つ以上の変異が、一塩基バリアント(SNV)またはコピー数多型(CNV)を含む、請求項1に記載の方法。
- 前記1つ以上の変異が、一塩基バリアント(SNV)及びコピー数多型(CNV)を含む、請求項1に記載の方法。
- 前記複数の細胞内で前記細胞の亜集団を発見することが、前記同定したSNVまたは前記同定したCNVに従い、前記1つ以上の細胞をクラスター化することを含む、請求項2または3に記載の方法。
- 前記SNVまたは前記CNVが、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、T細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫に関連する遺伝子において同定される、請求項2~4のいずれか1項に記載の方法。
- 前記SNVまたは前記CNVが、ABL1、GNB1、KMT2D、PLCG2、GNA13、ATM、BRAF、JAK3、ADO、DNMT3A、SERPINA1、XPO1、PIM1、CCND1、FLT3、STAT3、AKT1、FAT1、CTCF、TP53、NOTCH1、KRAS、ALK、MYB、DNM2、DDX3X、CD79A、UBR5、PTEN、APC、PAX5、RUNX1、MAP2K1、CD79B、BIRC3、KMT2C、AR、CHD4、PHF6、POT1、CALR、TET2、ORAI1、OVGP1、ZMYM3、MYC、GATA2、CARD11、TP53BP1、TBL1XR1、BTK、WHSC1、MPL、FAS、CDH1、IKZF3、LRFN2、EGR2、SOCS1、PTPN11、PLCG1、CDK4、WTIP、ZFHX4、MED12、TNFRSF14、FAM46C、CDKN2A、BCOR、SORCS1、RPS15、TNFAIP3、IRF4、CBL、CSF1R、RPL22、BTG1、STAT6、PIK3CA、GNAS、CTNNB1、ASXL2、BCL11B、EZH2、DDR2、ATRX、MYD88、ARID1A、FGFR3、RAD21、EGFR、IKZF1、SMARCA4、SETD2、JAK2、ERBB2、KLF9、ERG、CREBBP、RB1、CHEK2、ERBB3、ETV6、RPL10、BCL2、DIS3、IDH1、ERBB4、NRAS、NFKBIE、NOTCH2、ESR1、HCN4、SF3B1、STAT5B、CCND3、U2AF1、FBXW7、CNOT3、EP300、CSF3R、FGFR1、USP9X、WT1、IDH2、FGFR2、SLC25A33、SH2B3、NF1、ZFP36L2、KIT、TRAF3、SETBP1、DNAH5、NCOR1、ABL1、ASXL1、GNA11、EPOR、GNAQ、XBP1、CDKN1B、USH2A、NPM1、HNF1A、FREM2、LEF1、HRAS、OPN5、ZRSR2、TSPYL2、LMO2、JAK1、B2M、TAL1、MGA、NFKBIA、ARAF、ZEB2、KDR、IL7R、SLC5A1、MYCN、PRDM1、MAP2K2、PHIP、MET、MLH1、REL、ZNF217、NOS1、MTOR、KDM6A、SPTBN5、SUZ12、UBA2、PDGFRA、PIK3R1、GATA3、CHD2、HDAC7、SMC1A、RAF1、MDGA2、USP7、SPEN、RET、ZFR2、SMAD4、ITSN1、SMARCB1、BCORL1、SMC3、SMO、RPL5、SRC、FOXO1、STK11、EBF1、PIK3CD、KMT2A、RHOA、CXCR4、PPM1D、VHL、LRP1B、及びSTAG2のいずれかにおいて同定される、請求項5に記載の方法。
- 前記検体の有無を測定することが、前記検体の発現レベルを測定することを含み、前記検体が、前記オリゴヌクレオチドにコンジュゲートした前記抗体により結合されている、請求項1~6のいずれか1項に記載の方法。
- 前記検体が、HLA-DR、CD10、CD117、CD11b、CD123、CD13、CD138、CD14、CD141、CD15、CD16、CD163、CD19、CD193 (CCR3)、CD1c、CD2、CD203c、CD209、CD22、CD25、CD3、CD30、CD303、CD304、CD33、CD34、CD4、CD42b、CD45RA、CD5、CD56、CD62P(P-セレクチン)、CD64、CD68、CD69、CD38、CD7、CD71、CD83、CD90 (Thy1)、FcεRIα、Siglec-8、CD235a、CD49d、CD45、CD8、CD45RO、マウスIgG1、κ、マウスIgG2a、κ、マウスIgG2b、κ、CD103、CD62L、CD11c、CD44、CD27、CD81、CD319(SLAMF7)、CD269(BCMA)、CD99、CD164、KCNJ3、CXCR4(CD184)、CD109、CD53、CD74、HLA-DR、DP、DQ、HLA-A、B、C、ROR1、アネキシンA1、またはCD20のうちのいずれかである、請求項7に記載の方法。
- 前記複数の細胞内で前記細胞の亜集団を発見することが、前記検体の前記測定した有無に従い、前記1つ以上の細胞をクラスター化することを含む、請求項1~8のいずれか1項に記載の方法。
- 前記同定したSNVもしくは前記同定したCNVに従い、前記1つ以上の細胞をクラスター化すること、または、前記検体の前記測定した存在に従い前記1つ以上の細胞をクラスター化することが、主成分分析(PCA)、線形判別分析(LDA)、T分布型確率的近傍埋め込み法(t-SNE)、または均一マニホールド近似及び投影(UMAP)のうちのいずれかから選択される次元削減分析を実施することを含む、請求項4または9に記載の方法。
- 前記エマルションに前記細胞を封入する前に、前記細胞を、複数の抗体コンジュゲートオリゴヌクレオチドに曝露することと、
前記細胞を洗浄し、過剰の抗体コンジュゲートオリゴヌクレオチドを除去することと
をさらに含む、請求項1~10のいずれか1項に記載の方法。 - 前記複数の抗体にコンジュゲートした前記オリゴヌクレオチドが、PCRハンドル、タグ配列、及び捕捉配列を含む、請求項11に記載の方法。
- 前記複数の細胞ががん細胞を含む、請求項1~12のいずれか1項に記載の方法。
- 前記がん細胞が、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、T細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のうちのいずれかである、請求項13に記載の方法。
- 前記第2のエマルションに、第1のバーコード及び第2のバーコードを、前記少なくとも1つのDNA分子、前記オリゴヌクレオチド、及び前記反応混合物と共に封入すること
をさらに含む、請求項1~14のいずれか1項に記載の方法。 - 第1の核酸が前記第1のバーコードを含む、請求項15に記載の方法。
- 第2の核酸が前記第2のバーコードを含む、請求項15または16に記載の方法。
- 前記第1のバーコード及び前記第2のバーコードが、同じバーコード配列を共有する、請求項15~17のいずれか1項に記載の方法。
- 前記第1のバーコード及び前記第2のバーコードが、異なるバーコード配列を共有する、請求項15~17のいずれか1項に記載の方法。
- 前記第1のバーコード及び前記第2のバーコードが、前記第2のエマルション内でビーズに解放可能に付着している、請求項15~19のいずれか1項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962885490P | 2019-08-12 | 2019-08-12 | |
US62/885,490 | 2019-08-12 | ||
PCT/US2020/045949 WO2021030447A1 (en) | 2019-08-12 | 2020-08-12 | Method, system and apparatus for multi-omic simultaneous detection of protein expression, single nucleotide variations, and copy number variations in the same single cells |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022544496A true JP2022544496A (ja) | 2022-10-19 |
Family
ID=74571255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022508757A Pending JP2022544496A (ja) | 2019-08-12 | 2020-08-12 | 同一のシングルセルにおける、タンパク質発現、一塩基変化、及びコピー数多型のマルチオミクス同時検出のための方法、システム、及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220325357A1 (ja) |
EP (1) | EP4013892A4 (ja) |
JP (1) | JP2022544496A (ja) |
CN (1) | CN114555827A (ja) |
AU (1) | AU2020327987A1 (ja) |
CA (1) | CA3147367A1 (ja) |
WO (1) | WO2021030447A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3156979A1 (en) * | 2019-10-05 | 2021-04-08 | Mission Bio, Inc. | Methods, systems and apparatus for copy number variations and single nucleotide variations simultaneously detected in single-cells |
WO2022182682A1 (en) * | 2021-02-23 | 2022-09-01 | 10X Genomics, Inc. | Probe-based analysis of nucleic acids and proteins |
CN114093421B (zh) * | 2021-11-23 | 2022-08-23 | 深圳吉因加信息科技有限公司 | 一种判别淋巴瘤分子亚型的方法、装置和存储介质 |
CN113836757A (zh) * | 2021-11-30 | 2021-12-24 | 滨州学院 | 有监督特征选择方法、装置以及电子设备 |
WO2023141604A2 (en) * | 2022-01-21 | 2023-07-27 | Mission Bio, Inc. | Methods of molecular tagging for single-cell analysis |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10995362B2 (en) * | 2011-01-31 | 2021-05-04 | Roche Sequencing Solutions, Inc. | Methods of identifying multiple epitopes in cells |
WO2014028378A2 (en) * | 2012-08-13 | 2014-02-20 | The Regents Of The University Of California | Methods and systems for detecting biological components |
EP3052940B1 (en) * | 2013-09-30 | 2021-05-26 | The Scripps Research Institute | Genotypic and phenotypic analysis of circulating tumor cells to monitor tumor evolution in prostate cancer patients |
WO2016145416A2 (en) * | 2015-03-11 | 2016-09-15 | The Broad Institute, Inc. | Proteomic analysis with nucleic acid identifiers |
CA2999888C (en) * | 2015-09-24 | 2024-04-09 | Abvitro Llc | Affinity-oligonucleotide conjugates and uses thereof |
SG11201907162TA (en) * | 2017-02-10 | 2019-09-27 | Univ Rockefeller | Methods for cell-type specific profiling to identify drug targets |
KR102438495B1 (ko) * | 2017-06-05 | 2022-09-01 | 백톤 디킨슨 앤드 컴퍼니 | 단일 세포를 위한 샘플 인덱싱 |
US20190112655A1 (en) * | 2017-10-18 | 2019-04-18 | Mission Bio, Inc. | Method, Systems and Apparatus for High-Throughput Single-Cell DNA Sequencing With Droplet Microfluidics |
WO2019084207A1 (en) * | 2017-10-24 | 2019-05-02 | Mission Bio, Inc. | METHOD, SYSTEMS AND APPARATUS FOR ANALYZING AN ISOLATED CELL |
US20190172582A1 (en) * | 2017-12-01 | 2019-06-06 | Illumina, Inc. | Methods and systems for determining somatic mutation clonality |
-
2020
- 2020-08-12 AU AU2020327987A patent/AU2020327987A1/en active Pending
- 2020-08-12 CN CN202080071424.0A patent/CN114555827A/zh active Pending
- 2020-08-12 CA CA3147367A patent/CA3147367A1/en active Pending
- 2020-08-12 EP EP20852716.8A patent/EP4013892A4/en active Pending
- 2020-08-12 JP JP2022508757A patent/JP2022544496A/ja active Pending
- 2020-08-12 US US17/634,841 patent/US20220325357A1/en active Pending
- 2020-08-12 WO PCT/US2020/045949 patent/WO2021030447A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA3147367A1 (en) | 2021-02-18 |
EP4013892A1 (en) | 2022-06-22 |
CN114555827A (zh) | 2022-05-27 |
EP4013892A4 (en) | 2023-09-20 |
AU2020327987A1 (en) | 2022-03-10 |
US20220325357A1 (en) | 2022-10-13 |
WO2021030447A1 (en) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210327538A1 (en) | Methods and systems for calling ploidy states using a neural network | |
US20220325357A1 (en) | Method and Apparatus for Multi-Omic Simultaneous Detection of Protein Expression, Single Nucleotide Variations, and Copy Number Variations in the Same Single Cells | |
AU2015279548B2 (en) | Methods of analyzing nucleic acids from individual cells or cell populations | |
US20240060134A1 (en) | Methods, systems and apparatus for copy number variations and single nucleotide variations simultaneously detected in single-cells | |
JP2023518250A (ja) | 全ゲノム増幅のためのシングルセルワークフロー | |
US20210277458A1 (en) | Methods, systems, and aparatus for nucleic acid detection | |
CN113795591A (zh) | 表征肿瘤并且识别肿瘤异质性的方法和系统 | |
US20230101896A1 (en) | Enhanced Detection of Target Nucleic Acids by Removal of DNA-RNA Cross Contamination | |
US20240110225A1 (en) | Method, system, and apparatus for analyzing an analyte of a single cell | |
WO2023154816A1 (en) | Systems and methods of detecting merged droplets in single cell sequencing | |
US20220282326A1 (en) | Method and Apparatus for Single-Cell Analysis for Determining a Cell Trajectory | |
US20230094303A1 (en) | Methods and Systems Involving Digestible Primers for Improving Single Cell Multi-Omic Analysis | |
WO2023141604A2 (en) | Methods of molecular tagging for single-cell analysis | |
Xie | Development of Highly Multiplex Nucleic Acid-Based Diagnostic Technologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230714 |