JP2022544496A

JP2022544496A - 同一のシングルセルにおける、タンパク質発現、一塩基変化、及びコピー数多型のマルチオミクス同時検出のための方法、システム、及び装置

Info

Publication number: JP2022544496A
Application number: JP2022508757A
Authority: JP
Inventors: ダリアディングラ; アイクウーイ; ペドロメンデス; デイビッドラフ; アダムシアンビ
Original assignee: ミッションバイオインコーポレイテッド
Priority date: 2019-08-12
Filing date: 2020-08-12
Publication date: 2022-10-19
Also published as: US20220325357A1; CA3147367A1; EP4013892A1; WO2021030447A1; CN114555827A; EP4013892A4; AU2020327987A1

Abstract

細胞集団のシングルセル分析により、個別細胞の細胞遺伝子型（例えば、一塩基バリアント及びコピー数多型）、ならびに表現型（例えば、タンパク質発現）が明らかとなる。一シナリオでは、個別細胞を、そのそれぞれの遺伝子型及び表現型に従い分類することができる。一シナリオでは、集団内の全ての細胞の遺伝子型及び表現型は、細胞の亜集団を同定するのに有益であり、これにより、集団内の不均質性が明らかとなる。細胞の亜集団の同定は、特にがんなどの疾患の文脈において、細胞生物学の理解を改善するために有益であり、さらに、診断及び治療法の設計をより良くするために有益である。【選択図】図１Ａ

Description

相互参照
本出願は、２０１９年８月１２日に出願された米国仮特許出願第６２／８８５，４９０号の利益及び優先権を主張し、これは、開示全体が、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。

背景
腫瘍のゲノム分析における近年の進歩により、がん疾患は、体細胞変化、クローン性増殖及び選択の反復プロセスにより進化することが明らかとなった。したがって、腫瘍内及び腫瘍間でのゲノム不均質性が、調査の主領域となっている。次世代シーケンシングは、がん生物学の理解に著しく寄与したものの、個別細胞のレベルにおける腫瘍の遺伝的不均一性は、バルク測定により提供される平均読出しでマスクされる。より少ない有病数変異を識別するために、非常に高いバルクシーケンスリード深さが必要である。選択した細胞集団内、及び当該集団にまたがる、希少な事象及び変異の同時発生は、このような平均シグナルを伴って不明瞭である。そのため、がん細胞などの細胞内で不均質な細胞集団を識別するのは困難であり、がん治療レジメンが有効なものとはならない。

概要
複数の細胞のシングルセル分析を行い、個別細胞の細胞遺伝子型及び表現型を測定するための実施形態を、本明細書で記載する。様々な実施形態では、個別細胞の細胞遺伝子型及び表現型は、以前に知られていないであろうこれらの遺伝子型及び表現型を特徴とする細胞亜集団を発見するのに有益である。これは、不均質な細胞集団が多くの場合存在するが、容易に調査または発見されないがんの文脈において特に有益である。細胞亜集団の識別は、疾患生物学の理解を改善し、その後、診断及び治療法のよりよい設計に有益である。

本明細書にて開示した実施形態は、細胞ゲノムＤＮＡから直接、細胞遺伝子型を測定することを伴う。具体的には、ゲノムＤＮＡは直接バーコード化、増幅、及び配列決定され、細胞遺伝子型（例えば、ＳＮＶ及びＣＮＶ）を測定する。ゲノムＤＮＡから細胞遺伝子型を直接測定することを伴うこのような方法は、さほど直接的でない方法と比較して好ましい。例えば、さほど直接的でない方法は、ＲＮＡ転写産物から逆転写したｃＤＮＡを配列決定することにより、細胞遺伝子型の間接読出しを提供することを伴う。ゲノムＤＮＡから細胞遺伝子型を直接測定することを伴う、本明細書で開示される方法は、１）（さほど直接的でない方法が、コード領域に帯する細胞遺伝子型を測定するのみである一方で）コード領域及び非コード領域の両方にまたがる、細胞遺伝子型のより広範な理解を達成し、２）逆転写を避けることで、ＳＮＶ及びＣＮＶなどの細胞変異におけるコールの正確性を改善し（例えば、逆転写により生じるエラー及び／または処理アーチファクトを避け）、３）逆転写に必要な試薬（例えば、逆転写酵素）を含めることで生じるシングルセルワークフロープロセスのコストを低下させる、という利点を含む。

本明細書において、複数の細胞の分析方法であって、当該方法が、当該複数の細胞の１つ以上の細胞に対して、当該細胞を、試薬を含むエマルションに封入することであって、当該細胞が、少なくとも１つのＤＮＡ分子と、少なくとも１つの検体結合抗体がコンジュゲートしたオリゴヌクレオチドと、を含む、上記封入することと、当該細胞を当該エマルション中で溶解し、当該少なくとも１つのＤＮＡ分子と当該オリゴヌクレオチドとを含む細胞溶解物を生成することと、当該少なくとも１つのＤＮＡ分子と当該オリゴヌクレオチドとを含む当該細胞溶解物を、反応混合物と共に、第２のエマルション中で封入することと、当該第２のエマルション中で、当該反応混合物を用いて核酸増幅反応を行いアンプリコンを生成することであって、当該アンプリコンが、上記少なくとも１つのＤＮＡ分子のうちの１つに由来する第１のアンプリコンと、上記オリゴヌクレオチドに由来する第２のアンプリコンとを含む、上記生成することと、上記第１のアンプリコン及び上記第２のアンプリコンを配列決定することと、上記細胞の１つ以上の変異を、少なくとも上記配列決定した第１のアンプリコンを用いて測定することと、少なくとも上記第２のアンプリコンを用いて検体の有無を測定することと、細胞の亜集団を、上記複数の細胞内で発見することであって、当該細胞の亜集団が、上記１つ以上の変異、及び、上記検体の有無により同定される、上記発見することと、を含む、上記方法を開示する。

様々な実施形態では、１つ以上の変異は、一塩基バリアント（ＳＮＶ）またはコピー数多型（ＣＮＶ）を含む。様々な実施形態では、１つ以上の変異は、一塩基バリアント（ＳＮＶ）及びコピー数多型（ＣＮＶ）を含む。様々な実施形態では、複数の細胞内で細胞亜集団を発見することは、同定したＳＮＶまたはＣＮＶに従い、１つ以上の細胞をクラスター化することを含む。

様々な実施形態では、ＳＮＶまたはＣＮＶは、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、Ｔ細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫に関連する遺伝子において同定される。様々な実施形態では、ＳＮＶまたはＣＮＶは、ＡＢＬ１、ＧＮＢ１、ＫＭＴ２Ｄ、ＰＬＣＧ２、ＧＮＡ１３、ＡＴＭ、ＢＲＡＦ、ＪＡＫ３、ＡＤＯ、ＤＮＭＴ３Ａ、ＳＥＲＰＩＮＡ１、ＸＰＯ１、ＰＩＭ１、ＣＣＮＤ１、ＦＬＴ３、ＳＴＡＴ３、ＡＫＴ１、ＦＡＴ１、ＣＴＣＦ、ＴＰ５３、ＮＯＴＣＨ１、ＫＲＡＳ、ＡＬＫ、ＭＹＢ、ＤＮＭ２、ＤＤＸ３Ｘ、ＣＤ７９Ａ、ＵＢＲ５、ＰＴＥＮ、ＡＰＣ、ＰＡＸ５、ＲＵＮＸ１、ＭＡＰ２Ｋ１、ＣＤ７９Ｂ、ＢＩＲＣ３、ＫＭＴ２Ｃ、ＡＲ、ＣＨＤ４、ＰＨＦ６、ＰＯＴ１、ＣＡＬＲ、ＴＥＴ２、ＯＲＡＩ１、ＯＶＧＰ１、ＺＭＹＭ３、ＭＹＣ、ＧＡＴＡ２、ＣＡＲＤ１１、ＴＰ５３ＢＰ１、ＴＢＬ１ＸＲ１、ＢＴＫ、ＷＨＳＣ１、ＭＰＬ、ＦＡＳ、ＣＤＨ１、ＩＫＺＦ３、ＬＲＦＮ２、ＥＧＲ２、ＳＯＣＳ１、ＰＴＰＮ１１、ＰＬＣＧ１、ＣＤＫ４、ＷＴＩＰ、ＺＦＨＸ４、ＭＥＤ１２、ＴＮＦＲＳＦ１４、ＦＡＭ４６Ｃ、ＣＤＫＮ２Ａ、ＢＣＯＲ、ＳＯＲＣＳ１、ＲＰＳ１５、ＴＮＦＡＩＰ３、ＩＲＦ４、ＣＢＬ、ＣＳＦ１Ｒ、ＲＰＬ２２、ＢＴＧ１、ＳＴＡＴ６、ＰＩＫ３ＣＡ、ＧＮＡＳ、ＣＴＮＮＢ１、ＡＳＸＬ２、ＢＣＬ１１Ｂ、ＥＺＨ２、ＤＤＲ２、ＡＴＲＸ、ＭＹＤ８８、ＡＲＩＤ１Ａ、ＦＧＦＲ３、ＲＡＤ２１、ＥＧＦＲ、ＩＫＺＦ１、ＳＭＡＲＣＡ４、ＳＥＴＤ２、ＪＡＫ２、ＥＲＢＢ２、ＫＬＦ９、ＥＲＧ、ＣＲＥＢＢＰ、ＲＢ１、ＣＨＥＫ２、ＥＲＢＢ３、ＥＴＶ６、ＲＰＬ１０、ＢＣＬ２、ＤＩＳ３、ＩＤＨ１、ＥＲＢＢ４、ＮＲＡＳ、ＮＦＫＢＩＥ、ＮＯＴＣＨ２、ＥＳＲ１、ＨＣＮ４、ＳＦ３Ｂ１、ＳＴＡＴ５Ｂ、ＣＣＮＤ３、Ｕ２ＡＦ１、ＦＢＸＷ７、ＣＮＯＴ３、ＥＰ３００、ＣＳＦ３Ｒ、ＦＧＦＲ１、ＵＳＰ９Ｘ、ＷＴ１、ＩＤＨ２、ＦＧＦＲ２、ＳＬＣ２５Ａ３３、ＳＨ２Ｂ３、ＮＦ１、ＺＦＰ３６Ｌ２、ＫＩＴ、ＴＲＡＦ３、ＳＥＴＢＰ１、ＤＮＡＨ５、ＮＣＯＲ１、ＡＢＬ１、ＡＳＸＬ１、ＧＮＡ１１、ＥＰＯＲ、ＧＮＡＱ、ＸＢＰ１、ＣＤＫＮ１Ｂ、ＵＳＨ２Ａ、ＮＰＭ１、ＨＮＦ１Ａ、ＦＲＥＭ２、ＬＥＦ１、ＨＲＡＳ、ＯＰＮ５、ＺＲＳＲ２、ＴＳＰＹＬ２、ＬＭＯ２、ＪＡＫ１、Ｂ２Ｍ、ＴＡＬ１、ＭＧＡ、ＮＦＫＢＩＡ、ＡＲＡＦ、ＺＥＢ２、ＫＤＲ、ＩＬ７Ｒ、ＳＬＣ５Ａ１、ＭＹＣＮ、ＰＲＤＭ１、ＭＡＰ２Ｋ２、ＰＨＩＰ、ＭＥＴ、ＭＬＨ１、ＲＥＬ、ＺＮＦ２１７、ＮＯＳ１、ＭＴＯＲ、ＫＤＭ６Ａ、ＳＰＴＢＮ５、ＳＵＺ１２、ＵＢＡ２、ＰＤＧＦＲＡ、ＰＩＫ３Ｒ１、ＧＡＴＡ３、ＣＨＤ２、ＨＤＡＣ７、ＳＭＣ１Ａ、ＲＡＦ１、ＭＤＧＡ２、ＵＳＰ７、ＳＰＥＮ、ＲＥＴ、ＺＦＲ２、ＳＭＡＤ４、ＩＴＳＮ１、ＳＭＡＲＣＢ１、ＢＣＯＲＬ１、ＳＭＣ３、ＳＭＯ、ＲＰＬ５、ＳＲＣ、ＦＯＸＯ１、ＳＴＫ１１、ＥＢＦ１、ＰＩＫ３ＣＤ、ＫＭＴ２Ａ、ＲＨＯＡ、ＣＸＣＲ４、ＰＰＭ１Ｄ、ＶＨＬ、ＬＲＰ１Ｂ、及びＳＴＡＧ２のいずれかにおいて同定される。

様々な実施形態では、検体の有無を測定することは、検体の発現レベルを測定することを含み、検体は、オリゴヌクレオチドにコンジュゲートした抗体により結合されている。様々な実施形態では、検体は、ＨＬＡ－ＤＲ、ＣＤ１０、ＣＤ１１７、ＣＤ１１ｂ、ＣＤ１２３、ＣＤ１３、ＣＤ１３８、ＣＤ１４、ＣＤ１４１、ＣＤ１５、ＣＤ１６、ＣＤ１６３、ＣＤ１９、ＣＤ１９３（ＣＣＲ３）、ＣＤ１ｃ、ＣＤ２、ＣＤ２０３ｃ、ＣＤ２０９、ＣＤ２２、ＣＤ２５、ＣＤ３、ＣＤ３０、ＣＤ３０３、ＣＤ３０４、ＣＤ３３、ＣＤ３４、ＣＤ４、ＣＤ４２ｂ、ＣＤ４５ＲＡ、ＣＤ５、ＣＤ５６、ＣＤ６２Ｐ（Ｐ－セレクチン）、ＣＤ６４、ＣＤ６８、ＣＤ６９、ＣＤ３８、ＣＤ７、ＣＤ７１、ＣＤ８３、ＣＤ９０（Ｔｈｙ１）、ＦｃεＲＩα、Ｓｉｇｌｅｃ－８、ＣＤ２３５ａ、ＣＤ４９ｄ、ＣＤ４５、ＣＤ８、ＣＤ４５ＲＯ、マウスＩｇＧ１、κ、マウスＩｇＧ２ａ、κ、マウスＩｇＧ２ｂ、κ、ＣＤ１０３、ＣＤ６２Ｌ、ＣＤ１１ｃ、ＣＤ４４、ＣＤ２７、ＣＤ８１、ＣＤ３１９（ＳＬＡＭＦ７）、ＣＤ２６９（ＢＣＭＡ）、ＣＤ９９、ＣＤ１６４、ＫＣＮＪ３、ＣＸＣＲ４（ＣＤ１８４）、ＣＤ１０９、ＣＤ５３、ＣＤ７４、ＨＬＡ－ＤＲ、ＤＰ、ＤＱ、ＨＬＡ－Ａ、Ｂ、Ｃ、ＲＯＲ１、アネキシンＡ１、またはＣＤ２０のうちのいずれかである。

様々な実施形態では、複数の細胞内で細胞亜集団を発見することは、測定した検体の有無に従い、１つ以上の細胞をクラスター化することを含む。

様々な実施形態では、同定したＳＮＶもしくはＣＮＶに従い、１つ以上の細胞をクラスター化すること、または、測定した検体の存在に従い１つ以上の細胞をクラスター化することは、主成分分析（ＰＣＡ）、線形判別分析（ＬＤＡ）、Ｔ分布型確率的近傍埋め込み法（ｔ－ＳＮＥ）、または、均一マニホールド近似及び投影（ＵＭＡＰ）のうちのいずれかから選択される、次元削減分析を実施することを含む。

様々な実施形態では、開示した方法は、エマルションに細胞を封入する前に、細胞を、複数の抗体コンジュゲートオリゴヌクレオチドに曝露することと、細胞を洗浄し、過剰の抗体コンジュゲートオリゴヌクレオチドを除去することと、をさらに含む。様々な実施形態では、複数の抗体にコンジュゲートしたオリゴヌクレオチドは、ＰＣＲハンドル、タグ配列、及び捕捉配列を含む。様々な実施形態では、複数の細胞はがん細胞を含む。様々な実施形態では、がん細胞は、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、Ｔ細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のうちのいずれかである。

様々な実施形態では、方法は、第２のエマルションに、第１のバーコード及び第２のバーコードを、少なくとも１つのＤＮＡ分子、オリゴヌクレオチド、及び反応混合物と共に封入することをさらに含む。様々な実施形態では、第１の核酸は第１のバーコードを含む。様々な実施形態では、第２の核酸は第２のバーコードを含む。様々な実施形態では、第１のバーコード及び第２のバーコードは、同じバーコード配列を共有する。様々な実施形態では、第１のバーコード及び第２のバーコードは、異なる配列を共有する。様々な実施形態では、第１のバーコード及び第２のバーコードは、第２のエマルション内でビーズに解放可能に付着している。

本発明のこれら及び他の特徴、態様、及び利点は、以下の説明、及び添付の図面に関してよりよく理解されるであろう。

一実施形態に従いシングルセル分析を行うためのシングルセルワークフロー装置及び演算装置を含む、全体のシステム環境を示す。一実施形態に従った、配列決定のために単一細胞を処理し、増幅した核酸分子を生成する実施形態を示す。個別細胞に由来するシーケンスリードを用いて細胞遺伝子型及び表現型を測定し、細胞遺伝子型及び表現型を用いて細胞を分析するフロープロセスを示す。Ａ～Ｃは、一実施形態に従った、第１のエマルション内での検体放出工程を示す。一実施形態に従った、抗体コンジュゲートオリゴヌクレオチドのプライミング及びバーコード化を示す。一実施形態に従った、ゲノムＤＮＡのプライミング及びバーコード化を示す。一実施形態に従った、シングルセルワークフローを用いて分析した例示的な遺伝子標的及びタンパク質標的を示す。一実施形態に従った、シングルセルワークフローを用いて分析した例示的な遺伝子標的及びタンパク質標的を示す。図１～６を参照して記載するシステム及び方法を実装するための、例示的な演算装置を示す。異なるタンパク質の発現に従った、細胞のクラスター化を示す。細胞株を互いに区別する、４つの異なる細胞株及びＳＮＶを示す。細胞遺伝子型がさらに重なった、タンパク質発現に従った細胞のクラスター化を示す。４つの細胞株にまたがる１３個の遺伝子に対する、観察された遺伝子レベルコピー数、及び、ＣＯＳＭＩＣデータベースでの既知のレベルに対する、観察された遺伝子レベルコピー数の相関を示す。図１０－１の説明を参照のこと。ＳＮＶにより細胞型がさらに重なった、ＣＮＶに従った細胞のクラスター化を示す。シングルセルから入手したＳＮＶ、ＣＮＶ、またはタンパク質データのうちの１つを用いる、混合集団からの、異なる細胞の亜集団のクラスター化及び識別を示す。シングルセルから入手したＳＮＶ、ＣＮＶ、及びタンパク質データのうちの少なくとも２つを用いる、混合集団からの、異なる細胞の亜集団のクラスター化及び識別を示す。

詳細な説明
定義
請求項及び明細書で使用される用語は、特に明記しない限り、以下に記載するように定義する。

用語「対象」または「患者」は、同じ意味で用いられ、生体、ヒトまたは非ヒト、哺乳類または非哺乳類、雄または雌を包含する。

用語「試料」または「試験試料」は、静脈穿刺、排泄、射精、マッサージ、生検、針穿刺吸引、洗浄試料、擦過、外科的切開、または、当該技術分野において公知の他の介入もしくは他の手段を含む手段により対象から採取された、シングルセルもしくは複数細胞、または細胞の断片、または、血液試料などの体液のアリコートを含むことができる。

用語「検体」とは、細胞の構成成分を指す。細胞検体は、細胞の状態、挙動、または軌道を理解するのに有益である。したがって、本明細書に記載するシステム及び方法を用いて、細胞の１つ以上の検体のシングルセル分析を行うことは、細胞の状態または挙動を測定するのに有益である。検体の例としては、核酸（例えばＲＮＡ、ＤＮＡ、ｃＤＮＡ）、タンパク質、ペプチド、抗体、抗体断片、多糖類、糖、脂質、小分子、またはこれらの組み合わせが挙げられる。特定の実施形態では、シングルセル分析は、タンパク質及びＤＮＡなどの、２つの異なる検体を分析することを伴う。特定の実施形態では、シングルセル分析は、ＲＮＡ、ＤＮＡ、及びタンパク質などの、細胞の３つ以上の異なる検体を分析することを伴う。

語句「細胞表現型」とは、１つ以上のタンパク質の細胞発現（例えば、細胞プロテオミクス）を意味する。様々な実施形態では、細胞表現型は、シングルセル分析を用いて測定される。様々な実施形態では、細胞表現型は、タンパク質のパネル（例えば、がん進行に関与するタンパク質のパネル）の発現を意味することができる。様々な実施形態では、タンパク質パネルは、以下の血液系腫瘍：急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄病、骨髄増殖性腫瘍、またはＴ細胞リンパ腫のいずれかに関与するタンパク質を含む。様々な実施形態では、タンパク質パネルは、以下の充実性腫瘍：侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のいずれかに関与するタンパク質を含む。パネル内の例示的実施例は、ＨＬＡ－ＤＲ、ＣＤ１０、ＣＤ１１７、ＣＤ１１ｂ、ＣＤ１２３、ＣＤ１３、ＣＤ１３８、ＣＤ１４、ＣＤ１４１、ＣＤ１５、ＣＤ１６、ＣＤ１６３、ＣＤ１９、ＣＤ１９３（ＣＣＲ３）、ＣＤ１ｃ、ＣＤ２、ＣＤ２０３ｃ、ＣＤ２０９、ＣＤ２２、ＣＤ２５、ＣＤ３、ＣＤ３０、ＣＤ３０３、ＣＤ３０４、ＣＤ３３、ＣＤ３４、ＣＤ４、ＣＤ４２ｂ、ＣＤ４５ＲＡ、ＣＤ５、ＣＤ５６、ＣＤ６２Ｐ（Ｐ－セレクチン）、ＣＤ６４、ＣＤ６８、ＣＤ６９、ＣＤ３８、ＣＤ７、ＣＤ７１、ＣＤ８３、ＣＤ９０（Ｔｈｙ１）、ＦｃεＲＩα、Ｓｉｇｌｅｃ－８、ＣＤ２３５ａ、ＣＤ４９ｄ、ＣＤ４５、ＣＤ８、ＣＤ４５ＲＯ、マウスＩｇＧ１、κ、マウスＩｇＧ２ａ、κ、マウスＩｇＧ２ｂ、κ、ＣＤ１０３、ＣＤ６２Ｌ、ＣＤ１１ｃ、ＣＤ４４、ＣＤ２７、ＣＤ８１、ＣＤ３１９（ＳＬＡＭＦ７）、ＣＤ２６９（ＢＣＭＡ）、ＣＤ９９、ＣＤ１６４、ＫＣＮＪ３、ＣＸＣＲ４（ＣＤ１８４）、ＣＤ１０９、ＣＤ５３、ＣＤ７４、ＨＬＡ－ＤＲ、ＤＰ、ＤＱ、ＨＬＡ－Ａ、Ｂ、Ｃ、ＲＯＲ１、アネキシンＡ１、またはＣＤ２０のいずれかを含むことができる。

語句「細胞遺伝子型」とは、細胞の遺伝子構造を意味し、１つ以上の遺伝子、及び／または細胞の対立遺伝子（例えばホモ接合またはヘテロ接合）の組み合わせを意味することができる。語句「細胞遺伝子型」とは、一塩基多型（ＳＮＰ）、一塩基バリアント（ＳＮＶ）、挿入、欠失、ノックイン、ノックアウト、コピー数多型（ＣＮＶ）、重複、転座、及びヘテロ接合性の喪失（ＬＯＨ）を含む、細胞の１つ以上の変異多型をさらに包含する。様々な実施形態では、細胞表現型は、シングルセル分析を用いて測定される。様々な実施形態では、細胞表現型は、遺伝子のパネル（例えば、がん進行に関与する遺伝子のパネル）の発現を意味することができる。様々な実施形態では、パネルは、以下の血液系腫瘍：急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、またはＴ細胞リンパ腫のいずれかに関与する遺伝子を含む。様々な実施形態では、パネルは、以下の充実性腫瘍：侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のいずれかに関与する遺伝子を含む。例えば、急性リンパ性白血病に関しては、以下の遺伝子：ＡＳＸＬ１、ＧＡＴＡ２、ＫＩＴ、ＰＴＰＮ１１、ＴＥＴ２、ＤＮＭＴ３Ａ、ＩＤＨ１、ＫＲＡＳ、ＲＵＮＸ１、ＴＰ５３、ＥＺＨ２、ＩＤＨ２、ＮＰＭ１、ＳＦ３Ｂ１、Ｕ２ＡＦ１、ＦＬＴ３、ＪＡＫ２、ＮＲＡＳ、ＳＲＳＦ２、またはＷＴ１が調査される。

いくつかの実施形態では、本明細書に記載する個別の要素はドロップレットである。用語「エマルション」、「滴」、「ドロップレット」、及び「マイクロドロップレット」は、本明細書では同じ意味で用いられ、第１の流体相と不混和性である第２の流体相（例えば、油）により結合した、少なくとも第１の流体相、例えば水相（例えば水）を含有する、小型で、一般的には球状の構造体を意味する。いくつかの実施形態では、本開示に従ったドロップレットは、例えば、第２の不混和性流体相、例えば水相流体（例えば水）により結合した、第１の流体相、例えば油を含有することができる。いくつかの実施形態では、第２の流体相は、不混和性相キャリア流体である。故に、本開示に従ったドロップレットは、油中水型エマルション、または水中油型エマルションとして提供されてよい。ドロップレットは、個別の要素に対して、本明細書に記載するようにサイジングされる、及び／または形状化されることができる。例えば、本開示に従ったドロップレットは一般に、直径が１μｍ～１０００μｍ（両端を含む）の範囲である。本開示に従ったドロップレットを使用して、細胞、核酸（例えばＤＮＡ）、酵素、試薬、反応混合物、及び様々な他の構成成分を封入することができる。用語「エマルション」は、マイクロ流体デバイス内で、またはこれにより作製され、かつ／または、マイクロ流体デバイスにより流されるか、もしくはアプライされるエマルションを指すために使用することができる。

用語「抗体」は、モノクローナル抗体（完全長モノクローナル抗体を含む）、ポリクローナル抗体、多重特異性抗体（例えば二重特異性抗体）、及び、抗原結合性である抗体断片、例えば、抗体またはその抗原結合断片を包含する。本明細書で使用する場合、「抗体断片」、及びそのあらゆる文法的変形は、インタクトな抗体の抗原結合部位または可変領域を含む、インタクトな抗体の一部として定義され、当該部分は、インタクトな抗体のＦｃ領域の、定常重鎖ドメイン（即ち、抗体アイソタイプに応じてＣＨ２、ＣＨ３、及びＣＨ４）を非含有である。抗体断片の例としては、Ｆａｂ、Ｆａｂ’、Ｆａｂ’－ＳＨ、Ｆ（ａｂ’）_２、及びＦｖ断片；ダイアボディ；ならびに、連続したアミノ酸残基の１つの中断されていない配列からなる一次構造を有するポリペプチドである任意の抗体断片（本明細書では、「一本鎖抗体断片」または「一本鎖ポリペプチド」と呼ばれる）が挙げられる。

「相補性」とは、核酸が、従来のワトソン・クリック形式または従来型とは異なる他の形式のいずれかによって、別の核酸配列と水素結合（複数可）を形成する能力、すなわち、別の核酸配列とハイブリダイズする能力を指す。本明細書で使用する場合、「ハイブリダイゼーション」とは、分子が、特定のヌクレオチド配列のみと、低ストリンジェント、中ストリンジェントまたは高ストリンジェントな条件で結合、二本鎖形成またはハイブリダイズすることを指す（その配列が、複合混合物（例えば全細胞）のＤＮＡまたはＲＮＡに存在する場合を含む）。例えば、Ａｕｓｕｂｅｌ，ｅｔａｌ．，ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓＩｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ，Ｎ．Ｙ．，１９９３を参照されたい。ポリヌクレオチドのある特定の位置におけるヌクレオチドが、アンチパラレルなＤＮＡ鎖またはＲＮＡ鎖の同じ位置におけるヌクレオチドとワトソン・クリック対を形成できる場合には、そのポリヌクレオチドと、そのＤＮＡ分子またはＲＮＡ分子は、その位置において、互いに相補的である。そのポリヌクレオチドと、そのＤＮＡ分子またはＲＮＡ分子は、所望のプロセスに影響が及ぶように、各分子における対応する位置が十分な数、互いにハイブリダイズまたはアニールすることができるヌクレオチドで占められている場合には、互いに「実質的に相補的」である。相補的な配列は、ストリンジェントな条件下でアニールして、相補鎖合成起点として機能する３’末端をもたらすことのできる配列である。

「同一性」とは、当該技術分野において知られているように、２つ以上のポリペプチド配列または２つ以上のポリヌクレオチド配列間の関係であって、それらの配列を比較することによって求めたものである。当該技術分野においては、「同一性」とは、ポリペプチド配列またはポリヌクレオチド配列間の関連度であって、それらの配列からなる鎖間の一致率を求めたものも意味する。「同一性」及び「類似性」は、既知の方法によって容易に算出でき、その方法としては、ＣｏｍｐｕｔａｔｉｏｎａｌＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，Ｌｅｓｋ，Ａ．Ｍ．，ｅｄ．，ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ＮｅｗＹｏｒｋ，１９８８、Ｂｉｏｃｏｍｐｕｔｉｎｇ：ＩｎｆｏｒｍａｔｉｃｓａｎｄＧｅｎｏｍｅＰｒｏｊｅｃｔｓ，Ｓｍｉｔｈ，Ｄ．Ｗ．，ｅｄ．，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮｅｗＹｏｒｋ，１９９３、ＣｏｍｐｕｔｅｒＡｎａｌｙｓｉｓｏｆＳｅｑｕｅｎｃｅＤａｔａ，ＰａｒｔＩ，Ｇｒｉｆｆｉｎ，Ａ．Ｍ．，ａｎｄＧｒｉｆｆｉｎ，Ｈ．Ｇ．，ｅｄｓ．，ＨｕｍａｎａＰｒｅｓｓ，ＮｅｗＪｅｒｓｅｙ，１９９４、ＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ｖｏｎＨｅｉｎｊｅ，Ｇ．，ＡｃａｄｅｍｉｃＰｒｅｓｓ，１９８７、ＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＰｒｉｍｅｒ，Ｇｒｉｂｓｋｏｖ，Ｍ．ａｎｄＤｅｖｅｒｅｕｘ，Ｊ．，ｅｄｓ．，ＭＳｔｏｃｋｔｏｎＰｒｅｓｓ，ＮｅｗＹｏｒｋ，１９９１及びＣａｒｉｌｌｏ，Ｈ．，ａｎｄＬｉｐｍａｎ，Ｄ．，ＳｉａｍＪ．ＡｐｐｌｉｅｄＭａｔｈ．，４８：１０７３（１９８８）に記載されているものが挙げられるが、これらに限らない。加えて、同一性パーセントの値は、ＶｅｃｔｏｒＮＴＩＳｕｉｔｅ８．０（Ｉｎｆｏｒｍａｘ、Ｆｒｅｄｅｒｉｃｋ，Ｍｄ．）のＡｌｉｇｎＸというコンポーネントのデフォルト設定を用いて生成したアミノ酸配列アラインメント及びヌクレオチド配列アラインメントから得ることができる。同一性を求める好ましい方法は、試験する配列間の一致率が最も大きくなるように設計する。同一性及び類似性を求める方法は、公的に入手可能なコンピュータプログラムに体系化されている。２つの配列間の同一性及び類似性求めるための例示的なコンピュータプログラムの方法としては、ＧＣＧプログラムパッケージ（Ｄｅｖｅｒｅｕｘ，Ｊ．，ｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ１２（１）：３８７（１９８４））、ＢＬＡＳＴＰ、ＢＬＡＳＴＮ及びＦＡＳＴＡ（Ａｔｓｃｈｕｌ，Ｓ．Ｆ．ｅｔａｌ．，Ｊ．Ｍｏｌｅｃ．Ｂｉｏｌ．２１５：４０３－４１０（１９９０））が挙げられるが、これらに限らない。ＢＬＡＳＴＸというプログラムは、ＮＣＢＩ及びその他の供給源から公的に入手可能である（ＢＬＡＳＴＭａｎｕａｌ，Ａｌｔｓｃｈｕｌ，Ｓ．，ｅｔａｌ．，ＮＣＢＩＮＬＭＮＩＨＢｅｔｈｅｓｄａ，Ｍｄ．２０８９４、Ａｌｔｓｃｈｕｌ，Ｓ．，ｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３－４１０（１９９０））。周知であるＳｍｉｔｈＷａｔｅｒｍａｎアルゴリズムを用いて、同一性を求めてもよい。

「増幅する」、「増幅すること」、「増幅反応」という用語、及びそれらの類似表現は概して、核酸分子の少なくとも一部（鋳型核酸分子という）を複製またはコピーして、追加の核酸分子を少なくとも１つもたらすいずれかの作用またはプロセスを指す。その追加の核酸分子は任意に、その鋳型核酸分子の少なくとも相当な部分と実質的に同一であるかまたは実質的に相補的である配列を含む。その鋳型核酸分子は、一本鎖であることも、二本鎖であることもでき、その追加の核酸分子は独立して、一本鎖であることも、二本鎖であることもできる。いくつかの実施形態では、増幅には、核酸分子の少なくとも相当な部分を少なくとも１コピー作製するか、または核酸分子の少なくとも相当な部分と相補的である核酸配列を少なくとも１コピー作製するための、酵素を触媒とする鋳型依存性のｉｎｖｉｔｒｏ反応が含まれる。増幅には任意に、核酸分子の線形的または指数関数的な複製が含まれる。いくつかの実施形態では、このような増幅は、等温条件を用いて行い、別の実施形態では、このような増幅には、熱サイクリングを含めることができる。いくつかの実施形態では、増幅は、１回の増幅反応で複数の標的配列を同時に増幅することを含むマルチプレックス増幅である。その標的配列の少なくともいくつかは、１回の増幅反応に含まれる同じ核酸分子または異なる標的核酸分子に位置することができる。いくつかの実施形態では、「増幅」には、ＤＮＡベース及びＲＮＡベースの核酸の少なくとも相当部分を単独で、または組み合わせて増幅することが含まれる。その増幅反応は、一本鎖または二本鎖の核酸基質を含むことができ、さらに、当業者に知られている増幅プロセスのいずれかを含むことができる。いくつかの実施形態では、その増幅反応は、ポリメラーゼ連鎖反応（ＰＣＲ）を含むことができる。いくつかの実施形態では、増幅反応としては、ＬＡＭＰなどの等温増幅反応が挙げられる。本発明では、核酸の「合成」及び「増幅」という用語を使用する。本発明では、核酸の合成とは、合成起点として機能するオリゴヌクレオチドから、核酸を延長または伸長させることを意味する。この合成のみならず、他の核酸の形成と、この形成された核酸の延長反応または伸長反応も連続的に行う場合、これらの一連の反応は、包括して増幅という。採用した増幅技術によって作製されたポリ核酸は一般に、「アンプリコン」または「増幅産物」という。

ＰＣＲベースのアッセイ、例えば定量ＰＣＲ（ｑＰＣＲ）、または等温増幅のようないずれかの核酸増幅法を用いて、別個の物体、またはその構成成分の１つ以上、例えば、その物体に封入された細胞に存在するある特定の核酸、例えば、対象とする遺伝子の存在を検出してよい。このようなアッセイは、マイクロフルイディクスデバイスもしくはその一部、またはいずれかの他の好適な位置にある別個の物体に適用できる。このような増幅またはＰＣＲベースのアッセイの条件は、経時的に核酸の増幅を検出することを含んでよく、１つ以上の方法が異なっていてよい。

本明細書に示されているある特定の実施形態で用いられる増幅反応では、多くの核酸ポリメラーゼを使用することができ、そのポリメラーゼには、ヌクレオチド（そのアナログを含む）が重合して核酸鎖となるのを触媒できるいずれの酵素も含まれる。ヌクレオチドのこのような重合は、鋳型依存的に行うことができる。このようなポリメラーゼとしては、天然のポリメラーゼ、そのサブユニット及びトランケート体のいずれか、変異ポリメラーゼ、バリアントポリメラーゼ、組み換えポリメラーゼ、融合ポリメラーゼ、または別段に操作したポリメラーゼ、化学的に改変したポリメラーゼ、合成の分子またはアセンブリ、ならびに上記のような重合を触媒する能力を保持するこれらのアナログ、誘導体または断片のいずれかを挙げることができるが、これらに限らない。任意に、そのポリメラーゼは、１つ以上のアミノ酸が他のアミノ酸に置換されているか、そのポリメラーゼから１つ以上のアミノ酸が挿入もしくは欠失されているか、または２つ以上のポリメラーゼの一部分が連結されていることを伴う変異を１つ以上含む変異ポリメラーゼであることができる。典型的には、そのポリメラーゼは、ヌクレオチドの結合及び／またはヌクレオチドの重合の触媒を行うことができる活性部位を１つ以上含む。いくつかの例示的なポリメラーゼとしては、ＤＮＡポリメラーゼ及びＲＮＡポリメラーゼが挙げられるが、これらに限らない。本明細書で使用する場合、「ポリメラーゼ」という用語及びその類似表現には、連結し合った少なくとも２つの部分を含む融合タンパク質も含まれ、その第１の部分は、ヌクレオチドが重合して核酸鎖となるのを触媒できるペプチドを含むとともに、第２のポリペプチドを含む第２の部分に連結されている。いくつかの実施形態では、その第２のポリペプチドは、レポーター酵素またはプロセッシビティ向上ドメインを含むことができる。任意に、そのポリメラーゼは、５’エキソヌクレアーゼ活性またはターミナルトランスフェラーゼ活性を有することができる。いくつかの実施形態では、そのポリメラーゼは任意に、例えば、熱を利用するか、化学物質によるか、または新たな量のポリメラーゼを反応混合物に再度加えることによって再活性化させることができる。いくつかの実施形態では、そのポリメラーゼとしては、任意に再活性化させることができるホットスタートポリメラーゼまたはアプタマーベースのポリメラーゼを挙げることができる。

「標的プライマー」または「標的特異的プライマー」という用語、及びそれらの類似表現は、結合部位の配列と相補的であるプライマーを指す。標的プライマーは概して、標的核酸配列と少なくとも部分的に相補的である配列を少なくとも１つ含む一本鎖または二本鎖のポリヌクレオチド、典型的にはオリゴヌクレオチドである。

「フォワードプライマー結合部位」及び「リバースプライマー結合部位」とは、鋳型ＤＮＡ及び／またはアンプリコンの領域のうち、フォワードプライマー及びリバースプライマーが結合する領域を指す。これらのプライマーは、元の鋳型ポリヌクレオチドの領域のうち、増幅の際に指数関数的に増幅される領域を定める働きをする。いくつかの実施形態では、追加のプライマーが、フォワードプライマー及び／またはリバースプライマーの５’側の領域に結合してよい。このような追加のプライマーを用いる場合、フォワードプライマー結合部位及び／またはリバースプライマー結合部位は、これらの追加のプライマーの結合領域と、そのプライマー自体の結合領域を含んでよい。例えば、いくつかの実施形態では、本発明の方法では、フォワードプライマー結合領域及び／またはリバースプライマー結合領域の５’側に位置する領域に結合する追加のプライマーを１つ以上使用してよい。このような方法は例えば、「置換プライマー」または「アウタープライマー」の使用について開示しているＷＯ００２８０８２に開示されている。

「バーコード」核酸識別配列は、核酸に組み込むか、またはプライマーに連結して、独立したシーケンシング及び識別が、同一の試料に存在する分子に由来する情報及び識別に関係するバーコードを介して互いに関連することを可能にすることができる。個別の構成要素の中で核酸にバーコードを取り付けるために使用可能な、多数の技術が存在する。例えば、標的核酸をまず増幅して、より短い片に断片化してもよいし、しなくてもよい。分子を個別の構成要素、例えば、バーコードを含有するドロップレットと組み合わせることができる。バーコードを次に、例えば、オーバーラップ伸長によるスプライシングを使用して、分子に取り付けることができる。本アプローチにおいて、最初の標的分子は「アダプター」配列が追加されていることができ、これは、プライマーが合成可能な既知の配列の分子である。バーコードと組み合わせたときに、アダプター配列及びバーコード配列に相補的なプライマーを使用することができ、標的核酸とバーコードの両方の生成物であるアンプリコンが互いにアニールし、かつ、ＤＮＡ重合などの伸長反応により、互いに伸長することができ、バーコード配列に取り付けられた標的核酸を含む二本鎖生成物を生成する。あるいは、当該標的を増幅するプライマーは、それ自身がバーコード化されることができるため、標的へのアニーリング及び伸長の際に、生成されたアンプリコンは、アンプリコンに組み込まれたバーコード配列を有する。これは、ＰＣＲによる特異的増幅、または、例えばＭＤＡによる非特異的増幅を含む多数の増幅法により応用することができる。バーコードを核酸に取り付けるために使用可能な代替の酵素反応、平滑末端または付着末端ライゲーションを含むライゲーションである。本アプローチにおいて、ＤＮＡバーコードは、核酸標的及びリガーゼ酵素でインキュベートされ、バーコードの、標的へのライゲーションがもたらされる。核酸の末端は、分子末端に取り付けられるバーコードの数よりも大きな制御が可能なリガーゼまたは断片と共に導入されるアダプターを使用することを含む多数の技術により、必要に応じてライゲーションのために修飾することができる。

本明細書で使用する場合、「同一な」という用語、及びその類似表現は、２つ以上の配列に関して使用する時には、その２つ以上の配列（例えば、ヌクレオチド配列またはポリペプチド配列）が同じである程度を指す。２つ以上の配列に関しては、配列またはその部分配列の同一性パーセントまたは相同性パーセントは、配列の所与の一または領域において同じであるすべてのモノマー単位（例えば、ヌクレオチドまたはアミノ酸）のパーセンテージを示す（すなわち、約７０％の同一性、好ましくは、７５％、８０％、８５％、９０％、９５％、９７％、９８％または９９％の同一性）。その同一性パーセントは、ＢＬＡＳＴまたはＢＬＡＳＴ２．０という配列比較アルゴリズムを下記のデフォルトパラメーターで用いるか、またはマニュアルアラインメント及び目視確認によって測定した場合において、比較ウィンドウまたは指定領域にわたって最大限一致するように比較及びアラインメントを行った時の所定の領域に対するものであることができる。配列は、アミノ酸レベルまたはヌクレオチドレベルの同一性が少なくとも８５％である時に、「実質的に同一」であるとする。好ましくは、その同一性は、少なくとも約２５残基長、約５０残基長もしくは約１００残基長である領域、または少なくとも１つの比較配列の全長に対して存在する。配列同一性パーセント及び配列類似性パーセントを求めるための典型的なアルゴリズムは、ＢＬＡＳＴ及びＢＬＡＳＴ２．０のアルゴリズムであり、これらは、Ａｌｔｓｃｈｕｌｅｔａｌ，Ｎｕｃ．ＡｃｉｄｓＲｅｓ．２５：３３８９－３４０２（１９７７）に記載されている。他の方法としては、Ｓｍｉｔｈ＆Ｗａｔｅｒｍａｎ，Ａｄｖ．Ａｐｐｌ．Ｍａｔｈ．２：４８２（１９８１）及びＮｅｅｄｌｅｍａｎ＆Ｗｕｎｓｃｈ，Ｊ．Ｍｏｌ．Ｂｉｏｌ．４８：４４３（１９７０）などのアルゴリズムが挙げられる。２つの核酸配列が実質的に同一であることの別の指標は、その２つの分子またはそれらの相補体が、ストリンジェントなハイブリダイゼーション条件下で、互いにハイブリダイズすることである。

「核酸」、「ポリヌクレオチド」及び「オリゴヌクレオチド」という用語は、ヌクレオチドのバイオポリマーを指し、文脈上別段に示されている場合を除き、改変ヌクレオチド及び非改変ヌクレオチド、ＤＮＡ及びＲＮＡ、ならびに改変核酸主鎖を含む。例えば、ある特定の実施形態では、その核酸は、ペプチド核酸（ＰＮＡ）またはロックト核酸（ＬＮＡ）である。典型的には、本明細書に記載されているような方法は、ＤＮＡを増幅用の核酸鋳型として用いて行う。しかしながら、ヌクレオチドが、天然のＤＮＡまたはＲＮＡに由来する人工の誘導体または改変核酸に置き換えられている核酸も、相補鎖合成用の鋳型として機能する限りは、本発明の核酸に含めてよい。本発明の核酸は概して、生体試料に含まれている。その生体試料には、動物、植物または微生物の組織、細胞、培養液、及び排泄物または抽出物が含まれる。ある特定の態様では、その生体試料には、ウイルスまたはマイコプラズマのような細胞内寄生体のゲノムＤＮＡまたはＲＮＡが含まれる。本発明の核酸は、上記生体試料に含まれる核酸に由来してよい。例えば、好ましくは、記載されている方法では、ゲノムＤＮＡ、ｍＲＮＡから合成したｃＤＮＡ、または生体試料に由来する核酸に基づいて増幅した核酸を使用する。別段に示されていない限り、オリゴヌクレオチド配列が示されている場合、そのヌクレオチドは、左から右に向かって、５’から３’の順であり、「Ａ」はデオキシアデノシンを示し、「Ｃ」はデオキシシチジンを示し、「Ｇ」はデオキシグアノシンを示し、「Ｔ」はデオキシチミジンを示し、「Ｕ」はウリジンを示すと理解されたい。オリゴヌクレオチドは、「５’末端」及び「３’末端」を有するという。典型的には、モノヌクレオチドが反応して、ある１つのヌクレオチドの５’リン酸基または同等の基が、任意にホスホジエステル結合またはその他の好適な結合を介して、その隣接ヌクレオチドの３’ヒドロキシル基または同等の基に結合することによって、オリゴヌクレオチドを形成するからである。

鋳型核酸は、核酸増幅法において相補鎖を合成する際の鋳型として機能する核酸である。その鋳型と相補的なヌクレオチド配列を有する相補鎖は、その鋳型に対応する鎖としての意味を持つが、これらの２つの関係は、相対的なものに過ぎない。すなわち、本明細書に記載されている方法によれば、相補鎖として合成された鎖は、再び鋳型として機能できる。換言すると、相補鎖は、鋳型となることができる。ある特定の実施形態では、鋳型は、生体試料、例えば、植物、動物、ウイルス、微生物、細菌、真菌などに由来する。ある特定の実施形態では、その動物は、哺乳動物、例えばヒト患者である。鋳型核酸は典型的には、標的核酸を１つ以上含む。例示的な実施形態における標的核酸は、試料中に存在する疑いがあるか、または試料中に存在すると予測されるいずれの核酸配列も含め、本開示に従って増幅または合成できる一本鎖または二本鎖のいずれの核酸配列も含んでよい。

本発明における実施形態で用いるプライマー及びオリゴヌクレオチドは、ヌクレオチドを含む。ヌクレオチドは、ポリメラーゼに選択的に結合できるか、またはポリメラーゼによって重合化できるいずれの化合物も含み、いずれの天然ヌクレオチドまたはそのアナログも含まれるが、これらに限らない。必然ではないが、典型的には、ヌクレオチドがポリメラーゼに選択的に結合した後には、そのヌクレオチドは、ポリメラーゼによって重合化して核酸鎖となるが、時折、ヌクレオチドが、核酸鎖に組み込まれずに、ポリメラーゼから解離することがあり、この事象は、本明細書では、「非生成」事象という。このようなヌクレオチドには、その構造にかかわらず、ポリメラーゼに選択的に結合できるか、またはポリメラーゼによって重合化できる天然のヌクレオチドのみならず、いずれのアナログも含まれる。天然のヌクレオチドは典型的には、塩基部分、糖部分及びリン酸部分を含むが、本開示のヌクレオチドは、このような部分のいずれか１つ、一部またはすべてが欠損している化合物を含むことができる。例えば、そのヌクレオチドは任意に、リン原子を３個、４個、５個、６個、７個、８個、９個、１０個またはそれを上回る数含むリン原子鎖を含むことができる。いくつかの実施形態では、そのリン鎖は、糖環のいずれかの炭素（５’炭素など）に結合できる。そのリン鎖は、介在するＯまたはＳとともに、糖に連結できる。一実施形態では、その鎖のリン原子の１つ以上は、Ｐ及びＯを有するリン酸基の一部であることができる。別の実施形態では、その鎖のリン原子は、介在するＯ、ＮＨ、Ｓ、メチレン、置換メチレン、エチレン、置換エチレン、ＣＮＨ_２、Ｃ（Ｏ）、Ｃ（ＣＨ_２）、ＣＨ_２ＣＨ_２またはＣ（ＯＨ）ＣＨ_２Ｒ（式中、Ｒは、４－ピリジンまたは１－イミダゾールであることができる）とともに連結できる。一実施形態では、その鎖のリン原子は、Ｏ、ＢＨ３またはＳを有する側鎖基を有することができる。そのリン鎖では、Ｏ以外の側鎖基を持つリン原子は、置換リン酸基であることができる。そのリン鎖では、Ｏ以外の介在する原子を持つリン原子は、置換リン酸基であることができる。ヌクレオチドアナログの例のいくつかは、Ｘｕによる米国特許第７，４０５，２８１号に記載されている。

いくつかの実施形態では、ヌクレオチドは標識を含み、そのヌクレオチドは、本明細書では、「標識ヌクレオチド」といい、標識ヌクレオチドの標識は、本明細書では、「ヌクレオチド標識」という。いくつかの実施形態では、その標識は、末端リン酸基、すなわち、糖から最も遠いリン酸基に結合した蛍光部分（例えば色素）、発光部分などの形態であることができる。本開示の方法及び組成物で使用できるヌクレオチドの例のいくつかとしては、リボヌクレオチド、デオキシリボヌクレオチド、改変リボヌクレオチド、改変デオキシリボヌクレオチド、リボヌクレオチドポリホスフェート、デオキシリボヌクレオチドポリホスフェート、改変リボヌクレオチドポリホスフェート、改変デオキシリボヌクレオチドポリホスフェート、ペプチドヌクレオチド、改変ペプチドヌクレオチド、メタロヌクレオシド、ホスホネートヌクレオシド、及び改変リン酸－糖という主鎖のヌクレオチド、上記化合物のアナログ、誘導体またはバリアントなどが挙げられるが、これらに限らない。いくつかの実施形態では、そのヌクレオチドは、そのヌクレオチドのαリン酸と糖、そのヌクレオチドのαリン酸とβリン酸、そのヌクレオチドのβリン酸とγリン酸、そのヌクレオチドのいずれかの他の２つのリン酸、またはこれらをいずれかに組み合わせたものを架橋する酸素部分の代わりに、例えばチオ部分またはボラノ部分のような非酸素部分を含むことができる。

「ヌクレオチド５’－三リン酸」とは、５’位に三リン酸エステル基を有するヌクレオチドを指し、「ＮＴＰ」、または特にリボース糖の構造的特徴を示す目的で、「ｄＮＴＰ」及び「ｄｄＮＴＰ」と称する場合がある。三リン酸エステル基は、様々な酸素に対する硫黄置換基を含むことができる（例えばα－チオ－ヌクレオチド５’－三リン酸）。核酸化学の論評については、Ｓｈａｂａｒｏｖａ，Ｚ．ａｎｄＢｏｇｄａｎｏｖ，Ａ．ＡｄｖａｎｃｅｄＯｒｇａｎｉｃＣｈｅｍｉｓｔｒｙｏｆＮｕｃｌｅｉｃＡｃｉｄｓ，ＶＣＨ，ＮｅｗＹｏｒｋ，１９９４を参照されたい。

概要
複数の細胞のシングルセル分析を行い、個別細胞の細胞遺伝子型及び表現型を測定するための実施形態を、本明細書で記載する。一般に、シングルセル分析は、標的化ＤＮＡ－ｓｅｑを行い、細胞遺伝子型（例えば、ＣＮＶ及び／またはＳＮＶなどの細胞変異）を測定するために使用したゲノムＤＮＡに由来するシーケンスリードを生成することを伴う。シングルセル分析は、抗体に結合したオリゴヌクレオチドの配列決定を行うことをさらに伴い、抗体は、細胞により発現した特異的検体に対する結合親和性を示す。したがって、抗体コンジュゲートオリゴヌクレオチドに由来するシーケンスリードを使用して、細胞表現型（例えば、細胞の１つ以上の検体の発現または存在）を測定する。集団（例えば、不均質ながん細胞の集団）における細胞にまたがる、細胞遺伝子型と表現型の組み合わせは、遺伝子型と表現型の組み合わせにより識別された細胞の亜集団を識別するのに有用である。細胞の亜集団は、以前は未知であった亜集団、または、細胞遺伝子型または表現型のみのいずれかを用いると検出される可能性が低い亜集団を表し得る。

図１Ａを参照すると、当該図面は、一実施形態に従いシングルセル分析を行うためのシングルセルワークフロー装置１０６及び演算装置１０８を含む、全体のシステム環境１００を表す。細胞１０２の集団が得られる。様々な実施形態では、細胞１０２は、対象または患者から入手した試験試料から単離することができる。様々な実施形態では、細胞１０２は、健常な対象から採取した健常な細胞である。様々な実施形態では、細胞１０２は、対象から採取した罹患細胞を含む。一実施形態では、細胞１０２は、以前にがんと診断された対象から採取したがん細胞を含む。例えば、がん細胞は、がんと診断された対象の血流にて入手可能な腫瘍細胞であることができる。別の例として、がん細胞は、腫瘍生検により得られる細胞であることができる。したがって、腫瘍細胞をシングルセル分析することにより、対象のがんの細胞を特性決定することが可能となる。様々な実施形態では、試験試料は、対象の処置の後に（例えば、がん治療などの治療の跡に）、対象から入手される。したがって、細胞をシングルセル分析することにより、治療法に対する対象の応答を表す細胞を特性決定することが可能となる。

工程１０４において、細胞１０２は抗体でインキュベートされる。様々な実施形態では、抗体は、標的検体に対する結合親和性を示す。例えば、抗体は、標的タンパク質の標的エピトープに対する結合親和性を示すことができる。

様々な実施形態では、抗体でインキュベートした細胞の数は、１０^２細胞、１０^３細胞、１０^４細胞、１０^５細胞、１０^６細胞、または１０^７細胞であることができる。様々な実施形態では、１０^３細胞～１０^７細胞が、抗体でインキュベートされる。様々な実施形態では、１０^４細胞～１０^６細胞が、抗体でインキュベートされる。様々な実施形態では、様々な濃度の抗体が細胞でインキュベートされる。様々な実施形態では、タンパク質パネル内の抗体に関して、０．１ｎＭ、０．５ｎＭ、１．０ｎＭ、２．０ｎＭ、３．０ｎＭ、４．０ｎＭ、５．０ｎＭ、６．０ｎＭ、７．０ｎＭ、８．０ｎＭ、９．０ｎＭ、１０．０ｎＭ、２０ｎＭ、３０ｎＭ、４０ｎＭ、５０ｎＭ、６０ｎＭ、７０ｎＭ、８０ｎＭ、９０ｎＭ、または１００ｎＭの濃度の抗体が、細胞でインキュベートされる。

様々な実施形態では、細胞１０２は、複数の異なる抗体でインキュベートされる。一実施形態では、複数の異なる抗体の中で、各抗体は、パネルの検体に対して結合親和性を示す。例えば、各抗体は、パネルのタンパク質に対して結合親和性を示す。タンパク質パネルに含まれるタンパク質の例を、本明細書で記載する。抗体による細胞のインキュベーションにより、標的エピトープに対する抗体の結合がもたらされる。様々な実施形態では、各抗体に対して、０．１ｎＭ、０．５ｎＭ、１．０ｎＭ、２．０ｎＭ、３．０ｎＭ、４．０ｎＭ、５．０ｎＭ、６．０ｎＭ、７．０ｎＭ、８．０ｎＭ、９．０ｎＭ、１０．０ｎＭ、２０ｎＭ、３０ｎＭ、４０ｎＭ、５０ｎＭ、６０ｎＭ、７０ｎＭ、８０ｎＭ、９０ｎＭ、または１００ｎＭの濃度の抗体が細胞でインキュベートされる。

インキュベーション後、細胞１０２を（例えば洗浄緩衝液で）洗浄し、未結合の過剰な抗体を除去する。

様々な実施形態では、抗体を、抗体オリゴヌクレオチドとも呼ばれる１つ以上のオリゴヌクレオチドで標識する。このようなオリゴヌクレオチドは、マイクロフルイディクスバーコード化及びＤＮＡ配列決定で読み出すことが可能であり、これにより、対象となる細胞検体の検出が可能となる。抗体がその標的に結合する場合、抗体オリゴヌクレオチドはその標的と共に運搬され、これにより、標的検体の存在が、オリゴヌクレオチドタグの存在に基づき推定されることが可能となる。いくつかの実施態様では、抗体オリゴヌクレオチドを分析することにより、細胞に存在する異なるエピトープが推定される。

シングルセルワークフロー装置１０６とは、個別細胞を処理して、配列決定のための核酸を生成する装置を意味する。様々な実施形態では、シングルセルワークフロー装置１０６は、個別細胞をエマルションに封入し、細胞をエマルション内で溶解し、第２のエマルションで細胞溶解物の細胞バーコード化を行い、第２のエマルションで核酸増幅反応を行うことができる。したがって、増幅核酸を収集し配列決定することができる。様々な実施形態では、シングルセルワークフロー装置１０６は、核酸を配列決定のシーケンサーをさらに含む。

演算装置１０８は、シングルセルワークフロー装置１０６から配列決定したリードを受診するように構成される。様々な実施形態では、演算装置１０８はシングルセルワークフロー装置１０６と通信可能に連結されるが故に、シングルセルワークフロー装置１０６からシーケンスリードを直接受信する。演算装置１０８は、シーケンスリードを分析して、細胞分析１１０を生成する。一実施形態では、演算装置１０８はシーケンスリードを分析し、細胞遺伝子型及び表現型を測定する。演算装置１０８は、測定した細胞遺伝子型及び表現型を用いて、新規の細胞亜集団を発見、及び／または個別細胞を細胞亜集団に分類する。したがって、このような実施形態では、細胞分析１１０とは、細胞亜集団の識別、または、細胞の細胞亜集団への分類を意味することができる。

ここで、配列決定のために単一細胞を処理し、増幅した核酸分子を生成する実施形態を示す、図１Ｂを参照する。具体的には、図１Ｂは、標的核酸分子の細胞封入１６０、検体放出１６５、細胞バーコード化、及び標的増幅１７５の工程を含むワークフロープロセスを示す。

一般に、細胞封入工程１６０は、シングルセル１０２を試薬１２０と共に、エマルションに封入することを伴う。様々な実施形態では、エマルションは、細胞１０２及び試薬１２０を含有する水性流体を、キャリア流体（例えば、油１１５）に分画することにより、油中水性流体型エマルションを得ることにより形成される。エマルションは、封入細胞１２５、及び試薬１２０を含む。封入細胞は、工程１６５において、検体放出を受ける。一般に、試薬は細胞の溶解を引き起こすことにより、エマルション内で細胞溶解物１３０を生成する。特定の実施形態では、試薬１２０は、細胞を溶解して細胞溶解物１３０を生成するための、プロテイナーゼＫなどのプロテアーゼを含む。細胞溶解物１３０は、１つ以上の異なる種類の検体（例えば、ＲＮＡ転写産物、ＤＮＡ、タンパク質、脂質、または炭化水素）を含むことができる、細胞の内容物を含む。様々な実施形態では、細胞溶解物１３０の異なる検体は、エマルション内で試薬１２０と相互作用することができる。例えば、リバースプライマーなどの、試薬１２０中のプライマーは、検体をプライミングすることができる。

細胞バーコード化工程１７０は、細胞溶解物１３０を第２のエマルションに、バーコード１４５及び／または反応混合物１４０と共に封入することを伴う。様々な実施形態では、第２のエマルションは、細胞溶解物１３０を含有する水性流体を、不混和性油１３５に分画することにより形成される。図１Ｂに示すように、反応混合物１４０及びバーコード１４５を、水性流体の個別の流れを通して導入することにより、反応混合物１４０及びバーコードを、細胞溶解物１３０と共に、第２のエマルションに分画することができる。

一般に、バーコード１４５は、分析される標的検体（例えば、標的核酸）を標識することができ、これにより、標的核酸に由来するシーケンスリードの起源の、その後の同定が可能となる。様々な実施形態では、複数のバーコード１４５は、細胞溶解物の複数の標的核酸を標識することにより、大量のシーケンスリードの起源の、その後の同定を可能にすることができる。

一般に、反応混合物１４０は、核酸増幅反応などの反応の実施を可能にする。標的増幅工程１７５は、標的核酸を増幅することを伴う。例えば、細胞溶解物の標的核酸は、第２のエマルション中で反応混合物１４０を用いる増幅を受けることにより、標的核酸に由来するアンプリコンを生成する。図１Ｂは、細胞バーコード化１７０、及び標的増幅１７５を２つの個別の工程で示すものの、様々な実施形態では、標的核酸は、核酸増幅工程を通して、バーコード１４５で標識される。

本明細書で参照するように、図１Ｂに示すワークフロープロセスは、細胞からの検体放出１６５が、細胞バーコード化１７０及び標的増幅１７５の工程とは別に生じる、２段階ワークフロープロセスである。例えば、細胞からの検体放出１６５は、第１のエマルション内で生じ、続いて、細胞バーコード化１７０及び標的増幅１７５が第２のエマルション内で生じる。様々な実施形態では、代替のワークフロープロセス（例えば、図１Ｂに示す２段階ワークフロープロセス以外のワークフロープロセス）を用いることができる。例えば、細胞１０２、試薬１２０、反応混合物１４０、及びバーコード１４５を、エマルションに封入することができる。したがって、検体放出１６５はエマルション内で生じることができ、続いて、細胞バーコード化１７０及び標的増幅１７５が同じエマルションで生じることができる。

図２は、個別細胞に由来するシーケンスリードを用いて細胞遺伝子型及び表現型を測定し、細胞遺伝子型及び表現型を用いて細胞を分析するフロープロセスである。具体的には、図２は、工程２０５において、増幅核酸をプールする工程と、増幅核酸を配列決定する工程と、シーケンスリードを用いて、細胞に関する細胞軌道を測定する工程と、を示す。一般に、図２に示す流れ作業は、図１Ｂに示すワークフロープロセスの続きである。

例えば、図１Ｂの工程１７５における標的増幅の後で、増幅核酸２５０Ａ、２５０Ｂ、及び２５０Ｃを、図２に示す工程２０５でプールする。例えば、増幅核酸のエマルションをプールして収集し、エマルションの不混和性油を取り除く。したがって、複数の細胞由来の増幅核酸は、合わせてプールすることができる。図２は、３つの増幅核酸２５０Ａ、２５０Ｂ、及び２５０Ｃを示すが、様々な実施形態では、プールした核酸は、複数の細胞の検体に由来する、数百、数千、または数百万個の核酸を含むことができる。

様々な実施形態では、各増幅核酸２５０は、少なくとも、標的核酸２４０及びバーコード２３０の配列を含む。様々な実施形態では、増幅核酸２５０は、ユニバーサルプライマー配列（例えば、オリゴ－ｄＴ配列）、ランダムプライマー配列、遺伝子特異的プライマーフォワード配列、遺伝子特異的プライマーリバース配列、または、１つ以上の定常領域（例えばＰＣＲハンドル）のいずれかなどの、さらなる配列を含むことができる。

様々な実施形態では、増幅核酸２５０Ａ、２５０Ｂ、及び２５０Ｃは、同一のシングルセルに由来し、故に、バーコード２３０Ａ、２３０Ｂ、及び２３０Ｃは同一である。そのために、バーコード２３０を配列決定することにより、増幅核酸２５０が同一の細胞に由来するという測定が可能となる。様々な実施形態では、増幅核酸２５０Ａ、２５０Ｂ、及び２５０Ｃはプールされ、異なる細胞に由来する。したがって、バーコード２３０Ａ、２３０Ｂ、及び２３０Ｃは互いに異なり、バーコード２３０を配列決定することにより、増幅核酸２５０が異なる細胞に由来するという測定が可能となる。

工程２１０において、プールした増幅核酸２５０は配列決定を受け、シーケンスリードを生成する。各増幅核酸に関して、シーケンスリードは、バーコード及び標的核酸の配列を含む。増幅核酸に含まれるバーコード配列に従い、個別の細胞に由来するシーケンスリードをクラスター化する。様々な実施形態では、各シングルセルに対する１つ以上のシーケンスリードを（例えば、参照ゲノムに対して）アラインする。シーケンスリードを参照ゲノムに対してアラインすることにより、ゲノム内のどこで、シーケンスリードが由来するかを測定することができる。例えば、ＤＮＡから生成した複数のシーケンスリードは、ゲノムの位置にアラインされた場合に、ゲノムの位置に存在する、または当該位置に関与する１つ以上の変異を明らかにすることができる。様々な実施形態では、各シングルセルに対する１つ以上のシーケンスリードは、アラインメントを受けない。例えば、抗体オリゴヌクレオチドが細胞ゲノムのゲノムＤＮＡに由来しないことを考慮すると、抗体オリゴヌクレオチドに由来するシーケンスリードは、必ずしも参照ゲノムにアラインされる必要はない。

工程２２０において、シングルセルに対してアラインしたシーケンスリードを分析し、シングルセルの細胞遺伝子型及び細胞表現型を測定する。例えば、ＤＮＡ転写物から生成したシーケンスリードを分析し、１つ以上のＣＮＶ及びＳＮＶなどの、細胞の１つ以上の変異を測定する。抗体コンジュゲートオリゴヌクレオチドから生成したシーケンスリードを使用して細胞表現型を測定し、当該測定することは、１つ以上のタンパク質の有無を含むことができる。様々な実施形態では、抗体コンジュゲートオリゴヌクレオチドから生成したシーケンスリードの量は、１つ以上のタンパク質の発現レベルに相関する。まとめると、細胞遺伝子型（例えば、１つ以上のＳＮＶ及びＣＮＶ）、ならびに細胞表現型（例えば、タンパク質の有無）により、シングルセルのゲノミクス及びプロテオミクスの同時の視点がもたらされる。

工程２２５において、細胞の細胞遺伝子型及び細胞表現型を分析する。一実施形態では、細胞の細胞遺伝子型及び細胞表現型を使用して、細胞遺伝子型及び表現型により特徴付けられる亜集団に細胞を分類する。例えば、既知の細胞亜集団のライブラリーを、遺伝子型と表現型の組み合わせに基づき特徴付けることができる。したがって、細胞の遺伝子型及び表現型を使用して、同一または類似の遺伝子型及び表現型を共有する１つ以上の細胞集団に、細胞を分類することができる。

一実施形態では、細胞の細胞遺伝子型及び細胞表現型を使用して、細胞亜集団を同定する。例えば、細胞は、細胞の母集団に由来することができる。このような実施形態では、細胞の細胞遺伝子型及び細胞表現型を、細胞の母集団に由来する他の細胞の細胞遺伝子型及び細胞表現型と共に分析する。様々な実施形態では、細胞の母集団の細胞遺伝子型及び細胞表現型を分析することは、類似の遺伝子型または表現型を有する細胞がクラスター内に局在化するように、次元削減分析及びクラスター化分析の一方または両方を行うことを伴う。様々な実施形態では、細胞の不均質な亜集団を、個別のクラスターから同定することができる。様々な実施形態では、細胞の不均質な亜集団を、クラスター自身の中からでさえも同定することができる。

遺伝子型と表現型の異なる組み合わせにより、細胞の亜集団を同定することは、細胞集団内で細胞の亜集団を発見するのに有用であることができる。一例として、細胞の亜集団とは、がん細胞集団を指すことができる。したがって、細胞亜集団の存在を検出すること、及び／または同定することは、がんを患う対象を診断するのに有用である。別の例として、細胞の母集団は、以前は均質であると考えられたがん細胞の母集団であることができる。したがって、がん細胞において、細胞の細胞遺伝子型及び表現型を分析することは、がん細胞の不均質性を理解するのに役立ち、これを使用して、細胞の様々な亜集団を標的にするための治療の開発または選択を誘うことができる。

シングルセル分析を行うための方法
封入、検体放出、バーコード化、及び増幅
本明細書に記載する実施形態は、（例えば、図１の工程１６０において）１つ以上の細胞を封入し、１つ以上の細胞にてシングルセル分析を行うことを伴う。様々な実施形態では、細胞を試薬と共に封入することは、細胞及び試薬を含む水相を、不混和性油と組み合わせることにより達成される。一実施形態では、細胞及び試薬を含む水相は、流れている不混和性油と共に流れて油中水型エマルションが形成され、ここで、少なくとも１つのエマルションは、シングルセル及び試薬を含む。様々な実施形態では、不混和性油相は、フルオラス油、フルオラス非イオン性界面活性剤、またはその両方を含む。様々な実施形態では、エマルションは、約０．００１～１０００ピコメートルまたはそれ以上の内部体積を有することができ、直径は０．１～１０００μｍの範囲であることができる。

様々な実施形態では、細胞及び試薬を含む水相は必ずしも、不混和性油相と同時に流れる必要はない。例えば、水相は流れて、不混和性油相の静止リザーバと接触することができ、これにより、静止した油リザーバ内で、油中水型エマルションの発生が可能となる。

様々な実施形態では、水相と不混和性油相とを組み合わせることは、マイクロフルイディクスデバイス内で行うことができる。例えば、水相は、マイクロ流体デバイスのマイクロチャネルを通って流れ、不混和性油相と接触することができ、これは同時に、個別のマイクロチャネルを通って流れているか、または、マイクロフルイディクスデバイスの静止リザーバ内で保持される。エマルションに封入された細胞及び試薬は次に、マイクロフルイディクスデバイスを通って流れ、細胞溶解を受けることができる。

試薬及び細胞をエマルションに添加する、さらなる例示的実施形態は、細胞及び試薬を個別に含有するエマルションを合わせること、または、試薬をエマルション内にピコインジェクションすることを含むことができる。例示的実施形態のさらなる説明は、米国出願第１４／４２０，６４６号に記載されており、その全体が参照により本明細書に組み込まれている。

エマルションに封入された細胞を溶解し、細胞溶解物を生成する。様々な実施形態では、試薬中に存在する剤を溶解させることにより、細胞を溶解する。例えば、試薬は、ＮＰ－４０、及び／またはプロテアーゼなどの洗剤を含むことができる。洗剤及び／またはプロテアーゼは、細胞膜を溶解することができる。いくつかの実施形態では、細胞溶解はまた、または代わりに、試薬中で剤を溶解させることを伴わない技術に依存する。例えば、溶解は、様々なゲノム的特徴を用いて、細胞の穿孔、剪断、擦過などを達成し得る機械的技術により実現することができる。音響技術などの他の種類の機械的破壊もまた、使用することができる。さらに、熱エネルギーもまた使用して、細胞を溶解することができる。細胞溶解を達成する任意の便利な手段を、本明細書に記載の方法において用いることができる。

ここで、第１の実施形態に従った、エマルション（例えばエマルション３００）に検体を放出し、この中で検体を処理する工程を示す、図３Ａ～３Ｃを参照する。図３Ａは、（図１Ｂに示す）細胞１０２、及び試薬１２０の両方を含むエマルション３００Ａを示す。具体的には、図３Ａにおいて、エマルション３００Ａは、細胞（ＤＮＡ３０２をさらに含む）、抗体オリゴヌクレオチド３０４（図１Ａの工程１０４において細胞タンパク質を結合するために使用した抗体に由来する）、加えて、試薬から添加されたプロテアーゼ３１０を含有する。エマルション３００Ａ内では、細胞膜の点線により示されるように、細胞は溶解される。一実施形態では、細胞は、ＮＰ４０（例えば、０．０１％のＮＰ４０）などの試薬に含まれる洗剤により溶解される。

図３Ｂは、プロテアーゼ３０２としてのエマルション３００Ｂがクロマチン結合ＤＮＡ３０２を分解することにより、ゲノムＤＮＡを放出することを示す。様々な実施形態では、エマルション３００Ｂは、プロテアーゼ３１０がクロマチンを分解することを可能にする高温に曝露される。様々な実施形態では、エマルション３００Ｂは、４０℃～６０℃の温度に曝露される。様々な実施形態では、エマルション３００Ｂは、４５℃～５５℃の温度に曝露される。様々な実施形態では、エマルション３００Ｂは、４８℃～５２℃の温度に曝露される。様々な実施形態では、エマルション３００Ｂは、５０℃の温度に曝露される。

図３Ｃは、エマルション３００Ｃ内にある、遊離ゲノムＤＮＡ鎖３０６及び抗体オリゴヌクレオチド３０４を示す。プロテアーゼ３１０は失活される。様々な実施形態では、プロテアーゼ３１０は、エマルション３００Ｃを高温に曝露することで失活される。様々な実施形態では、エマルション３００Ｃは、７０℃～９０℃の温度に曝露される。様々な実施形態では、エマルション３００Ｂは、７５℃～８５℃の温度に曝露される。様々な実施形態では、エマルション３００Ｂは、７８℃～８２℃の温度に曝露される。様々な実施形態では、エマルション３００Ｂは、８０℃の温度に曝露される。

様々な実施形態では、抗体オリゴヌクレオチド３０４、及び／または遊離ゲノムＤＮＡ３０６は、エマルション３００Ｃ内でプライミングを受ける。様々な実施形態では、リバースプライマーは、抗体オリゴヌクレオチド３０４、及び／または遊離ゲノムＤＮＡ３０６の一部とハイブリダイズすることができる。例えば、リバースプライマーは、遊離ゲノムＤＮＡ３０６の一部とハイブリダイズする、遺伝子特異的リバースプライマーである。例示的な遺伝子特異的プライマーを、以下にさらに詳述する。別の例として、リバースプライマーは、抗体オリゴヌクレオチド３０４の一部とハイブリダイズするＰＣＲハンドルであり、これは、図４Ａに関連して以下でさらに詳述される。様々な実施形態では、プロテアーゼ３１０と共にエマルション３００Ａに導入される試薬に、リバースプライマーが含まれることを考慮すると、例えばエマルション３００Ａまたはエマルション３００Ｂ内で、抗体オリゴヌクレオチド３０４のプライミングはより早く生じる可能性がある。

様々な実施形態では、エマルション３００Ｃ中の抗体オリゴヌクレオチド３０４及び遊離ゲノムＤＮＡ３０６は、図１Ｂに示す細胞溶解物１３０などの細胞溶解物を少なくとも部分的に表し、これはその後、バーコード化及び増幅のために、第２のエマルションに封入される。具体的には、図１における細胞バーコード化１７０の工程は、細胞溶解物１３０を、反応混合物１４０及びバーコード１４５と共に封入することを含む。様々な実施形態では、反応混合物１４０は、標的核酸上で核酸反応を行うための構成成分（例えば、抗体オリゴヌクレオチド及び遊離ゲノムＤＮＡ）を含む。例えば、反応混合物１４０は、プライマー、核酸増幅を行うための酵素、及び、増幅核酸に組み込むためのｄＮＴＰまたはｄｄＮＴＰを含むことができる。

様々な実施形態では、細胞溶解物は、反応混合物及びバーコードを含む水相を、細胞溶解物及び不混和性油相と組み合わせることにより、反応混合物及びバーコードと共に封入される。一実施形態では、反応混合物及びバーコードを含む水相は、流れている細胞溶解物及び流れている不混和性油相と共に流れ、これにより油中水型エマルションが形成され、ここで、少なくとも１つのエマルションは、細胞溶解物、反応混合物、及びバーコードを含む。様々な実施形態では、不混和性油相は、フルオラス油、フルオラス非イオン性界面活性剤、またはその両方を含む。様々な実施形態では、エマルションは、約０．００１～１０００ピコメートルまたはそれ以上の内部体積を有することができ、直径は０．１～１０００μｍの範囲であることができる。

様々な実施形態では、水相と不混和性油相とを組み合わせることは、マイクロフルイディクスデバイス内で行うことができる。例えば、水相は、マイクロ流体デバイスのマイクロチャネルを通って流れ、不混和性油相と接触することができ、これは同時に、個別のマイクロチャネルを通って流れているか、または、マイクロフルイディクスデバイスの静止リザーバ内で保持される。エマルションに封入された細胞溶解物、反応混合物、及びバーコードを次に、マイクロフルイディクスデバイスを通して流し、標的核酸の増幅を行うことができる。

反応混合物及びバーコードをエマルションに添加する、さらなる例示的実施形態は、細胞溶解物及び反応混合物及びバーコードを個別に含むエマルションを合わせること、または、反応混合物及び／もしくはバーコードをエマルションにピコインジェクションすることを含むことができる。エマルションを合わせる、または、物質をエマルションにピコインジェクションする例示的実施形態のさらなる説明は、米国出願第１４／４２０，６４６号に見出され、その全体が参照により本明細書に組み込まれている。

反応混合物及びバーコードがエマルションに添加されると、エマルションは、核酸増幅反応を促進する条件下でインキュベートすることができる。様々な実施形態では、エマルションは、反応混合物及び／もしくはバーコードを添加するのに使用したのと同じマイクロフルイディクスデバイスでインキュベートすることができるか、または、別個の装置でインキュベートすることができる。特定の実施形態では、核酸増幅を促進する条件下でエマルションをインキュベートすることは、細胞を封入し、細胞を溶解するのに使用したのと同じマイクロフルイディクスデバイスで行う。エマルションをインキュベートすることは、様々な形態をとることができる。特定の態様では、反応混合物、バーコード、及び細胞溶解物を含有するエマルションは、核酸増幅に効果的な条件下でエマルションをインキュベートするチャネルを流れることができる。マイクロドロップレットがチャネルを流れることは、ＰＣＲに効果的な温度で維持される、様々な温度域にわたって蛇行するチャネルを伴う場合がある。このようなチャネルは例えば、２つ以上の温度域にわたってサイクルことができ、少なくとも１つの域は約６５℃にて維持され、少なくとも１つの域は約９５℃で維持される。滴がこのような域にまたがり移動するため、温度は、核酸増幅の必要に応じてサイクルする。域の数、及び、各域の対応する温度は、当業者により速やかに決定し、所望の核酸増幅を実現することができる。

様々な実施形態では、核酸増幅の後で、増幅核酸を含有するエマルションを収集する。様々な実施形態では、エマルションは、マイクロフルイディクスデバイスのウェルなどのウェルにて収集される。様々な実施形態では、エマルションは、リザーバ、または、エッペンドルフチューブなどのチューブで収集される。収集されると、異なるエマルションにまたがる増幅核酸がプールされる。一実施形態では、エマルションは、外部刺激により破壊され、増幅核酸をプールする。一実施形態では、エマルションは、水相と不混和性油相との密度差を考慮すると、時間の経過とともに自然に凝集する。したがって、増幅核酸は水相にプールされる。

様々な実施形態では、プールした後、増幅核酸は、配列決定のためにさらなる調製を受けることができる。例えば、シーケンシングアダプターを、プールした核酸に添加することができる。例示的なシーケンシングアダプターは、Ｐ５及びＰ７シーケンシングアダプターである。シーケンシングアダプターにより、核酸のその後の配列決定が可能となる。

抗体コンジュゲートオリゴヌクレオチド及びゲノムＤＮＡの例示的なバーコード化
図４Ａは、一実施形態に従った、抗体コンジュゲートオリゴヌクレオチドのプライミング及びバーコード化を示す。具体的には、図４Ａは、抗体オリゴヌクレオチド３０４のプライミングを伴う工程４１０を示し、さらに、抗体オリゴヌクレオチド３０４のバーコード化及び増幅を伴う工程４２０を示す。様々な実施形態では、工程４１０は、第１のエマルション内で生じ、この間に細胞溶解が生じ、工程４２０は、第２のエマルション内で生じ、この間に細胞バーコード化及び核酸増幅が生じる。このような実施形態では、プライマー４０５は試薬中に提供され、ビーズバーコードは反応混合物と共に提供される。いくつかの実施形態では、工程４１０及び４２０の両方が、第２のエマルション内で生じる。このような実施形態では、図４Ａに示すプライマー４０５及びビーズバーコードは、反応混合物と共に提供される。

抗体オリゴヌクレオチド３０４は抗体にコンジュゲートされる。様々な実施形態では、抗体オリゴヌクレオチド３０４は、ＰＣＲハンドル、タグ配列（例えば抗体タグ）、及び、オリゴヌクレオチドを抗体に結合させる捕捉配列を含む。様々な実施形態では、抗体オリゴヌクレオチド３０４は抗体の領域にコンジュゲートし、抗体が標的エピトープを結合する能力が影響を受けなくなる。例えば、抗体オリゴヌクレオチド３０４は抗体のＦｃ領域に結合することができ、これにより、抗体の可変領域が影響を受けないままとなり、エピトープ結合に利用可能となる。様々な抗体オリゴヌクレオチド３０４が、固有分子識別子（ＵＭＩ）を含むことができる。様々な実施形態では、ＵＭＩは抗体タグの前または後に挿入することができる。様々な実施形態では、ＵＭＩは抗体タグのいずれかの末端に隣接することができる。様々な実施形態では、ＵＭＩにより、特定の抗体オリゴヌクレオチド３０４と抗体の組み合わせの同定が可能となる。

様々な実施形態では、抗体オリゴヌクレオチド３０４は２つ以上のＰＣＲハンドルを含む。例えば、抗体オリゴヌクレオチド３０４は２つのＰＣＲハンドルを含むことができ、一方が、抗体オリゴヌクレオチド３０４のそれぞれの末端に存在する。様々な実施形態では、抗体オリゴヌクレオチド３０４のＰＣＲハンドルの１つは抗体にコンジュゲートされる。ここで、２つのＰＣＲハンドルとハイブリダイズ可能であるフォワード及びリバースプライマーを提供することができ、これにより、抗体オリゴヌクレオチド３０４の増幅が可能となる。

一般に、抗体オリゴヌクレオチド３０４の抗体タグにより、抗体（及び、対応するタンパク質）のその後の同定が可能となる。例えば、抗体タグは、識別子、例えば、抗体が結合するタンパク質の種類を同定するためのバーコードとして機能することができる。様々な実施形態では、同一の標的に結合する抗体はそれぞれ、同一の抗体タグに結合する。例えば、標的タンパク質の同一のエピトープに結合する抗体はそれぞれ、同一の抗体タグに結合し、これにより、標的タンパク質の存在のその後の測定が可能になる。様々な実施形態では、同一の標的タンパク質の異なるエピトープに結合する抗体は、同一の抗体タグに結合可能であり、これにより、標的タンパク質の存在のその後の測定が可能になる。

いくつかの実施形態では、オリゴヌクレオチド配列はそのヌクレオ塩基配列によりコードされ、故に、蛍光を用いる従来のアプローチにより可能なものをはるかに凌駕する、コンビナトリアルタグ空間を付与する。例えば、１０塩基という多くはないタグの長さにより、１００万個を超える固有配列がもたらされ、これは、ヒトプロテオーム内での各エピトープに対して抗体を標識するのに十分である。実際、本アプローチにより、多重化への制限は、固有タグ配列の利用可能性ではなく、多重化反応において、対象となるエピトープを検出可能な特異的抗体の利用可能性となる。

工程４１０は、プライマー４０５による抗体オリゴヌクレオチド３０４のプライミングを表す。図４に示すように、プライマー４０５は、ＰＣＲハンドル、及び共通配列を含むことができる。ここで、プライマー４０５のＰＣＲハンドルは、抗体オリゴヌクレオチド３０４のＰＣＲハンドルに相補的である。したがって、ＰＣＲハンドルのハイブリダイゼーションを考慮すると、プライマー４０５は抗体オリゴヌクレオチド３０４をプライミングする。様々な実施形態では、伸長は、（点線の矢印で示すように）抗体オリゴヌクレオチド３０４のＰＣＲハンドルから生じる。様々な実施形態では、伸長はプライマー４０５のＰＣＲハンドルから生じ、これにより、抗体タグ及び捕捉配列を含む核酸が生成される。

工程４２０は、抗体オリゴヌクレオチド３０４のバーコード化を示す。図４に示すように、バーコード（例えば、細胞バーコード）は、ビーズに取り外し可能に取り付けられ、共通配列にさらに結合する。ここで、細胞バーコードに結合した共通配列は、ＰＣＲハンドル、抗体タグ、及び捕捉配列に結合した共通配列に相補的である。抗体オリゴヌクレオチドを伸長して、共通配列及び細胞バーコードを含める。

様々な実施形態では、抗体オリゴヌクレオチドを増幅することにより、細胞バーコード、共通配列、ＰＣＲハンドル、抗体タグ、及び捕捉配列を含むアンプリコンを生成する。様々な実施形態では、捕捉配列は、ビオチンオリゴヌクレオチド捕捉部位を含有し、これにより、ライブラリー調製前にストレプトアビジンビーズ濃縮が可能となる。様々な実施形態では、バーコード化抗体オリゴヌクレオチドは、増幅ゲノムＤＮＡからのサイズ分離により濃縮することができる。

図４Ｂは、一実施形態に従った、ゲノムＤＮＡ４５５のプライミング及びバーコード化を示す。具体的には、図４Ｂは、ゲノムＤＮＡ４５５のプライミングを伴う工程４６０を示し、ゲノムＤＮＡ４５５のバーコード化及び増幅を伴う工程４７０をさらに示す。様々な実施形態では、工程４６０は、第１のエマルション内で生じ、この間に細胞溶解が生じ、工程４７０は、第２のエマルション内で生じ、この間に細胞バーコード化及び核酸増幅が生じる。このような実施形態では、プライマー４６５を試薬に添加し、工程４７０に示すバーコード及びフォワードプライマーを反応混合物と共に添加する。いくつかの実施形態では、工程４６０及び工程４７０は共に、単一のエマルション（例えば、第２のエマルション）で生じ、この間に、細胞バーコード化及び核酸増幅が生じる。このような実施形態では、工程４６０に示すプライマー４６５、及び、工程４７０に示すバーコード及びフォワードプライマーを反応混合物と共に添加する。

工程４６０において、プライマー４６５（点線により示す）は、ゲノムＤＮＡ４５５の一部とハイブリダイズする。様々な実施形態では、プライマー４６５は、対象となる遺伝子の配列を標的にする遺伝子特異的プライマーである。したがって、プライマー４６５は、対象となる遺伝子に対応するゲノムＤＮＡ４５５の配列と共にハイブリダイズする。様々な実施形態では、プライマー４６５は、ＰＣＲハンドルをさらに含むか、またはＰＣＲハンドルに結合している。

工程４７０において、プライマー４７５（点線により示す）は、ゲノムＤＮＡ４５５の一部とハイブリダイズする。様々な実施形態では、プライマー４７５は、ＰＣＲハンドルを含むか、またはＰＣＲハンドルに結合している。様々な実施形態では、プライマー４７５は、プライマー４６５により標的にされる配列とは異なる、対象となる遺伝子の別の配列を標的にする遺伝子特異的プライマーである。加えて、ビーズに取り外し可能に取り付けられた細胞バーコード（細胞ＢＣ）を、フォワードプライマーのＰＣＲハンドルとハイブリダイズするＰＣＲハンドルに結合する。核酸増幅によりアンプリコンが生成し、各アンプリコンは、細胞バーコード、ＰＣＲハンドル、フォワードプライマー、対象となる遺伝子配列、プライマー４６５、及びＰＣＲハンドルを含む。

配列決定、及びリードアラインメント
増幅核酸（例えばアンプリコン）を配列決定し、配列決定ライブラリーを生成するためのシーケンスリードを入手する。シーケンスリードは、合成による配列決定、ライゲーションによる配列決定、パイロシーケンス法、可逆的ターミネーターの化学作用を用いること、ホスホ結合蛍光ヌクレオチドを用いること、またはリアルタイム配列決定、のいずれかを行うプラットホームを含む、市販されている次世代配列決定（ＮＧＳ）プラットホームを用いて実現することができる。一例として、増幅核酸は、ＩｌｌｕｍｉｎａＭｉＳｅｑプラットホームで配列決定することができる。

パイロシーケンス法の場合、アダプターに対して相補的なオリゴヌクレオチドでコーティングした顆粒を用いて、１つのマトリックス分子を捕捉することにより、ＮＧＳ断片のライブラリーをクローンｉｎ－ｓｉｔｕ増幅する。同じ種類のマトリックスを含有する各顆粒を、「油中水」型のマイクロバブルに配置し、エマルションＰＣＲと呼ばれる方法を用いて、マトリックスをクローン増幅する。増幅後、エマルションは破壊され、顆粒は、配列決定反応の間にフローセルとして作用する滴定ピコプレートの、別個のウェルにスタックされる。４つのｄＮＴＰ試薬のそれぞれをフローセルに、順序立てて複数回投与することは、配列決定酵素、及び、ルシフェラーゼなどの発光レポーターの存在下で生じる。好適なｄＮＴＰが配列決定プライマーの３’末端に添加される場合において、得られるＡＴＰは、ウェル内でのルミネセンスの発光を生み出し、これはＣＣＤカメラを用いて記録される。４００塩基以上の長さを達成することが可能であり、配列の１０^６の読取り値を得ることが可能であり、結果として、最大５億個の塩基対（メガバイト）の配列が得られる。パイロシーケンス法のさらなる詳細は、Ｖｏｅｌｋｅｒｄｉｎｇｅｔａｌ．，ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８，２００９；ＭａｃＬｅａｎｅｔａｌ．，ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６；米国特許第６，２１０，８９１号、；同第６，２５８，５６８号に記載され、これらそれぞれの全体が参照により本明細書に援用されている。

Ｓｏｌｅｘａ／Ｉｌｌｕｍｉｎａプラットホームでは、配列決定データは短い読取り値の形態で作成される。本方法では、ＮＧＳ断片のライブラリーの断片が、オリゴヌクレオチドアンカー分子でコーティングされたフローセルの表面で捕捉される。アンカー分子はＰＣＲプライマーとして使用されるが、マトリックスの長さ、及び、他の付近のアンカーオリゴヌクレオチドへの近接性が原因で、ＰＣＲにより伸長により、隣接するアンカーオリゴヌクレオチドとのハイブリダイゼーション、及び、フローセル表面での架橋構造の形成を伴う、分子の「ヴォールト」の形成がもたらされる。これらのＤＮＡループは変性され、切断される。次いで、直鎖が、可逆的に染色されたターミネーターを用いて配列決定される。配列に含まれるヌクレオチドは、包含後に蛍光を検出することにより測定され、各蛍光剤、及びブロック剤は、次のｄＮＴＰ添加サイクルの前に取り除かれる。Ｉｌｌｕｍｉｎａプラットホームを用いる配列決定のさらなる詳細は、Ｖｏｅｌｋｅｒｄｉｎｇｅｔａｌ．，ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８，２００９；ＭａｃＬｅａｎｅｔａｌ．，ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６；米国特許第６，８３３，２４６号；同第７，１１５，４００号；同第６，９６９，４８８号に見出され、これらそれぞれの全体が参照により本明細書に援用されている。

固体技術を用いる核酸分子の配列決定としては、エマルションＰＣＲを用いる、ＮＧＳ断片のライブラリーのクローン増幅が挙げられる。その後、マトリックスを含有する顆粒を、ガラスフローセルの誘導体化された表面で固定し、アダプターオリゴヌクレオチドに対して相補的なプライマーでアニールする。しかし、３’伸長のために示したプライマーを用いる代わりに、当該相補的なプライマーを使用して、２つのプローブ特異的塩基、続いて６個の縮退塩基、及び４個の蛍光標識のうちの１つを含有する、試験プローブ用のライゲーションのための５’リン酸基を入手する。固体システムにおいて、試験プローブは、各プローブの３’末端における２つの塩基と、５’末端における４つの蛍光染料のうちの１つとの、１６個の可能性のある組み合わせを有する。蛍光染料の色、及び故に、各プローブの同一性は、特定の色空間コードスキームに対応する。プローブのアラインメントの多くのサイクルの後で、プローブのライゲーション、及び蛍光シグナルの検出、変性、続いて、元のプライマーと比較して１塩基移動したプライマーを用いる第２の配列決定サイクル。このようにして、マトリックスの配列を計算により再構築することが可能であり、マトリックス塩基を２回確認することで、正確性の増加に繋がる。固体技術を用いる配列決定のさらなる詳細は、Ｖｏｅｌｋｅｒｄｉｎｇｅｔａｌ．，ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８，２００９；ＭａｃＬｅａｎｅｔａｌ．，ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６；米国特許第５，９１２，１４８号、；同第６，１３０，０７３号に見出され、これらそれぞれは、その全体が参照により組み込まれる。

特定の実施形態では、ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓ製のＨｅｌｉＳｃｏｐｅを使用する。配列決定は、ポリメラーゼの添加、及び、蛍光標識したｄＮＴＰ試薬の連続添加により達成される。切り替えにより、ｄＮＴＰに対応する蛍光シグナルの概観がもたらされ、特定のシグナルが、各ｄＮＴＰ添加サイクルの前に、ＣＣＤカメラにより捕捉される。配列の読取り値の長さは、２５～５０ヌクレオチドで変化し、分析作業サイクル１回当たりで、全収率が１０億個のヌクレオチド対を超える。ＨｅｌｉＳｃｏｐｅを用いる配列決定を行うためのさらなる詳細は、Ｖｏｅｌｋｅｒｄｉｎｇｅｔａｌ．，ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８，２００９；ＭａｃＬｅａｎｅｔａｌ．，ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６；米国特許第７，１６９，５６０号；同第７，２８２，３３７号；同第７，４８２，１２０号；同第７，５０１，２４５号；同第６，８１８，３９５号；同第６，９１１，３４５号；同第７，５０１，２４５号に見出され、これらそれぞれは、その全体が参照により組み込まれる。

いくつかの実施形態では、Ｒｏｃｈｅの配列決定システム４５４を使用する。配列決定４５４は、２つの工程を伴う。第１の工程では、ＤＮＡは約３００～８００個の塩基対の断片に切断され、これらの断片は平滑末端を有する。オリゴヌクレオチドアダプターは次に、断片の末端にライゲーションされる。アダプターは、断片の増幅及び配列決定のためのプライマーとして機能する。断片は、例えば、５’－ビオチンタグを含有するアダプターを用いて、ＤＮＡ捕捉ビーズ、例えばストレプトアビジンでコーティングされたビーズに取り付けることができる。顆粒に取り付けられた断片は、油－水エマルションのドロップレット内で、ＰＣＲにより増幅される。結果は、各ビーズにおける、クローン増幅したＤＮＡ断片の複数のコピーである。第２の段階において、顆粒はウェルで捕捉される（体積は数ピコリットル）。パイロシーケンス法を、各ＤＮＡ断片で並行して行う。１つ以上のヌクレオチドを添加することにより、光シグナルの生成がもたらされ、これは、配列決定機器のＣＣＤカメラに記録される。シグナル強度は、含まれるヌクレオチドの数に比例する。パイロシーケンス法はピロホスフェート（ＰＰｉ）を用い、これはヌクレオチドの添加の際に放出される。ＰＰｉは、アデノシン５’ホスホ硫酸の存在下で、ＡＴＰスルフリラーゼを使用してＡＴＰに転換される。ルシフェラーゼはＡＴＰを使用して、ルシフェリンをオキシルシフェリンに転換し、この反応の結果、光が生成され、これが検出及び分析される。配列決定４５４を行うためのさらなる詳細はＭａｒｇｕｌｉｅｓｅｔａｌ．（２００５）Ｎａｔｕｒｅ４３７：３７６－３８０に見出され、その全体が参照により本明細書に組み込まれている。

ＩｏｎＴｏｒｒｅｎｔ技術は、ＤＮＡ重合の間に放出される水素イオンの検出に基づく、ＤＮＡ配列決定法である。マイクロウェルは、配列決定されるＮＧＳ断片のライブラリーの断片を含有する。マイクロウェル層の下には、超感度イオンセンサＩＳＦＥＴがある。全ての層が、エレクトロニクス産業で使用されるチップ同様に、半導体ＣＭＯＳチップの中に含まれる。ｄＮＴＰが生長する相補鎖に組み込まれるとき、水素イオンが放出され、超感度イオンセンサを励起する。ホモポリマーが鋳型の配列に存在する場合、複数のｄＮＴＰ分子が１サイクルに含められる。これにより、相当量の、放出される水素原子、及び、それに比例した、より大きな電気シグナルがもたらされる。この技術は、修飾ヌクレオチドまたは光学装置を用いない他の配列決定技術とは異なる。ＩｏｎＴｏｒｒｅｎｔ技術についてのさらなる詳細は、Ｓｃｉｅｎｃｅ３２７（５９７０）：１１９０（２０１０）；米国特許出願公開第２００９００２６０８２号、同第２００９０１２７５８９号、同第２０１００３０１３９８号、同第２０１００１９７５０７号、同第２０１００１８８０７３号、及び同第２０１００１３７１４３号に見出され、これらそれぞれは、その全体が参照により組み込まれる。

様々な実施形態では、ＮＧＳ法から得られる配列決定リードは、質により分類し、当該技術分野において公知の任意のアルゴリズム、例えばＰｙｔｈｏｎｓｃｒｉｐｔｂａｒｃｏｄｅＣｌｅａｎｕｐ．ｐｙを使用するバーコード配列によりグルーピングすることができる。いくつかの実施形態では、その塩基の約２０％超が、約９９％のベースコールの正確性を示す、Ｑ２０の品質スコア（Ｑ－スコア）を有する場合、所与の配列決定リードを廃棄してよい。いくつかの実施形態では、約５％超、約１０％、約１５％、約２０％、約２５％、約３０％が、それぞれ、約９０％、約９９％、約９９．９％、約９９．９９％、約９９．９９９％、約９９．９９９９％、またはそれ以上のベースコールの正確性を示す、Ｑ１０未満、Ｑ２０、Ｑ３０、Ｑ４０、Ｑ５０、Ｑ６０、またはそれ以上のＱ－スコアを有する場合、所与の配列決定リードを廃棄してよい。

いくつかの実施形態では、５０個未満のリードを含有するバーコードと関連する配列決定リードを破棄して、シングルセルを表す全てのバーコード基が、十分な数の高品質のリードを確実に含有することができる。いくつかの実施形態では、３０未満、４０未満、５０未満、６０未満、７０未満、８０未満、９０未満、１００未満、またはそれ以上を含有するバーコードと関連する全ての配列決定リードを廃棄して、シングルセルを表すバーコード基の質を確保することができる。

様々な実施形態では、共通のバーコード配列を有するシーケンスリード（例えば、同じ細胞に由来するシーケンスリードを意味する）を、当該技術分野において既知の方法を使用して参照ゲノムとアラインし、アラインメント位置情報を測定することができる。例えば、ゲノムＤＮＡに由来するシーケンスリードを、一定範囲の参照ゲノムの位置にアラインすることができる。様々な実施形態では、ゲノムＤＮＡに由来するシーケンスリードを、参照ゲノムの遺伝子に対応する一定範囲の位置にアラインすることができる。アラインメント位置情報は、所与のシーケンスリードの開始ヌクレオチド塩基及び末端ヌクレオチド塩基に対応する、参照ゲノム内の領域の開始位置及び終了位置を示し得る。参照ゲノム内の領域は、標的遺伝子、または遺伝子のセグメントと関連する場合がある。シーケンスリードを参照配列にアラインするためのさらなる詳細は、米国出願第１６／２７９，３１５号に記載されており、その全体が参照により本明細書に組み込まれている。様々な実施形態では、ＳＡＭ（配列アラインメントマップ）フォーマット、またはＢＡＭ（２元アラインメントマップ）フォーマットを有する出力ファイルを、例えば、細胞軌道を測定するための後の分析のために生成し、出力することができる。

細胞遺伝子型及び表現型
ゲノムＤＮＡ及び抗体オリゴヌクレオチドに由来する核酸のシーケンスリードを分析し、細胞表現型及び細胞遺伝子型を測定する。

様々な実施形態では、細胞遺伝子型を測定することは、細胞のゲノム内で１つ以上の変異を測定することを意味する。特定の実施形態では、ＴａｐｅｓｔｒｉＩｎｓｉｇｈｔｓソフトウェアを実装して、細胞のゲノム内で１つ以上の変異を同定する。一実施形態では、１つ以上の変異は、一塩基変化（例えばＳＮＶ）、またはヌクレオチド変化の短い配列（例えば、短いインデル）を含む。ここで、細胞のゲノムＤＮＡに由来する、アラインされたシーケンスリードを参照ゲノムに対して分析し、参照ゲノムに存在するヌクレオチド塩基に対応する細胞変異に存在する、可能性のあるヌクレオチド塩基間の差を測定する。様々な実施形態では、ＳＮＶ及び／または短いインデルを同定することは、ＢＷＡ、ＮｏｖｏＡｌｉｇｎ、ＴｏｒｒｅｎｔＭａｐｐｉｎｇＡｌｉｇｎｍｅｎｔＰｒｏｇｒａｍ（ＴＭＡＰ）、ＶａｒＳｃａｎ２、ｑＳＮＰ、Ｓｈｉｍｍｅｒ、ＲＡＤＩＡ、ＳＯＡＰｓｎｖ、ＶａｒＤｉｃｔ、ＳＮＶＭｉｘ２、ＳＰＬＩＮＴＥＲ、ＳＮＶｅｒ、ＯｕｔＬｙｚｅｒ、Ｐｉｓｃｅｓ、ＩＳＯＷＮ、ＳｏｍＶａｒＩＵＳ、及びＳｉＮＶＩＣＴを含むがこれらに限定されない、任意の一般に入手可能なＳＮＶコーラーアルゴリズムを実装することにより実現可能である。

一実施形態では、１つ以上の変異は、ＣＮＶ及び／または、長い配列（例えば、長いインデル）を包含する変異などの構造バリアントを含む。ここで、スプリットリード及びデノボアセンブリ法を使用して、ＣＮＶ、及び／または長いインデルを同定することができる。様々な実施形態では、ＣＮＶコーラーワークフローは、以下の工程の１つ以上：結合、ＧＣ含有量補正、マッピング性補正、アウトライナービンの除去、アウトライナー細胞の除去、セグメンテーション、及び、絶対数のコーリングを伴う。ＣＮＶコーラーワークフローのさらなる詳細は、Ｆａｎ，Ｘ．ｅｔａｌ，ＭｅｔｈｏｄｓｆｏｒＣｏｐｙＮｕｍｂｅｒＡｂｅｒｒａｔｉｏｎＤｅｔｅｃｔｉｏｎｆｒｏｍＳｉｎｇｌｅ－ｃｅｌｌＤＮＡＳｅｑｕｅｎｃｉｎｇＤａｔａ，ｂｉｏＲｘｉｖ６９６１７９に記載されており、その全体が参照により本明細書に組み込まれている。様々な実施形態では、ＣＮＶ及び／または長いインデルを同定することは、ＨＭＭｃｏｐｙ、ＳｅｑＳｅｇ、ＣＮＶ－ｓｅｑ、ｒＳＷ－ｓｅｑ、ＦＲＥＥＣ、ＣＮＡｓｅｇ、ＲｅａｄＤｅｐｔｈ、ＣＮＶａｔｏｒ、ｓｅｑＣＢＳ、ｓｅｑＣＮＡ、ｍ－ＨＭＭ、Ｇｉｎｋｇｏ、ｎｂＣＮＶ、ＡｎｅｕＦｉｎｄｅｒ、ＳＣＮＶ、及びＣＮＶＩＦＴＶを含むがこれらに限定されない、任意の一般に入手可能なＣＮＶコーラーを実装することにより実現可能である。

様々な実施形態では、細胞ゲノムの１つ以上の変異を同定するのにそれらを使用する前に、シーケンスリードを事前処理する。例えば、細胞由来のリードを、細胞の全リード計数により正規化し、アンプリコンリード分布に基づく階層クラスター化によりグルーピングする。細胞からのアンプリコン計数を、対照群（例えば、既知のＣＮＶを含む対照細胞クラスター）の対応するアンプリコンのメジアンで除する。したがって、シーケンスビーズの正規化した割合を使用して、各遺伝子に対するＣＮＶを計算した。

様々な実施形態では、細胞遺伝子型を測定するために使用したシーケンスリードは、細胞ゲノムの様々な領域に由来することができる。細胞ゲノムのこれらの領域は、コード領域及び非コード領域（例えば、イントロン、制御エレメント、転写因子結合部位、染色体転座接合部）の両方を含む。したがって、１つ以上の変異（例えば、ＳＮＶ、ＣＮＶ、及びインデル）を、コード領域及び非コード領域の両方で同定することができる。ゲノムＤＮＡから細胞遺伝子型を直接測定する、上で詳述したシングルセルワークフロー分析により、コード領域及び非コード領域の両方に由来する変異の同定が可能となる一方で、さほど直接的でない方法（例えば、ＲＮＡを逆転写する方法）は、コード領域からの変異のみを同定する。

細胞表現型を表現するために、抗体コンジュゲートオリゴヌクレオチドに由来するシーケンスリードを分析する。具体的には、抗体オリゴヌクレオチドの抗体タグの配列を配列決定する。（オリゴヌクレオチドがコンジュゲートした）対応する抗体が、以前に細胞の検体に結合していたことを、シーケンスリードの存在は示す。言い換えれば、シーケンスリードが存在することは、細胞が標的検体を発現したことを示す。

様々な実施形態では、細胞表現型を測定することは、標的検体の発現レベルを定量化することを伴う。様々な実施形態では、標的検体の発現レベルを定量化することは、抗体コンジュゲートオリゴヌクレオチドに由来するシーケンスリードを正規化することを伴う。様々な実施形態では、シーケンスリードを正規化することは、有心対数比（ＣＬＲ）変換を行うことを伴う。様々な実施形態では、シーケンスリードの正規化は、ＤｅｎｏｉｓｅｄａｎｄＳｃａｌｅｄｂｙＢａｃｋｇｒｏｕｎｄ（ＤＳＢ）を行うことを伴う。ＤＳＢ正規化のさらなる説明は、Ｍｕｌｅ，Ｍ．ｅｔａｌ．“Ｎｏｒｍａｌｉｚｉｎｇａｎｄｄｅｎｏｉｓｉｎｇｐｒｏｔｅｉｎｅｘｐｒｅｓｓｉｏｎｄａｔａｆｒｏｍｄｒｏｐｌｅｔ－ｂａｓｅｄｓｉｎｇｌｅｃｅｌｌｐｒｏｆｉｌｉｎｇ．” ｂｉｏＲｘｉｖ２０２０．０２．２４．９６３６０３に見出され、その全体が参照により本明細書に組み込まれている。

様々な実施形態では、細胞表現型は、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、１００、５００、１０００、５０００、または１０，０００個の標的検体の細胞発現を意味することができる。したがって、シングルセルワークフロー分析により、細胞の複数の標的検体に関する発現プロファイルを得ることができる。

様々な実施形態では、細胞の遺伝子型及び表現型を使用して、細胞を分類することができる。例えば、細胞を、少なくとも細胞の遺伝子型を共有する細胞、少なくとも細胞の表現型を共有する細胞、または、細胞の遺伝子型と表現型の両方を共有する細胞の集団に分類することができる。様々な実施形態では、シングルセルワークフロー分析を、細胞の集団において各細胞で行う。したがって、集団における各細胞の、細胞遺伝子型及び細胞表現型を使用して、各細胞を分類し、集団内の細胞の分布について理解することができる。様々な実施形態では、分類した細胞は、存在する亜集団についての考察をもたらす。様々な実施形態では、細胞を分類することは、細胞の遺伝子型及び表現型を、既知の遺伝子型及び表現型により特徴付けられる、既知の細胞集団のライブラリーと比較することを伴う。したがって、細胞が、既知の細胞集団と、遺伝子型を共有するか、表現型を共有するか、または、遺伝子型と表現型の両方を共有する場合、細胞を既知の細胞集団のカテゴリーに分類することができる。

例を提供するために、細胞集団を、がんを有する疑いのある対象から入手することができ、集団の各細胞を、シングルセルワークフローを用いて分析し、各細胞の遺伝子型及び各電池を測定することができる。既知の参照細胞の遺伝子型及び表現型と比較することにより、細胞を、その遺伝子型及び表現型に従い分類する。したがって、遺伝子型及び表現型を用いて集団の細胞を分類することにより、対象に対してがん治療の選択を案内することができる細胞の分布が明らかとなる。例えば、集団において、細胞の大きな集団が、特定の治療法に対して耐性を有することが知られている既知の細胞集団と共に分類される場合、より有効である可能性が高い代替の治療法を、がんを治療するために選択することができる。

様々な実施形態では、細胞の遺伝子型及び表現型を使用して、細胞の集団内で亜集団を同定する。これは、以前に知られていなかった新しい亜集団を発見するのに有用である。例えば、以前は均質と考えられていた細胞集団を分析して、異なる遺伝子型と表現型の組み合わせを有する細胞の、複数の亜集団を明らかにすることができる。様々な実施形態では、細胞集団は、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、または２０個の、異なる亜集団を明らかにすることができる。

様々な実施形態では、シングルセルワークフロー分析を、細胞の集団において各細胞で行い、集団内の細胞の、細胞遺伝子型及び細胞表現型を使用して、遺伝子型及び表現型により特徴付けられる細胞の亜集団を同定する。一実施形態では、細胞の遺伝子型及び表現型を用いて亜集団を同定することは、次元削減分析を行うことを伴う。一実施形態では、細胞の遺伝子型及び表現型を用いて亜集団を同定することは、監督されていないクラスター化分析を行うことを伴う。一実施形態では、細胞の遺伝子型及び表現型を用いて亜集団を同定することは、次元削減分析、及び、監督されていないクラスター化分析を行うことを伴う。

監督されていないクラスター分析の例としては、階層クラスター化、ｋ平均クラスター化、混合物モデルを用いるクラスター化、ノイズを有するアプリケーションの密度ベース空間クラスター化（ＤＢＳＣＡＮ）、クラスター化構造を同定するための発注点（ＯＰＴＩＣＳ）、またはこれらの組み合わせが挙げられる。次元削減分析の例としては、主成分分析（ＰＣＡ）、カーネルＰＣＡ、グラフに基づくカーネルＰＣＡ、線形判別分析、一般化判別分析、オートエンコーダー、非負値行列因子分解、Ｔ分布型確率的近傍埋め込み法（ｔ－ＳＮＥ）、または、均一マニホールド近似及び投影（ＵＭＡＰ）ならびにｄｅｎｓ－ＵＭＡＰが挙げられる。

特定の実施形態では、次元削減分析及び監督されていないクラスター化は、集団内の細胞の、細胞遺伝子型または細胞表現型のいずれかのうちの少なくとも１つにて行われる。したがって、細胞の細胞遺伝子型または細胞表現型のいずれかのうちの少なくとも１つに従い、細胞のクラスターを生成する。特定の実施形態では、１つ以上の遺伝子に対して検出されたＳＮＶに従い、細胞のクラスターを生成する。特定の実施形態では、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、３０、４０、５０、６０、７０、８０、９０、または１００個の遺伝子に対して検出されたＳＮＶに従い、細胞のクラスターを生成する。特定の実施形態では、１つ以上の遺伝子に対して検出されたＣＮＶに従い、細胞のクラスターを生成する。特定の実施形態では、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、３０、４０、５０、６０、７０、８０、９０、または１００個の遺伝子に対して検出されたＣＮＶに従い、細胞のクラスターを生成する。特定の実施形態では、１つ以上の検体に対する検体発現のレベルに従い、細胞のクラスターを生成する。特定の実施形態では、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、３０、４０、５０、６０、７０、８０、９０、または１００個の検体に対する検体発現のレベルに従い、細胞のクラスターを生成する。

様々な実施形態では、クラスター内の個別細胞を、細胞遺伝子型または細胞表現型の他方を用いて標識し、クラスター内での、またはクラスターにまたがってのいずれかでの、細胞のあらゆる亜集団を明らかにする。一例として、細胞表現型（例えば、検体発現）を用いて細胞のクラスターを生成することができ、細胞遺伝子型（例えば変異）を使用して、クラスター内で細胞を標識する。別の例として、細胞遺伝子型を使用して細胞のクラスターを生成し、細胞表現型を使用して、クラスター内で細胞を標識する。

具体例を提供するために、次元削減分析、及び監督されていないクラスター化を、細胞の細胞表現型にて行う。具体的には、次元削減分析を、抗体オリゴヌクレオチドに由来する、正規化したシーケンスリード値（例えば、ＣＬＲ値）にて行うことができる。次いで、次元削減空間にて、ＣＬＲ正規化したシーケンスリード値にて監督されていないクラスター化を行い、細胞のクラスターを生成する。ここで、類似の発現プロファイルを有する細胞を、共通のクラスター内でクラスター化することができる一方で、非類似の検体発現プロファイルを有する細胞は、異なるクラスター内でクラスター化することができる。細胞の細胞遺伝子型を用いて、クラスター内で個別細胞を標識することができる。例えば、クラスター内の個別細胞を、特定の変異（例えば、遺伝子における特定のＳＮＶ、または、特定の遺伝子に対するコピー数の増減）を有するものとして標識することができる。いくつかのシナリオでは、クラスター内の個別細胞を、２つ以上の変異（例えば、１つ以上の遺伝子におけるＳＮＶ、または、１つ以上の遺伝子におけるコピー数の増減）を有するものとして標識することができる。

別の例として、次元削減分析、及び監督されていないクラスター化を、細胞の細胞遺伝子型にて行う。具体的には、細胞内で同定された１つ以上の遺伝子の変異（例えば、ＳＮＶ及び／またはＣＮＶ）に従い、次元削減分析を行うことができる。次いで、次元削減空間にて、監督されていないクラスター化を行い、細胞のクラスターを生成する。ここで、同様の遺伝子型（例えば、１つ以上の遺伝子の変異）を有する細胞を、共通のクラスター内でクラスター化することができる一方で、非類似の遺伝子型を有する細胞は、異なるクラスター内でクラスター化することができる。細胞の細胞表現型を用いて、クラスター内で個別細胞を標識することができる。例えば、クラスター内の個別細胞を、特定の検体を発現する、または発現しないものとして標識することができる。いくつかのシナリオでは、クラスター内の個別細胞を、２つ以上の検体を発現する、または２つ以上の検体を発現しないものとして標識することができる。

様々な実施形態では、次元削減分析、及び監督されていないクラスター化を、細胞の細胞遺伝子型及び細胞表現型の両方にて行う。ここで、同様の遺伝子型（例えば、１つ以上の遺伝子の変異）及び表現型を有する細胞を、共通のクラスター内でクラスター化することができる一方で、非類似の遺伝子型及び表現型を有する細胞は、異なるクラスター内でクラスター化することができる。

細胞の標識されたクラスターを分析することで、いくつかのシナリオにおいては、遺伝子型（例えば変異）、及び表現型（例えば検体発現）の特定の組み合わせを有する、細胞の亜集団が明らかとなる。一実施形態では、細胞の亜集団は、共通の表現型、及び共通の遺伝子型を有する細胞のクラスターを意味することができる。例えば、細胞の亜集団は、検体を発現し、遺伝子の特定の位置でＳＮＶを有する、細胞のクラスターを意味することができる。別の例として、細胞の亜集団は、検体を有せず、遺伝子のコピー数が増加した細胞のクラスターを意味することができる。細胞のクラスターの、細胞表現型（例えば、検体の発現または発現の欠如）と、細胞遺伝子型（例えば、１つ以上のＳＮＶの有無、または、遺伝子のコピー数の増減）の、任意の組み合わせを、亜集団として同定することができる。

細胞及び細胞集団
本明細書に記載する実施形態は、細胞のシングルセル分析を伴う。様々な実施形態では、細胞は、健常な細胞である。様々な実施形態では、細胞は病気の細胞である。病気の細胞の例としては、血液系腫瘍または充実性腫瘍の細胞などの、がん細胞が挙げられる。血液系腫瘍の例としては、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、またはＴ細胞リンパ腫が挙げられるが、これらに限定されない。充実性腫瘍の例としては、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫が挙げられるが、これらに限定されない。

様々な実施形態では、シングルセル分析は、細胞の集団にて行われる。細胞の集団は、細胞の不均質な集団であることができる。一実施形態では、細胞の集団は、がん性細胞と非がん性細胞の両方を含むことができる。一実施形態では、細胞の集団は、それらの間で異種であるがん性細胞を含むことができる。様々な実施形態では、細胞の集団は、対象から入手することができる。例えば、試料を対象から採取し、シングルセル分析を行うために、試料中の細胞の集団を単離する。

標的化パネル
本明細書にて開示した実施形態は、１つ以上の遺伝子を照会するための、加えて、１つ以上のタンパク質の発現、及び／または発現レベルを照会するための、標的化ＤＮＡパネルを含む。様々な実施形態では、標的化ＤＮＡパネル、及びタンパク質パネルは、特定のがん（例えば、血液系腫瘍、及び／または充実性腫瘍）のために構築される。図５及び６は、一実施形態に従った、シングルセルワークフローを用いて分析した例示的な遺伝子標的及びタンパク質標的を示す。具体的には、図５Ａで同定される遺伝子、及び図５Ｂで同定されるタンパク質は、急性骨髄性白血病を検出または分析するための、シングルセルワークフロー用標的遺伝子及びタンパク質であってよい。

様々な実施形態では、標的化遺伝子パネルは、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、３００、３５０、４００、４５０、５００、または１０００個の遺伝子を含む。様々な実施形態では、標的化タンパク質パネルは、少なくとも１個、少なくとも２個、少なくとも５個、少なくとも１０個、少なくとも２０個、少なくとも３０個、少なくとも４０個、少なくとも５０個、少なくとも６０個、少なくとも７０個、少なくとも８０個、少なくとも９０個、少なくとも１００個、少なくとも２００個、少なくとも３００個、少なくとも４００個、少なくとも５００個、または少なくとも１００個の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、がんを検出するために特異的なものであり、ＡＢＬ１、ＡＤＯ、ＡＫＴ１、ＡＬＫ、ＡＰＣ、ＡＲ、ＡＴＭ、ＢＲＡＦ、ＣＤＨ１、ＣＤＫ４、ＣＤＫＮ２Ａ、ＣＳＦ１Ｒ、ＣＴＮＮＢ１、ＤＤＲ２、ＥＧＦＲ、ＥＲＢＢ２、ＥＲＢＢ３、ＥＲＢＢ４、ＥＳＲ１、ＥＺＨ２、ＦＢＸＷ７、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＮＦ１Ａ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＪＡＫ１、ＪＡＫ２、ＪＡＫ３、ＫＤＲ、ＫＩＴ、ＫＲＡＳ、ＭＡＰ２Ｋ１、ＭＡＰ２Ｋ２、ＭＥＴ、ＭＬＨ１、ＭＰＬ、ＭＴＯＲ、ＮＯＴＣＨ１、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＴＥＮ、ＰＴＰＮ１１、ＲＡＦ１、ＲＢ１、ＲＥＴ、ＳＭＡＤ４、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＲＣ、ＳＴＫ１１、ＴＰ５３、及びＶＨＬのうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、急性リンパ性白血病を検出または分析するのに特異的なものであり、ＧＮＢ１、ＤＮＭＴ３Ａ、ＦＡＴ１、ＭＹＢ、ＰＡＸ５、ＣＨＤ４、ＯＲＡＩ１、ＴＰ５３ＢＰ１、ＩＫＺＦ３、ＷＴＩＰ、ＢＣＯＲ、ＲＰＬ２２、ＡＳＸＬ２、ＡＴＲＸ、ＩＫＺＦ１、ＫＬＦ９、ＥＴＶ６、ＦＬＴ３、ＨＣＮ４、ＳＴＡＴ５Ｂ、ＣＮＯＴ３、ＵＳＰ９Ｘ、ＳＬＣ２５Ａ３３、ＺＦＰ３６Ｌ２、ＤＮＡＨ５、ＥＧＦＲ、ＡＢＬ１、ＣＤＫＮ１Ｂ、ＦＲＥＭ２、ＩＤＨ２、ＴＳＰＹＬ２、ＡＳＸＬ１、ＤＤＸ３Ｘ、ＴＡＬ１、ＺＥＢ２、ＩＬ７Ｒ、ＢＲＡＦ、ＮＯＴＣＨ１、ＫＲＡＳ、ＲＢ１、ＣＲＥＢＢＰ、ＭＥＤ１２、ＺＮＦ２１７、ＫＤＭ６Ａ、ＪＡＫ１、ＩＤＨ１、ＰＩＫ３Ｒ１、ＥＺＨ２、ＧＡＴＡ３、ＨＤＡＣ７、ＭＤＧＡ２、ＵＳＰ７、ＺＦＲ２、ＩＴＳＮ１、ＢＣＯＲＬ１、ＲＰＬ５、ＳＥＴＤ２、ＥＢＦ１、ＫＭＴ２Ｃ、ＰＴＥＮ、ＫＭＴ２Ｄ、ＳＥＲＰＩＮＡ１、ＣＴＣＦ、ＤＮＭ２、ＲＵＮＸ１、ＰＨＦ６、ＯＶＧＰ１、ＴＢＬ１ＸＲ１、ＬＲＦＮ２、ＺＦＨＸ４、ＳＯＲＣＳ１、ＢＴＧ１、ＢＣＬ１１Ｂ、ＴＰ５３、ＳＭＡＲＣＡ４、ＥＲＧ、ＲＰＬ１０、ＮＲＡＳ、ＰＩＫ３ＣＡ、ＣＣＮＤ３、ＭＹＣ、ＷＴ１、ＳＨ２Ｂ３、ＡＫＴ１、ＮＣＯＲ１、ＥＰＯＲ、ＸＢＰ１、ＵＳＨ２Ａ、ＬＥＦ１、ＯＰＮ５、ＪＡＫ２、ＬＭＯ２、ＰＴＰＮ１１、ＭＧＡ、ＮＦ１、ＪＡＫ３、ＳＬＣ５Ａ１、ＭＹＣＮ、ＦＢＸＷ７、ＰＨＩＰ、ＣＤＫＮ２Ａ、ＣＢＬ、ＮＯＳ１、ＳＰＴＢＮ５、ＳＵＺ１２、ＵＢＡ２、及びＥＰ３００のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは慢性リンパ性白血病を検出または分析するのに特異的なものであり、ＡＴＭ、ＣＨＤ２、ＦＢＸＷ７、ＮＯＴＣＨ１、ＳＰＥＮ、ＢＣＯＲ、ＣＲＥＢＢＰ、ＫＲＡＳ、ＮＲＡＳ、ＴＰ５３、ＢＩＲＣ３、ＣＸＣＲ４、ＬＲＰ１Ｂ、ＰＬＣＧ２、ＸＰＯ１、ＢＲＡＦ、ＤＤＸ３Ｘ、ＭＡＰ２Ｋ１、ＰＯＴ１、ＺＭＹＭ３、ＢＴＫ、ＥＧＲ２、ＭＥＤ１２、ＲＰＳ１５、ＣＡＲＤ１１、ＥＺＨ２、ＭＹＤ８８、ＳＥＴＤ２、ＣＤ７９Ｂ、ＦＡＴ１、ＮＦＫＢＩＥ、及びＳＦ３Ｂ１のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、慢性骨髄性白血病を検出または分析するのに特異的なものであり、ＤＮＭＴ３Ａ、ＣＤＫＮ２Ａ、ＴＰ５３、Ｕ２ＡＦ１、ＫＩＴ、ＡＢＬ１、ＳＥＴＢＰ１、ＴＥＴ２、ＥＴＶ６、ＡＳＸＬ１、ＥＺＨ２、ＦＬＴ３、及びＲＵＮＸ１のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、古典的ホジキンリンパ腫を検出または分析するのに特異的なものであり、Ｂ２Ｍ、ＮＦＫＢＩＡ、ＳＯＣＳ１、ＴＮＦＡＩＰ３、ＭＹＢ、ＰＲＤＭ１、ＳＴＡＴ３、ＴＰ５３、ＭＹＣ、ＲＥＬ、及びＳＴＡＴ６のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルはびまん性大細胞型Ｂ細胞リンパ腫を検出または分析するのに特異的なものであり、ＡＴＭ、ＣＲＥＢＢＰ、ＭＹＤ８８、ＳＴＡＴ６、Ｂ２Ｍ、ＥＰ３００、ＮＯＴＣＨ１、ＴＥＴ２、ＢＣＬ２、ＥＺＨ２、ＮＯＴＣＨ２、ＴＮＦＡＩＰ３、ＢＲＡＦ、ＦＯＸＯ１、ＰＩＫ３ＣＤ、ＴＮＦＲＳＦ１４、ＣＡＲＤ１１、ＧＮＡ１３、ＰＩＭ１、ＴＰ５３、ＣＤ７９Ａ、ＣＤ７９Ｂ、ＫＭＴ２Ｄ、ＭＹＣ、ＰＴＥＮ、及びＳＯＣＳ１のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、びまん性大細胞型Ｂ細胞リンパ腫を検出または分析するのに特異的なものであり、ＴＮＦＲＳＦ１４、ＴＮＦＡＩＰ３、ＳＴＡＴ６、ＣＤ７９Ｂ、ＡＲＩＤ１Ａ、ＣＡＲＤ１１、ＣＲＥＢＢＰ、ＢＣＬ２、ＮＯＴＣＨ２、ＥＺＨ２、ＳＯＣＳ１、ＥＰ３００、ＴＥＴ２、ＫＭＴ２Ｄ、及びＴＰ５３のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、マントル細胞リンパ腫を検出または分析するのに特異的なものであり、ＡＴＭ、ＣＣＮＤ１、ＮＯＴＣＨ１、ＵＢＲ５、ＢＩＲＣ３、ＫＭＴ２Ｄ、ＴＰ５３、及びＷＨＳＣ１のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、多発性骨髄腫を検出または分析するのに特異的なものであり、ＢＲＡＦ、ＦＡＭ４６Ｃ、ＩＲＦ４、ＰＩＫ３ＣＡ、ＣＣＮＤ１、ＦＧＦＲ３、ＪＡＫ２、ＲＢ１、ＤＩＳ３、ＦＬＴ３、ＫＲＡＳ、ＴＰ５３、ＤＮＭＴ３Ａ、ＩＤＨ１、ＮＲＡＳ、及びＴＲＡＦ３のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、骨髄異形成症候群を検出または分析するのに特異的なものであり、ＡＳＸＬ１、ＦＬＴ３、ＮＦ１、ＴＰ５３、ＢＣＯＲ、ＧＡＴＡ２、ＮＲＡＳ、Ｕ２ＡＦ１、ＣＢＬ、ＩＤＨ１、ＰＴＰＮ１１、ＺＲＳＲ２、ＤＮＭＴ３Ａ、ＩＤＨ２、ＲＵＮＸ１、ＥＴＶ６、ＪＡＫ２、ＳＦ３Ｂ１、ＥＺＨ２、ＫＲＡＳ、及びＴＥＴ２のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、骨髄病を検出または分析するのに特異的なものであり、ＡＳＸＬ１、ＥＲＧ、ＫＤＭ６Ａ、ＮＲＡＳ、ＳＭＣ１Ａ、ＡＴＭ、ＥＴＶ６、ＫＩＴ、ＰＨＦ６、ＳＭＣ３、ＢＣＯＲ、ＥＺＨ２、ＫＭＴ２Ａ、ＰＰＭ１Ｄ、ＳＴＡＧ２、ＢＲＡＦ、ＦＬＴ３、ＫＲＡＳ、ＰＴＥＮ、ＳＴＡＴ３、ＣＡＬＲ、ＧＡＴＡ２、ＭＰＬ、ＰＴＰＮ１１、ＴＥＴ２、ＣＢＬ、ＧＮＡＳ、ＭＹＣ、ＲＡＤ２１、ＴＰ５３、ＣＨＥＫ２、ＩＤＨ１、ＭＹＤ８８、ＲＵＮＸ１、Ｕ２ＡＦ１、ＣＳＦ３Ｒ、ＩＤＨ２、ＮＦ１、ＳＥＴＢＰ１、ＷＴ１、ＤＮＭＴ３Ａ、ＪＡＫ２、ＮＰＭ１、ＳＦ３Ｂ１、及びＺＲＳＲ２のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、骨髄増殖性腫瘍を検出または分析するのに特異的なものであり、ＣＳＦ３Ｒ、ＩＤＨ１、ＪＡＫ２、ＡＲＡＦ、ＣＨＥＫ２、ＭＰＬ、ＫＩＴ、ＣＢＬ、ＳＥＴＢＰ１、ＳＦ３Ｂ１、ＮＲＡＳ、ＴＥＴ２、ＩＤＨ２、ＡＳＸＬ１、ＣＡＬＲ、ＤＮＭＴ３Ａ、ＥＺＨ２、ＴＰ５３、ＲＵＮＸ１、ＮＦ１、ＥＲＢＢ４、ＰＴＰＮ１１、ＫＲＡＳ、及びＵ２ＡＦ１のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化遺伝子パネルは、Ｔ細胞リンパ腫を検出または分析するのに特異的なものであり、ＡＬＫ、ＣＤＫＮ２Ａ、ＩＤＨ２、ＲＨＯＡ、ＡＲＩＤ１Ａ、ＤＤＸ３Ｘ、ＪＡＫ３、ＳＴＡＴ３、ＡＴＭ、ＤＮＭＴ３Ａ、ＫＭＴ２Ｃ、ＴＥＴ２、ＣＡＲＤ１１、ＦＡＳＰＬＣＧ１、及びＴＰ５３のうちの１つ以上の遺伝子を含む。

様々な実施形態では、標的化タンパク質パネルは、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、３００、３５０、４００、４５０、５００、または１０００個のタンパク質を含む。様々な実施形態では、標的化タンパク質パネルは、少なくとも１個、少なくとも２個、少なくとも５個、少なくとも１０個、少なくとも２０個、少なくとも３０個、少なくとも４０個、少なくとも５０個、少なくとも６０個、少なくとも７０個、少なくとも８０個、少なくとも９０個、少なくとも１００個、少なくとも２００個、少なくとも３００個、少なくとも４００個、少なくとも５００個、または少なくとも１００個のタンパク質を含む。様々な実施形態では、標的化タンパク質パネルは、ＨＬＡ－ＤＲ、ＣＤ１０、ＣＤ１１７、ＣＤ１１ｂ、ＣＤ１２３、ＣＤ１３、ＣＤ１３８、ＣＤ１４、ＣＤ１４１、ＣＤ１５、ＣＤ１６、ＣＤ１６３、ＣＤ１９、ＣＤ１９３（ＣＣＲ３）、ＣＤ１ｃ、ＣＤ２、ＣＤ２０３ｃ、ＣＤ２０９、ＣＤ２２、ＣＤ２５、ＣＤ３、ＣＤ３０、ＣＤ３０３、ＣＤ３０４、ＣＤ３３、ＣＤ３４、ＣＤ４、ＣＤ４２ｂ、ＣＤ４５ＲＡ、ＣＤ５、ＣＤ５６、ＣＤ６２Ｐ（Ｐ－セレクチン）、ＣＤ６４、ＣＤ６８、ＣＤ６９、ＣＤ３８、ＣＤ７、ＣＤ７１、ＣＤ８３、ＣＤ９０（Ｔｈｙ１）、ＦｃεＲＩα、Ｓｉｇｌｅｃ－８、ＣＤ２３５ａ、ＣＤ４９ｄ、ＣＤ４５、ＣＤ８、ＣＤ４５ＲＯ、マウスＩｇＧ１、κ、マウスＩｇＧ２ａ、κ、マウスＩｇＧ２ｂ、κ、ＣＤ１０３、ＣＤ６２Ｌ、ＣＤ１１ｃ、ＣＤ４４、ＣＤ２７、ＣＤ８１、ＣＤ３１９（ＳＬＡＭＦ７）、ＣＤ２６９（ＢＣＭＡ）、ＣＤ９９、ＣＤ１６４、ＫＣＮＪ３、ＣＸＣＲ４（ＣＤ１８４）、ＣＤ１０９、ＣＤ５３、ＣＤ７４、ＨＬＡ－ＤＲ、ＤＰ、ＤＱ、ＨＬＡ－Ａ、Ｂ、Ｃ、ＲＯＲ１、アネキシンＡ１、またはＣＤ２０のうちの１つ以上のタンパク質を含む。

バーコード及びバーコード化ビーズ
本発明の実施形態は、図１に示す工程１７０の間に、シングルセルの検体を標識するために、１つ以上のバーコード配列を提供すること伴う。１つ以上のバーコード配列は、エマルションに、シングルセルに由来する細胞溶解物と共に封入される。そのため、１つ以上のバーコードは細胞の検体を標識することにより、シーケンスリードが、同一のシングルセル起源の検体に由来することをその後判定することを可能にする。

様々な実施形態では、複数のバーコードをエマルションに、細胞溶解物と共に添加する。様々な実施形態では、エマルションに添加される複数のバーコードは、少なくとも１０^２、少なくとも１０^３、少なくとも１０^４、少なくとも１０^５、少なくとも１０^５、少なくとも１０^６、少なくとも１０^７、または少なくとも１０^８個のバーコードを含む。様々な実施形態では、エマルションに添加される複数のバーコードは、同一のバーコード配列を有する。例えば、同一のバーコードラベルの複数のコピーをエマルションに添加して、細胞溶解物に由来する複数の検体を標識し、これにより、検体が由来する細胞の同定を可能にする。様々な実施形態では、エマルションに添加される複数のバーコードは、「固有の識別配列」（ＵＭＩ）を含む。ＵＭＩは、そのＵＭＩがコンジュゲートされている１つ以上の第１の分子を、異なる配列を有する個別のＵＭＩがコンジュゲートされる、１つ以上の第２の分子から識別及び／または区別するのに利用できる配列を有する核酸である。ＵＭＩは典型的には、長さが短く、例えば、約５～２０塩基長であり、対象とする１つ以上の標的分子またはその増幅産物にコンジュゲートしてよい。ＵＭＩは、一本鎖であっても、二本鎖であってもよい。いくつかの実施形態では、バーコード配列及びＵＭＩの両方が、バーコードに組み込まれる。概して、ＵＭＩは、１つの集団または群における似た種類の分子を区別する目的で用いるのに対して、バーコード配列は、異なる細胞に由来する複数の分子集団または分子群を区別するのに用いる。いくつかの実施形態では、ＵＭＩ及びバーコード配列の両方を使用する場合、そのＵＭＩは、そのバーコード配列よりも配列の長さが短い。バーコードの使用は、米国特許出願第１５／９４０，８５０号にさらに記載されており、その全体が参照により本明細書に組み込まれている。

いくつかの実施形態では、バーコードは一本鎖バーコードである。一本鎖バーコードは、多数の技術を使用して生成することができる。例えば、一本鎖バーコードは、異なる分子の配列が少なくとも部分的に異なっている、複数のＤＮＡバーコードを入手することにより生成することができる。これらの分子を次に増幅し、例えば、非対称ＰＣＲを使用して、一本鎖のコピーを作製することができる。あるいは、バーコード分子を環状にした後で、ローリングサークル増幅に供することができる。これにより、バーコード化した元のＤＮＡが、単一の長い分子として何回も濃縮される、生成物である分子が得られる。

いくつかの実施形態では、任意数の定常配列が隣接するバーコード配列を含有する、環状バーコードＤＮＡは、線状ＤＮＡを環状にすることで入手することができる。任意の定常配列をアニールするプライマーは、鎖置換ポリメラーゼ（Ｐｈｉ２９ポリメラーゼなど）を使用することにより、ローリングサークル増幅を開始することができ、バーコードＤＮＡの長い直鎖コンカテマーを生成する。

様々な実施形態では、バーコードは、当該バーコードが標的核酸を標識可能にするプライマー配列に結合することができる。一実施形態では、バーコードはフォワードプライマー配列に結合する。様々な実施形態では、フォワードプライマー配列は、核酸のフォワード標的とハイブリダイズする遺伝子特異的プライマーである。様々な実施形態では、フォワードプライマー配列は、遺伝子特異的プライマーに付着した相補配列とハイブリダイズする、ＰＣＲハンドルなどの定常領域である。遺伝子特異的プライマーに付着した相補配列を、反応混合物（例えば、図１の反応混合物１４０）中に提供することができる。バーコードが同一のフォワードプライマーを有することができ、遺伝子特異的フォワードプライマーに結合するように個別に設計される必要がないため、定常フォワードプライマー配列をバーコードに含めることが、好ましい場合がある。

様々な実施形態では、バーコードは、ビーズなどの支持構造体に解放可能に付着することができる。したがって、バーコードの複数のコピーを含む単一のビーズを、細胞溶解物を含むエマルションに分画することができ、これにより、細胞溶解物の検体を、ビーズのバーコードで標識することが可能となる。例示的なビーズとしては、固体ビーズ（例えば、シリカビーズ）、高分子ビーズ、またはハイドロゲルビーズ（例えば、ポリアクリルアミド、アガロース、もしくはアルギン酸ビーズ）が挙げられる。ビーズは、様々な技術を用いて合成することができる。例えば、混合分離技術を使用すると、同一な無作為のバーコード配列の多くのコピーを伴うビーズを合成することができる。これは例えば、ＤＮＡを合成可能な部位を含む複数のビーズを作製することにより達成することができる。ビーズは４つの集まりに分けることができ、それぞれに、Ａ、Ｔ、Ｇ、またはＣなどの塩基をビーズに添加する、緩衝液と混合することができる。母集団を４つの亜集団に分けることで、各亜集団は、その表面に添加された塩基のうちの１つを有することができる。本反応は、単一の塩基のみが添加され、更なる塩基が添加されない方法で達成することができる。４つの亜集団全てに由来するビーズを合わせて互いに混合し、２回目の４つの集団への分割を行うことができる。この分割工程において、以前の４つの集団に由来するビーズを、無作為に一緒に混合することができる。これらを次に、４つの異なる溶液に添加し、各ビーズの表面上の、別の無作為な塩基を添加することができる。本プロセスを繰り返し、ビーズ表面に、母集団が分離及び混合される時間数におよそ等しい長さの配列を生成することができる。これを１０回行ったら、例えば、結果は、各ビーズが、その表面に同一の無作為の１０個の塩基配列が合成された多数のコピーを有する、ビーズの母集団となろう。各ビーズ上の配列は、各分離混合サイクルを通して終了した、反応器の特定の配列により測定される。例示的なビーズ及びその合成についてのさらなる詳細は、国際出願第ＰＣＴ／ＵＳ２０１６／０１６４４４号に記載されており、その全体が参照により本明細書に組み込まれている。

試薬
本明細書に記載する実施形態は、細胞を試薬と共に、エマルションに封入することを含む。一般に、試薬は、細胞が溶解する条件下で封入細胞と相互作用し、これにより、細胞の標的検体を放出する。試薬をさらに、標的検体と相互作用して、後続のバーコード化及び／または増幅のために調製することができる。

様々な実施形態では、試薬は、細胞を溶解させる１つ以上の溶解剤を含む。溶解剤の例としては、ＴｒｉｔｏｎＸ－１００、ＮｏｎｉｄｅｔＰ－４０（ＮＰ－４０）、加えて細胞毒素などの洗剤が挙げられる。いくつかの実施形態では、試薬としては、細胞膜を破壊し、細胞溶解を引き起こすのに十分ではあるが、クロマチンパッケージ化ＤＮＡを破壊しないＮＰ４０洗剤が挙げられる。様々な実施形態では、試薬は、０．０１％、０．０５％、０．１％、０．２％、０．３％、０．４％、０．５％、０．６％、０．７％、０．８％、０．９％、１．０％、１．１％、１．２％、１．３％、１．４％、１．５％、１．６％、１．７％、１．８％、１．９％、２．０％、３．０％、３．１％、３．２％、３．３％、３．４％、３．５％、３．６％、３．７％、３．８％、３．９％、４．０％、４．１％、４．２％、４．３％、４．４％、４．５％、４．６％、４．７％、４．８％、４．９％、または５．０％のＮＰ４０（ｖ／ｖ）を含む。様々な実施形態では、試薬は、少なくとも０．０１％、少なくとも０．０５％、少なくとも０．１％、少なくとも０．５％、少なくとも１％、少なくとも２％、少なくとも３％、少なくとも４％、または少なくとも５％のＮＰ４０（ｖ／ｖ）を含む。

様々な実施形態では、試薬は、細胞の溶解、及び／またはゲノムＤＮＡのアクセスを補助するプロテアーゼをさらに含む。プロテアーゼの例としては、プロテイナーゼＫ、ペプシン、プロテアーゼ－サブチリシンＣａｒｌｓｂｅｒｇ、プロテアーゼ型Ｘ－ｂａｃｉｌｌｕｓｔｈｅｒｍｏｐｒｏｔｅｏｌｙｔｉｃｕｓ、プロテアーゼ型ＸＩＩＩ－ａｓｐｅｒｇｉｌｌｕｓＳａｉｔｏｉが挙げられる。様々な実施形態では、試薬は、０．０１ｍｇ／ｍＬ、０．０５ｍｇ／ｍＬ、０．１ｍｇ／ｍＬ、０．２ｍｇ／ｍＬ、０．３ｍｇ／ｍＬ、０．４ｍｇ／ｍＬ、０．５ｍｇ／ｍＬ、０．６ｍｇ／ｍＬ、０．７ｍｇ／ｍＬ、０．８ｍｇ／ｍＬ、０．９ｍｇ／ｍＬ、１．０ｍｇ／ｍＬ、１．５ｍｇ／ｍＬ、２．０ｍｇ／ｍＬ、２．５ｍｇ／ｍＬ、３．０ｍｇ／ｍＬ、３．５ｍｇ／ｍＬ、４．０ｍｇ／ｍＬ、４．５ｍｇ／ｍＬ、５．０ｍｇ／ｍＬ、６．０ｍｇ／ｍＬ、７．０ｍｇ／ｍＬ、８．０ｍｇ／ｍＬ、９．０ｍｇ／ｍＬ、または１０．０ｍｇ／ｍＬのプロテアーゼを含む。様々な実施形態では、試薬は、０．１ｍｇ／ｍＬ～５ｍｇ／ｍＬのプロテアーゼを含む。様々な実施形態では、試薬は、０．５ｍｇ／ｍＬ～２．５ｍｇ／ｍＬのプロテアーゼを含む。様々な実施形態では、試薬は、０．７５ｍｇ／ｍＬ～１．５ｍｇ／ｍＬのプロテアーゼを含む。様々な実施形態では、試薬は、０．９ｍｇ／ｍＬ～１．１ｍｇ／ｍＬのプロテアーゼを含む。

様々な実施形態では、試薬は、ｄＮＴＰ、ジチオトレイトール（ＤＴＴ）などの安定化在、及び緩衝溶液をさらに含むことができる。様々な実施形態では、試薬は、標的検体（例えば、ゲノムＤＮＡまたは抗体オリゴヌクレオチド）とハイブリダイズするリバースプライマーなどの、プライマーを含むことができる。様々な実施形態では、このようなプライマーは、遺伝子特異的プライマーであることができる。例示的なプライマーを、以下にさらに詳述する。

反応混合物
本明細書に記載されるように、反応混合物を、細胞溶解物と共にエマルションに供給する（例えば、図１の細胞バーコード化工程１７０を参照されたい）。一般に、反応混合物は、細胞溶解物の検体にて、核酸増幅などの反応を行うのに十分な反応物質を含む。

様々な実施形態では、反応混合物は、核酸鎖に対して相補的なプライマー伸長生成物の合成が触媒される条件下に配置されるときに、相補鎖に沿って、合成の開始点として機能することができるプライマーを含む。様々な実施形態では、反応混合物は、４つの異なるデオキシリボヌクレオシド三リン酸（アデノシン、グアニン、シトシン、及びチミン）を含む。様々な実施形態では、反応混合物は、核酸増幅のための酵素を含む。核酸増幅のための酵素の例としては、ＤＮＡポリメラーゼ、熱サイクル増幅用の熱安定ポリメラーゼ、または、等温増幅のための複数置換増幅用ポリメラーゼが挙げられる。ＤＮＡ依存性ＲＮＡポリメラーゼを用いる増幅などの、さほど一般的でない他の増幅形態もまた適用し、それ自身がＤＮＡに逆転換し、本質的に、標的の増幅をもたらすことができる、元のＤＮＡ標的に由来するＲＮＡの複数のコピーを作製することができる。生体もまた使用して、例えば、標的を生体に変換することにより、標的を増幅することができ、これにより次いで、生体の複製を伴い、または伴わずに、標的をコピーすることが可能となるか、またはコピーを誘発することができる。

様々な実施形態では、反応混合物の内容物は、好適な緩衝液中に存在し（「緩衝液」は、補助因子であるか、または、ｐＨ、イオン強度などに影響を及ぼす置換基を含む）、好適な温度にある。

核増幅の程度を、反応混合物中で反応物質の濃度を制御することにより制御することができる。場合によっては、これは、増幅産物が用いられる反応の微細なチューニングに有用である。

プライマー
本明細書に記載する本発明の実施形態は、プライマーを使用して、シングルセル分析を実施する。例えば、プライマーは、図１に示すワークフロープロセスの間に用意される。プライマーを使用して、対象となる核酸がバーコード化、及び／または増幅可能となるように、対象となる核酸の特定の配列とプライミング（例えばハイブリダイズ）することができる。具体的には、プライマーは、標的配列にハイブリダイズし、プライマーがハイブリダイズした鋳型鎖の核酸合成を触媒する酵素（例えば、ポリメラーゼ）用の基質として作用する。後で説明するように、プライマーは、図１に示すワークフロープロセスにおいて、様々な工程で提供することができる。図１を再度参照すると、様々な実施形態では、プライマーを、細胞１０２と共に封入される試薬１２０に含めることができる。様々な実施形態では、プライマーを、細胞溶解物１３０と共に封入される反応混合物１４０に含めることができる。様々な実施形態では、プライマーを、細胞溶解物１３０と共に封入されるバーコード１４５に含めることができるか、または、これと結合させることができる。シングルセル分析ワークフロープロセスで使用されるプライマーのさらなる説明及び例は、米国出願第１６／７４９，７３１号に記載されており、その全体が参照により本明細書に組み込まれている。

様々な実施形態では、試薬、反応混合物、またはバーコードのいずれかの中での別個のプライマーの数は、約１～約５００個以上の範囲、例えば、約２～１００個のプライマー、約２～１０個のプライマー、約１０～２０個のプライマー、約２０～３０個のプライマー、約３０～４０個のプライマー、約４０～５０個のプライマー、約５０～６０個のプライマー、約６０～７０個のプライマー、約７０～８０個のプライマー、約８０～９０個のプライマー、約９０～１００個のプライマー、約１００～１５０個のプライマー、約１５０～２００個のプライマー、約２００～２５０個のプライマー、約２５０～３００個のプライマー、約３００～３５０個のプライマー、約３５０～４００個のプライマー、約４００～４５０個のプライマー、約４５０～５００個のプライマー、または約５００個以上のプライマーであってよい。

標的化ＤＮＡ配列決定に関して、試薬（例えば、図１における試薬１２０）中のプライマーとしては、対象となる核酸（例えば、ＤＮＡまたはＲＮＡ）において、逆標的配列に対して相補的なリバースプライマーを挙げることができる。様々な実施形態では、試薬中のプライマーは、対象となる遺伝子の逆標的配列を標的にする遺伝子特異的プライマーであってよい。様々な実施形態では、反応混合物（例えば、図１の反応混合物１４０）中のプライマーとしては、対象となる核酸（例えばＤＮＡ）のフォワード標的配列に対して相補的なフォワードプライマーであってよい。様々な実施形態では、反応混合物中のプライマーは、対象となる遺伝子のフォワード標的を標的にする遺伝子特異的プライマーであってよい。様々な実施形態では、試薬のプライマー、及び反応混合物のプライマーは、核酸上で、対象となる領域に対するプライマーセット（例えば、フォワードプライマー及びリバースプライマー）を形成する。例示的な遺伝子特異的プライマーは、上記「標的パネル」の章で同定した遺伝子のいずれかを標的にするプライマーであることができる。

対象となる遺伝子用の、別個のフォワードまたはリバースプライマーの添加数は、約１～５００個の範囲、例えば、約１～１０個のプライマー、約１０～２０個のプライマー、約２０～３０個のプライマー、約３０～４０個のプライマー、約４０～５０個のプライマー、約５０～６０個のプライマー、約６０～７０個のプライマー、約７０～８０個のプライマー、約８０～９０個のプライマー、約９０～１００個のプライマー、約１００～１５０個のプライマー、約１５０～２００個のプライマー、約２００～２５０個のプライマー、約２５０～３００個のプライマー、約３００～３５０個のプライマー、約３５０～４００個のプライマー、約４００～４５０個のプライマー、約４５０～５００個のプライマー、または約５００個以上のプライマーであってよい。

様々な実施形態では、反応混合物（例えば、図１の反応混合物１４０）に含まれるプライマーの代わりに、このようなプライマーは、バーコード（例えば、図１のバーコード１４５）の含まれることができるか、またはこれに結合することができる。特定の実施形態では、プライマーは、バーコードの末端に結合し、それ故、細胞溶解物中で、核酸の標的配列とハイブリダイズするのに利用可能である。

様々な実施形態では、反応混合物のプライマー、試薬のプライマー、またはバーコードのプライマーはエマルションに、１工程で、または２つ以上の工程で添加することができる。例えば、プライマーは、２工程以上、３工程以上、４工程以上または５工程以上で加えてよい。プライマーを１工程で加えるか、２工程以上で加えるかにかかわらず、プライマーは、溶解剤を加えた後、溶解剤を加える前、または溶解剤を加えるのと同時に加えてよい。溶解剤を加える前または加えた後にＰＣＲプライマーを加える場合、反応混合物のプライマーは、（例えば、図１に示す２段階ワークフロープロセスで例示されるように）溶解剤の添加とは別個の工程で添加することができる。

標的核酸を増幅するためのプライマーセットは典型的には、標的核酸またはその相補体と相補的であるフォワードプライマー及びリバースプライマーを含む。いくつかの実施形態では、増幅は、１回の増幅反応において、複数の標的特異的プライマー対を用いて行うことができ、この場合、各プライマー対は、標的特異的なフォワードプライマー及び標的特異的なリバースプライマーを含み、それぞれ、試料中の対応する標的配列と実質的に相補的であるかまたは実質的に同一である配列を少なくとも１つ含み、各プライマー対は、対応する標的配列が異なる。したがって、本発明におけるある特定の方法を用いて、シングルセルの試料に由来する複数の標的配列を検出または識別する。

例示的なシステム及び／またはコンピュータの実施形態
上述したシングルセル分析を行うための、システム及びコンピュータの実施形態をさらに、本明細書で記載する。例示的なシステムは、図１Ａに示すシングルセルワークフロー装置１０６及び演算装置１０８などの、シングルセルワークフロー装置及び演算装置を含むことができる。様々な実施形態では、シングルセルワークフロー装置１０６は、細胞封入１６０、検体放出１６５、細胞バーコード化１７０、標的増幅１７５、核酸プール２０５、及び配列決定２１０の工程を行うように構成される。様々な実施形態では、演算装置１０８は、コンピュータによる、リードアラインメント工程２１５、細胞遺伝子型及び表現型の測定工程２２０、ならびに、細胞遺伝子型及び表現型を用いる細胞分析工程を行うように構成される。

様々な実施形態では、シングルセルワークフロー装置１０６は、少なくとも、細胞を試薬と共に封入し、細胞溶解物を反応混合物と封入し、核酸増幅反応を行うように構成される、マイクロフルイディクスデバイスを含む。例えば、マイクロフルイディクスデバイスは、流体連通している１つ以上の流体チャネルを含むことができる。したがって、第１のチャネルを通る水性流体と、第２のチャネルを通るキャリア流体とを組み合わせることにより、エマルションドロップレットの生成がもたらされる。様々な実施形態では、マイクロフルイディクスデバイスの流体チャネルは、ミリメートル以下のオーダー（例えば、約１ミリメートル以下）の、少なくとも１つの断面寸法を有することができる。マイクロチャネルのデザイン及び寸法についてのさらなる詳細は、これらそれぞれの全体が参照により本明細書に組み込まれている、国際特許出願第ＰＣＴ／ＵＳ２０１６／０１６４４４号、及び、米国特許第１４／４２０，６４６号に記載されている。マイクロフルイディクスデバイスの一例は、Ｔａｐｅｓｔｒｉ（商標）Ｐｌａｔｆｏｒｍである。

様々な実施形態では、シングルセルワークフロー装置１０６はまた、（ａ）対象装置及び／またはその中のドロップレットの、１つ以上の部分の温度を制御し、マイクロフルイディクスデバイス（複数可）に動作可能に接続されている、温度調節モジュール、（ｂ）マイクロフルイディクスデバイス（複数可）に動作可能に接続されている、検出モジュール、即ち検出器、例えば光学撮像器、（ｃ）マイクロフルイディクスデバイス（複数可）に動作可能に接続されている、インキュベーター、例えば細胞インキュベーター、ならびに、（ｄ）マイクロフルイディクスデバイス（複数可）に動作可能に接続したシーケンサーのうちの１つ以上を含むことができる。１つ以上の温度及び／または圧力制御モジュールは、装置の１つ以上の流路内での、キャリア流体の温度及び／または圧力の制御をもたらす。一例として、温度調節モジュールは、核酸増幅を行うために温度を制御する、１つ以上の熱サイクラーであってよい。１つ以上の検出モジュール、即ち検出器、例えば光学撮像器は、１つ以上のドロップレットの存在、または、その特徴（その組成を含む）を検出するように構成される。いくつかの実施形態では、検出器モジュールは、１つ以上の流路内で、１つ以上のドロップレットの１つ以上の構成成分を認識するように構成される。シーケンサーは、次世代配列決定などの配列決定を行うように構成された、ハードウェア装置である。シーケンサーの例としては、Ｉｌｌｕｍｉｎａのシーケンサー（例えば、ＭｉｎｉＳｅｑ（商標）、ＭｉＳｅｑ（商標）、ＮｅｘｔＳｅｑ（商標）５５０Ｓｅｒｉｅｓ、またはＮｅｘｔＳｅｑ（商標）２０００）、Ｒｏｃｈｅの配列決定システム４５４、及び、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃのシーケンサー（例えば、ＩｏｎＧｅｎｅＳｔｕｄｉｏＳ５システム、ＩｏｎＴｏｒｒｅｎｔＧｅｎｅｘｕｓシステム）が挙げられる。

図７は、図１～６を参照して記載するシステム及び方法を実装するための、例示的な演算装置を示す。例えば、例示的な演算装置１０８は、リードアラインメント２１５及び細胞軌道測定２２０のコンピュータによる工程を行うように構成される。演算装置の例としては、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップ、サーバーコンピュータ、クラスター内の演算ノード、メッセージプロセッサ、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラミング可能な消費者エレクトロニクス、ネットワークＰＣ、ミニコンピュータ、メインフレームコンピュータ、携帯電話、ＰＤＡ、タブレット、ポケベル、ルーター、スイッチなどを挙げることができる。

図７は、図１～５に示すシステム及び方法を実装するための、例示的な演算装置１０８を示す。いくつかの実施形態では、演算装置１０８は、チップセット７０４に結合した少なくとも１つのプロセッサ７０２を含む。チップセット７０４は、メモリコントローラハブ７２０、及び入力／出力（Ｉ／Ｏ）コントローラハブ７２２を含む。メモリ７０６およびグラフィックスアダプター７１２は、メモリコントローラハブ７２０に連結され、ディスプレイ７１８は、グラフィックスアダプター７１２に連結される。記憶装置７０８、入力インタフェース７１４、及びネットワークアダプター７１６が、Ｉ／Ｏコントローラハブ７２２に連結される。演算装置１０８の他の実施形態は、異なる構造を有する。

記憶装置７０８は、ハードドライブ、コンパクトディスクリードオンリーメモリ（ＣＤ－ＲＯＭ）、ＤＶＤ、またはソリッドステートメモリデバイス等の、非一時的コンピュータ可読記憶媒体である。メモリ７０６は、プロセッサ７０２によって使用される命令及びデータを保持する。入力インタフェース７１４は、タッチスクリーンインタフェース、マウス、トラックボール、または他の種類の入力インタフェース、キーボード、またはいくつかのこれらの組み合わせであり、データを演算装置１０８に入力するために使用する。いくつかの実施形態では、演算装置１０８は、入力インタフェース７１４から、ユーザのジェスチャを介して、入力（例えばコマンド）を受けるように構成されることができる。グラフィックスアダプター７１２は、ディスプレイ７１８に、イメージ及び他の情報を表示する。例えば、ディスプレイ７１８は、予測した細胞軌道の指標を示すことができる。ネットワークアダプター７１６は、演算装置１０８を１つ以上のコンピュータネットワークに結合する。

演算装置は、本明細書に記載される機能性を提供するためのコンピュータプログラムモジュールを実行するように適合される。本明細書で使用される「モジュール」という用語は、指定された機能性を提供するために使用されるコンピュータプログラム論理を指す。したがって、モジュールは、ハードウェア、ファームウェア、および／またはソフトウェアに実装することができる。一実施形態では、プログラムモジュールは、記憶デバイス７０８に記憶され、メモリ７０６にロードされ、プロセッサ７０２によって実行される。

演算装置１０８の種類は、本明細書に記載する実施形態毎で変化し得る。例えば、演算装置１０８は、グラフィックスアダプター７１２、入力インタフェース７１４、及びディスプレイ７１８などの、上述した構成要素のいくつかを欠く場合がある。いくつかの実施形態では、演算装置１０８は、メモリ７０６に格納された命令を実行するためのプロセッサ７０２を含むことができる。

様々な実施形態では、シーケンスリードをアラインする方法、細胞遺伝子型及び表現型を測定する方法、ならびに／または、細胞遺伝子型及び表現型を用いて細胞を分析する方法などの、本明細書に記載する方法は、ハードウェアもしくはソフトウェア、またはこれらの組み合わせの中で実装することができる。一実施形態では、上述したものなどの、非一時的コンピュータ可読記憶媒体が提供され、当該媒体は、上記データを用いるための指示でプログラミングされた機械を用いる際に、本発明の細胞軌道のデータセット及び実行及び結果のいずれかを表示可能な、機械で読取り可能なデータでコードされた、データ格納マテリアルを含む。このようなデータは、患者の監視、処置の考慮などの、様々な目的のために使用することができる。上述した方法の実施形態を、プロセッサ、データ格納システム（揮発性及び不揮発性メモリ、ならびに／または格納要素を含む）、グラフィックスアダプター、入力インタフェース、ネットワークアダプター、少なくとも１つの入力装置、ならびに少なくとも１つの出力装置を含む、プログラミング可能なコンピュータ上で実行するコンピュータプログラムに実装することができる。ディスプレイを、グラフィックスアダプターに結合する。プログラムコードを入力データに適用し、上述した機能を実施し、出力情報を生成する。出力情報を、既知の様式で１つ以上の出力装置に適用する。コンピュータは例えば、従来のデザインのパーソナルコンピュータ、マイクロコンピュータ、または、ワークステーションであることができる。

各プログラムは、ハイレベルの手順またはオブジェクト指向プログラミング言語で実装して、コンピュータシステムと通信することができる。しかし、プログラムは、所望する場合、アセンブリまたは機械言語で実装することができる。いずれの場合も、言語はコンパイラ言語またはインタプリタ言語であることができる。このような各コンピュータプログラムは、ストレージ媒体または装置がコンピュータにより読み取られ、本明細書に記載する手順を実行するときに、コンピュータを構成して操作するために、汎用または特殊目的のプログラミング可能なコンピュータにより読み取り可能な、ストレージ媒体または装置（例えば、ＲＯＭまたは磁気ディスク）に格納されるのが好ましい。システムは、構成されたストレージ媒体が、コンピュータを特定かつ所定の様式で操作させ、本明細書に記載する機能を実施する場合に、コンピュータプログラムと共に構成される、コンピュータ読み取り可能なストレージ媒体として実装されるとみなされることもまた、可能である。

署名パターン及びそのデータベースを、様々な媒体で提供して、その使用を容易にすることができる。「媒体」とは、本発明の署名パターン情報を含有するマニュファクチャを意味する。本発明のデータベースは、コンピュータが読み取り可能な媒体、例えば、コンピュータにより読み取られ、直接アクセス可能な任意の媒体に記録することができる。このような媒体としては、フロッピーディスク、ハードディスクストレージ媒体、及び磁気テープなどの磁気記憶媒体；ＣＤ－ＲＯＭなどの光学記憶媒体；ＲＡＭ及びＲＯＭなどの電気記憶媒体；ならびに、磁気／光学記憶媒体などの、これらのカテゴリーのハイブリッドが挙げられるが、これらに限定されない。当業者は、現在知られているコンピュータで読み取り可能な媒体のいずれかを使用して、本データベース情報を記録することを含むマニュファクチャを作製する方法を速やかに理解することができる。「記録された」とは、当技術分野において既知の任意のこのような方法を使用して、コンピュータで読み取り可能な媒体に情報を格納するプロセスを意味する。格納した情報にアクセスするために使用する手段に基づき、任意の従来のデータ格納構造体を選択することができる。様々なデータプロセッサプログラム及びフォーマット、例えば、ワープロテキストファイル、データベースフォーマットなどを、格納のために使用することができる。

例示的なキットの実施形態
細胞集団の細胞遺伝子型及び表現型を測定するための、シングルセルワークフローを行うためのキットもまた、本明細書で提供する。キットは、以下のうちの１つ以上を含むことができる：エマルションを形成するための流体（例えば、キャリア相、水相）、バーコード化ビーズ、シングルセルを処理するためのマイクロフルイディクスデバイス、細胞を溶解し、細胞検体を放出するための試薬、細胞を抗体と共に標識するための試薬及び緩衝液、核酸増幅反応を行うための反応混合物、及び、本明細書に記載の方法に対応するキット成分のうちのいずれかを使用するための取扱説明書。

実施例１：シングルセルにおける、細胞表面タンパク質及び変異の同時検出
Ｊｕｒｋａｔ、Ｋ５６２、Ｍｕｔｚ－８、及びＲａｊｉ細胞の混合集団を、９個の、対象となるモノクローナル抗体、加えて、陰性対照として機能するマウスＩｇＧ１ｋ抗体を含有する、オリゴヌクレオチドコンジュゲート抗体のプールで処理した。次に、細胞を洗浄し、Ｓｉｎｇｌｅ－ＣｅｌｌＤＮＡＡＭＬＶ２Ｐａｎｅｌ（２０個の遺伝子をカバーする１２８個のアンプリコン）で分析されるＴａｐｅｓｔｒｉＰｌａｔｆｏｒｍにロードした。ＤＮＡ遺伝子型用の配列決定データを、ＴａｐｅｓｔｒｉＰｉｐｅｌｉｎｅソフトウェアで処理し、ＴａｐｅｓｔｒｉＩｎｓｉｇｈｔｓソフトウェアによりさらに分析し、ＳＮＶを測定した。

抗体タグ計数を、有心対数比（ＣＬＲ）変換を用いて正規化した。ｔ－ＳＮＥプロットを、全タンパク質標的からのＣＬＲ値を用いて生成した。具体的には、図８は、異なるタンパク質の発現に従った、ｔ－ＳＮＥプロットの細胞のクラスター化を示す。図８から確認できるように、タンパク質発現が異なる細胞の異なるクラスターを同定した。パネルのそれぞれは、対応する各タンパク質に対するＣＬＲ値を反映する。

細胞に由来するＳＮＶデータを分析して、４つのクラスターが、４つの異なる細胞株であることを確認した。図９Ａは、細胞株を互いに区別する、４つの異なる細胞株及び既知のＳＮＶを示す。そのため、シングルセルから捕捉したＳＮＶデータは、シングルセルがＫ５６２細胞、ＲＡＪＩ細胞、ＭＵＴＺ８細胞、またはＪＵＲＫＡＴ細胞であるか否かを明らかにする。

各細胞からのＳＮＶデータを次に、図８に示す、クラスター化したタンパク質発現データと組み合わせた。具体的には、図９Ｂ細胞遺伝子型がさらに重なった、タンパク質発現に従った細胞のクラスター化を示す。具体的には、ＳＮＶデータは、クラスター９１０がＲＡＪＩ細胞に対応し、クラスター９２０がＪＵＲＫＡＴ細胞に対応し、クラスター９３０がＫ５６２細胞に対応し、クラスター９４０がＭＵＴＺ８細胞に対応することを明らかにする。

全てを合わせると、シングルセルタンパク質マーカー発現データは、細胞を、細胞遺伝子型データと一致するグループに独立してクラスター化した。このことは、シングルセルワークフロープロセスは、その表現型（例えば、タンパク質マーカー発現）、及び遺伝子型（例えば、ＳＮＶ）に従い、個別の細胞を細胞集団に分類することに成功することが可能であることを明らかにする。

実施例２：標的化ＤＮＡ配列決定からのＣＮＶ分析
細胞から入手したＣＮＶデータを分析すると、ＣＮＶデータを上手く使用することで、４つの異なる集団の細胞を区別することができることが示された。標的化ＤＮＡ配列決定データから、各細胞のリードをまず、細胞の全リード計数により正規化し、アンプリコンリード分布に基づく階層クラスター化によりグルーピングした。次に、既知のＣＮＶを含む対照細胞クラスターを同定し、全細胞からのアンプリコン計数を、対照群由来の対応するアンプリコンのメジアンにより除した。本実験において、ＡＭＬパネルにおけるアンプリコンからの、配列決定リードの正規化割合を使用して、試験した各遺伝子に対するＣＮＶを計算した。Ｊｕｒｋａｔ細胞を、試験した全遺伝子に対する既知の二倍体状態を有する対照細胞株として使用した。

図１０は、４つの細胞株にまたがる１３個の遺伝子に対する、観察された遺伝子レベルコピー数、及び、ＣＯＳＭＩＣデータベースでの既知のレベルに対する、観察された遺伝子レベルコピー数の相関を示す。一般に、図１０は、シングルセルワークフロープロセスは、（例えば、ＣＯＳＭＩＣデータベースからの）一般に入手可能な既知のＣＮＶと相関する、４つの異なる細胞株にまたがる１３個の遺伝子に対する、ＣＮＶの量を同定することが可能であることを示す。

具体的には、図１０は、観察されたコピー数、及び、ＣＯＳＭＩＣデータベースにおけるコピー数とのその比較を示す。パネルの上列に示すように、ＪＵＲＫＡＴ、Ｋ５６２、ＭＵＴＺ８、及びＲＡＪＩ細胞にまたがる遺伝子のそれぞれに対する、観察されたコピー数は、ＣＯＳＭＩＣデータベースにおけるコピー数と一致した。上述のとおり、ＥＺＨ２遺伝子のコピー数の増加がＫ５６２細胞で観察され、これは、ＣＯＳＭＩＣデータベースにおけるＥＺＨ２遺伝子のコピー数の増加と一致する。ＭＵＴＺ８細胞のＦＬＴ３、キット、及びＴＥＴ２遺伝子、ならびに、ＲＡＪＩ細胞のＫＲＡＳ遺伝子に関して、ＣＯＳＭＩＣデータベースと同一の増加が観察された。

パネルの下列は、観察されたコピー数（ｙ軸）とＣＯＳＭＩＣコピー数（ｘ軸）に対する、線形曲線を示す。単一線形適合（勾配＝１）を、比較目的のためにパネルのそれぞれで示す。

全て合わせると、このことは、シングルセルワークフロープロセスが、個別細胞に対する遺伝子のコピー数を同定することに成功したことを示す。

実施例３：ＣＮＶ結果による細胞型のクラスター化
遺伝子ＣＮＶに従いｔ－ＳＮＥクラスター化を用いて、細胞をクラスター化した。図１１は、ＳＮＶにより細胞型がさらに重なった、ＣＮＶに従った細胞のクラスター化を示す。図９Ａに関連して上述した既知のＳＮＶに従い、ＳＮＶによる細胞検出を行った。ＣＮＶデータをｔ－ＳＮＥプロット、及び、各細胞株に対して以前に確立したＳＮＶ遺伝子型に基づき示したものとは異なる細胞にてグルーピングした。

遺伝子コピー数に従ったｔ－ＳＮＥクラスター化により、３つの個別のクラスター１１１０、１１２０、及び１１３０が解明されたことを、図１１は示す。ＳＮＶジェノタイピングと重ね合わせたときに、クラスター１１１０はＫ５６２細胞に対応し、クラスター１１３０はＭＵＴＺ８細胞に対応し、クラスター１１２０はＪＵＲＫＡＴ及びＲＡＪＩ細胞の両方に対応する。したがって、このことは、ＳＮＶとＣＮＶデータの組み合わせにより、異なる細胞型に属する細胞の分類が可能となることを示す。

実施例４：表現型及び遺伝子型分析による細胞亜集団の解明
ＳＮＶ／インデル及びＣＮＶの両方のための、ＴａｐｅｓｔｒｉＳｉｎｇｌｅ－ＣｅｌｌＤＮＡＡＭＬＰａｎｅｌを用いて、Ｒａｊｉ、Ｋ５６２、ＴＯＭ１、及びＫＧ１細胞株を分析した。検体バーコード化オリゴタグにコンジュゲートした６個の抗体のパネルを用いて、細胞をＴａｐｅｓｔｒｉＰｌａｔｆｏｒｍで処理し、タンパク質発現に同時にアクセスした。標的は、ＣＤ１９、ＣＤ３３、ＣＤ４５、ＣＤ９０、ＨＬＡ－ＤＲ、及びマウスＩｇＧ１κからなった。下流分析のために、選択した数少ないＳＮＶ／インデル、ＣＮＶ、及びタンパク質のみを含めた。

次に、１０９個のアンプリコンにまたがるＡＭＬ、ＭＰＮ、及びＭＤＳに関連する３１個の遺伝子のカスタムＤＮＡパネルにより、６個のＡＭＬ患者試料を分析した。加えて、以下の６つのタンパク質：ＣＤ３、ＣＤ１１ｂ、ＣＤ３４、ＣＤ３８、ＣＤ４５ＲＡ、及びＣＤ９０を標的にするカスタムタンパク質抗体パネルを用いた。カスタムのＴａｐｅｓｔｒｉＰｉｐｅｌｉｎｅソフトウェアを用いてデータを分析した。ＳＮＶ及びインデルは、ＴａｐｅｓｔｒｉＩｎｓｉｇｈｔｓソフトウェアを用いて同定し、ＣＮＶは、Ｒ用ＭｉｓｉｏｎＢｉｏ “ｔａｐｅｓｔｒｉ－ｃｎｖ”パッケージを用いて分析し、ＤＮＡ＋タンパク質データは、Ｒ用ＭｉｓｉｏｎＢｉｏ “ｔａｐｅｓｔｒｉ－ｐｒｏｔｅｉｎ”パッケージを用いて一体化して分析した。

Ｒａｊｉ、Ｋ５６２、ＴＯＭ１、ＫＧ１細胞を等しい比率で共に混合し、ＴａｐｅｓｔｒｉＰｌａｔｆｏｒｍを用いて、ＳＮＶ、インデル、ＣＮＶ、及びタンパク質に関して分析した。

図１２Ａは、ＳＮＶ、ＣＮＶ、及びタンパク質発現のうちの１つを用いる、４つの細胞株の監督されていないクラスター化を示す。ＳＮＶデータ（４つのバリアントに基づく）を用いる、個別の各検体の、監督されていないクラスター化（例えばＵＭＡＰ）及び可視化により、３つの細胞株が解明した。ここで、Ｋ５６２及びＴＯＭ１細胞は区別することができない一方で、ＲＡＪＩ及びＫＧ１は個別にクラスター化した。ＣＮＶの監督されていないクラスター化でも同様に、３つのクラスターが生成し、Ｋ５６２及びＫＧ１細胞は個別にクラスター化したものの、ＲＡＪＩ及びＴＯＭ１細胞は共にクラスター化した。タンパク質発現の監督されていないクラスター化により、ＴＯＭ１細胞集団が区別されたが、Ｋ５６２、ＫＧ１、及びＲＡＪＩ細胞集団の重なり合ったクラスターを有した。

図１２Ｂは、ＳＮＶ、ＣＮＶ、及びタンパク質発現のうちの少なくとも２つを用いる、４つの細胞株の監督されていないクラスター化を示す。一般に、ＳＮＶまたはＣＮＶをタンパク質データとそれぞれ組み合わせたときに、細胞株の解明は増加した一方で、組み合わせたＳＮＶ、ＣＮＶ、及びタンパク質データは共に、４つの細胞株集団の最も異なる解明をもたらした。ここで、ＳＮＶ、ＣＮＶ、及びタンパク質のうちの少なくとも２つを用いる、監督されていないクラスター化は、個別の細胞集団をさらに解明することが可能であった。具体的には、ＳＮＶ及びタンパク質における監督されていないクラスター化は、ＲＡＪＩ細胞及びＫＧ１細胞の個別の集団を解明することが可能であり、Ｋ５６２及びＴＯＭ１細胞集団との重なり合いは最小限であった。同様に、ＣＮＶ及びタンパク質の監督されていないクラスター化は、ＫＧ１細胞をはっきりと解明することが可能であり、ＲＡＪＩ、ＴＯＭ１、及びＫ５６２細胞間の重なり合いは最小限であった。最終的に、ＣＮＶ、ＳＮＶ、及びタンパク質の監督されていないクラスター化により、４つの異なる細胞株が完全に解明された。この結果は、細胞型間で最大の解明を得るためのマルチオミクスアプローチによる、同一細胞からのより多くのデータを用いる力を示す。このことは、異種集団で混合される細胞の亜集団を、本明細書で記載するシングルセルワークフローを用いて区別または同定することができることをさらに示す。

Claims

複数の細胞の分析方法であって、
前記複数の細胞の１つ以上の細胞に対して、
前記細胞を、試薬を含むエマルションに封入することであって、前記細胞が、少なくとも１つのＤＮＡ分子と、少なくとも１つの検体結合抗体がコンジュゲートしたオリゴヌクレオチドとを含む、前記封入することと、
前記細胞を前記エマルション中で溶解し、前記少なくとも１つのＤＮＡ分子と前記オリゴヌクレオチドとを含む細胞溶解物を生成することと、
前記少なくとも１つのＤＮＡ分子と前記オリゴヌクレオチドとを含む前記細胞溶解物を、反応混合物と共に、第２のエマルション中で封入することと、
核酸増幅反応を、前記反応混合物を使用して前記第２のエマルション内で行い、アンプリコンを生成することであって、前記アンプリコンが、
前記少なくとも１つのＤＮＡ分子のうちの１つに由来する第１のアンプリコン、及び
前記オリゴヌクレオチドに由来する第２のアンプリコン
を含む、前記生成することと、
前記第１のアンプリコン及び前記第２のアンプリコンを配列決定することと、
前記細胞の１つ以上の変異を、少なくとも前記配列決定した第１のアンプリコンを用いて測定することと、
少なくとも前記第２のアンプリコンを用いて検体の有無を測定することと、
細胞の亜集団を、前記複数の細胞内で発見することであって、前記細胞の亜集団が、前記１つ以上の変異及び前記検体の有無により特徴付けられる、前記発見することと
を含む、前記方法。
前記１つ以上の変異が、一塩基バリアント（ＳＮＶ）またはコピー数多型（ＣＮＶ）を含む、請求項１に記載の方法。
前記１つ以上の変異が、一塩基バリアント（ＳＮＶ）及びコピー数多型（ＣＮＶ）を含む、請求項１に記載の方法。
前記複数の細胞内で前記細胞の亜集団を発見することが、前記同定したＳＮＶまたは前記同定したＣＮＶに従い、前記１つ以上の細胞をクラスター化することを含む、請求項２または３に記載の方法。
前記ＳＮＶまたは前記ＣＮＶが、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、Ｔ細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫に関連する遺伝子において同定される、請求項２～４のいずれか１項に記載の方法。
前記ＳＮＶまたは前記ＣＮＶが、ＡＢＬ１、ＧＮＢ１、ＫＭＴ２Ｄ、ＰＬＣＧ２、ＧＮＡ１３、ＡＴＭ、ＢＲＡＦ、ＪＡＫ３、ＡＤＯ、ＤＮＭＴ３Ａ、ＳＥＲＰＩＮＡ１、ＸＰＯ１、ＰＩＭ１、ＣＣＮＤ１、ＦＬＴ３、ＳＴＡＴ３、ＡＫＴ１、ＦＡＴ１、ＣＴＣＦ、ＴＰ５３、ＮＯＴＣＨ１、ＫＲＡＳ、ＡＬＫ、ＭＹＢ、ＤＮＭ２、ＤＤＸ３Ｘ、ＣＤ７９Ａ、ＵＢＲ５、ＰＴＥＮ、ＡＰＣ、ＰＡＸ５、ＲＵＮＸ１、ＭＡＰ２Ｋ１、ＣＤ７９Ｂ、ＢＩＲＣ３、ＫＭＴ２Ｃ、ＡＲ、ＣＨＤ４、ＰＨＦ６、ＰＯＴ１、ＣＡＬＲ、ＴＥＴ２、ＯＲＡＩ１、ＯＶＧＰ１、ＺＭＹＭ３、ＭＹＣ、ＧＡＴＡ２、ＣＡＲＤ１１、ＴＰ５３ＢＰ１、ＴＢＬ１ＸＲ１、ＢＴＫ、ＷＨＳＣ１、ＭＰＬ、ＦＡＳ、ＣＤＨ１、ＩＫＺＦ３、ＬＲＦＮ２、ＥＧＲ２、ＳＯＣＳ１、ＰＴＰＮ１１、ＰＬＣＧ１、ＣＤＫ４、ＷＴＩＰ、ＺＦＨＸ４、ＭＥＤ１２、ＴＮＦＲＳＦ１４、ＦＡＭ４６Ｃ、ＣＤＫＮ２Ａ、ＢＣＯＲ、ＳＯＲＣＳ１、ＲＰＳ１５、ＴＮＦＡＩＰ３、ＩＲＦ４、ＣＢＬ、ＣＳＦ１Ｒ、ＲＰＬ２２、ＢＴＧ１、ＳＴＡＴ６、ＰＩＫ３ＣＡ、ＧＮＡＳ、ＣＴＮＮＢ１、ＡＳＸＬ２、ＢＣＬ１１Ｂ、ＥＺＨ２、ＤＤＲ２、ＡＴＲＸ、ＭＹＤ８８、ＡＲＩＤ１Ａ、ＦＧＦＲ３、ＲＡＤ２１、ＥＧＦＲ、ＩＫＺＦ１、ＳＭＡＲＣＡ４、ＳＥＴＤ２、ＪＡＫ２、ＥＲＢＢ２、ＫＬＦ９、ＥＲＧ、ＣＲＥＢＢＰ、ＲＢ１、ＣＨＥＫ２、ＥＲＢＢ３、ＥＴＶ６、ＲＰＬ１０、ＢＣＬ２、ＤＩＳ３、ＩＤＨ１、ＥＲＢＢ４、ＮＲＡＳ、ＮＦＫＢＩＥ、ＮＯＴＣＨ２、ＥＳＲ１、ＨＣＮ４、ＳＦ３Ｂ１、ＳＴＡＴ５Ｂ、ＣＣＮＤ３、Ｕ２ＡＦ１、ＦＢＸＷ７、ＣＮＯＴ３、ＥＰ３００、ＣＳＦ３Ｒ、ＦＧＦＲ１、ＵＳＰ９Ｘ、ＷＴ１、ＩＤＨ２、ＦＧＦＲ２、ＳＬＣ２５Ａ３３、ＳＨ２Ｂ３、ＮＦ１、ＺＦＰ３６Ｌ２、ＫＩＴ、ＴＲＡＦ３、ＳＥＴＢＰ１、ＤＮＡＨ５、ＮＣＯＲ１、ＡＢＬ１、ＡＳＸＬ１、ＧＮＡ１１、ＥＰＯＲ、ＧＮＡＱ、ＸＢＰ１、ＣＤＫＮ１Ｂ、ＵＳＨ２Ａ、ＮＰＭ１、ＨＮＦ１Ａ、ＦＲＥＭ２、ＬＥＦ１、ＨＲＡＳ、ＯＰＮ５、ＺＲＳＲ２、ＴＳＰＹＬ２、ＬＭＯ２、ＪＡＫ１、Ｂ２Ｍ、ＴＡＬ１、ＭＧＡ、ＮＦＫＢＩＡ、ＡＲＡＦ、ＺＥＢ２、ＫＤＲ、ＩＬ７Ｒ、ＳＬＣ５Ａ１、ＭＹＣＮ、ＰＲＤＭ１、ＭＡＰ２Ｋ２、ＰＨＩＰ、ＭＥＴ、ＭＬＨ１、ＲＥＬ、ＺＮＦ２１７、ＮＯＳ１、ＭＴＯＲ、ＫＤＭ６Ａ、ＳＰＴＢＮ５、ＳＵＺ１２、ＵＢＡ２、ＰＤＧＦＲＡ、ＰＩＫ３Ｒ１、ＧＡＴＡ３、ＣＨＤ２、ＨＤＡＣ７、ＳＭＣ１Ａ、ＲＡＦ１、ＭＤＧＡ２、ＵＳＰ７、ＳＰＥＮ、ＲＥＴ、ＺＦＲ２、ＳＭＡＤ４、ＩＴＳＮ１、ＳＭＡＲＣＢ１、ＢＣＯＲＬ１、ＳＭＣ３、ＳＭＯ、ＲＰＬ５、ＳＲＣ、ＦＯＸＯ１、ＳＴＫ１１、ＥＢＦ１、ＰＩＫ３ＣＤ、ＫＭＴ２Ａ、ＲＨＯＡ、ＣＸＣＲ４、ＰＰＭ１Ｄ、ＶＨＬ、ＬＲＰ１Ｂ、及びＳＴＡＧ２のいずれかにおいて同定される、請求項５に記載の方法。
前記検体の有無を測定することが、前記検体の発現レベルを測定することを含み、前記検体が、前記オリゴヌクレオチドにコンジュゲートした前記抗体により結合されている、請求項１～６のいずれか１項に記載の方法。
前記検体が、ＨＬＡ－ＤＲ、ＣＤ１０、ＣＤ１１７、ＣＤ１１ｂ、ＣＤ１２３、ＣＤ１３、ＣＤ１３８、ＣＤ１４、ＣＤ１４１、ＣＤ１５、ＣＤ１６、ＣＤ１６３、ＣＤ１９、ＣＤ１９３（ＣＣＲ３）、ＣＤ１ｃ、ＣＤ２、ＣＤ２０３ｃ、ＣＤ２０９、ＣＤ２２、ＣＤ２５、ＣＤ３、ＣＤ３０、ＣＤ３０３、ＣＤ３０４、ＣＤ３３、ＣＤ３４、ＣＤ４、ＣＤ４２ｂ、ＣＤ４５ＲＡ、ＣＤ５、ＣＤ５６、ＣＤ６２Ｐ（Ｐ－セレクチン）、ＣＤ６４、ＣＤ６８、ＣＤ６９、ＣＤ３８、ＣＤ７、ＣＤ７１、ＣＤ８３、ＣＤ９０（Ｔｈｙ１）、ＦｃεＲＩα、Ｓｉｇｌｅｃ－８、ＣＤ２３５ａ、ＣＤ４９ｄ、ＣＤ４５、ＣＤ８、ＣＤ４５ＲＯ、マウスＩｇＧ１、κ、マウスＩｇＧ２ａ、κ、マウスＩｇＧ２ｂ、κ、ＣＤ１０３、ＣＤ６２Ｌ、ＣＤ１１ｃ、ＣＤ４４、ＣＤ２７、ＣＤ８１、ＣＤ３１９（ＳＬＡＭＦ７）、ＣＤ２６９（ＢＣＭＡ）、ＣＤ９９、ＣＤ１６４、ＫＣＮＪ３、ＣＸＣＲ４（ＣＤ１８４）、ＣＤ１０９、ＣＤ５３、ＣＤ７４、ＨＬＡ－ＤＲ、ＤＰ、ＤＱ、ＨＬＡ－Ａ、Ｂ、Ｃ、ＲＯＲ１、アネキシンＡ１、またはＣＤ２０のうちのいずれかである、請求項７に記載の方法。
前記複数の細胞内で前記細胞の亜集団を発見することが、前記検体の前記測定した有無に従い、前記１つ以上の細胞をクラスター化することを含む、請求項１～８のいずれか１項に記載の方法。
前記同定したＳＮＶもしくは前記同定したＣＮＶに従い、前記１つ以上の細胞をクラスター化すること、または、前記検体の前記測定した存在に従い前記１つ以上の細胞をクラスター化することが、主成分分析（ＰＣＡ）、線形判別分析（ＬＤＡ）、Ｔ分布型確率的近傍埋め込み法（ｔ－ＳＮＥ）、または均一マニホールド近似及び投影（ＵＭＡＰ）のうちのいずれかから選択される次元削減分析を実施することを含む、請求項４または９に記載の方法。
前記エマルションに前記細胞を封入する前に、前記細胞を、複数の抗体コンジュゲートオリゴヌクレオチドに曝露することと、
前記細胞を洗浄し、過剰の抗体コンジュゲートオリゴヌクレオチドを除去することと
をさらに含む、請求項１～１０のいずれか１項に記載の方法。
前記複数の抗体にコンジュゲートした前記オリゴヌクレオチドが、ＰＣＲハンドル、タグ配列、及び捕捉配列を含む、請求項１１に記載の方法。
前記複数の細胞ががん細胞を含む、請求項１～１２のいずれか１項に記載の方法。
前記がん細胞が、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、古典的ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、多発性骨髄腫、骨髄異形成症候群、骨髄、骨髄増殖性腫瘍、Ｔ細胞リンパ腫、侵襲性乳癌、結腸腺癌、多形性膠芽腫、腎臓明細胞癌、肝細胞癌、肺腺癌、肺扁平上皮細胞癌、卵巣癌、膵臓腺癌、前立腺癌、または皮膚黒色腫のうちのいずれかである、請求項１３に記載の方法。
前記第２のエマルションに、第１のバーコード及び第２のバーコードを、前記少なくとも１つのＤＮＡ分子、前記オリゴヌクレオチド、及び前記反応混合物と共に封入すること
をさらに含む、請求項１～１４のいずれか１項に記載の方法。
第１の核酸が前記第１のバーコードを含む、請求項１５に記載の方法。
第２の核酸が前記第２のバーコードを含む、請求項１５または１６に記載の方法。
前記第１のバーコード及び前記第２のバーコードが、同じバーコード配列を共有する、請求項１５～１７のいずれか１項に記載の方法。
前記第１のバーコード及び前記第２のバーコードが、異なるバーコード配列を共有する、請求項１５～１７のいずれか１項に記載の方法。
前記第１のバーコード及び前記第２のバーコードが、前記第２のエマルション内でビーズに解放可能に付着している、請求項１５～１９のいずれか１項に記載の方法。