JP7046007B2 - 分子標識カウントの調節方法 - Google Patents
分子標識カウントの調節方法 Download PDFInfo
- Publication number
- JP7046007B2 JP7046007B2 JP2018561218A JP2018561218A JP7046007B2 JP 7046007 B2 JP7046007 B2 JP 7046007B2 JP 2018561218 A JP2018561218 A JP 2018561218A JP 2018561218 A JP2018561218 A JP 2018561218A JP 7046007 B2 JP7046007 B2 JP 7046007B2
- Authority
- JP
- Japan
- Prior art keywords
- sequencing
- molecular
- nucleic acid
- target
- labels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K19/00—Record carriers for use with machines and with at least a part designed to carry digital markings
- G06K19/06—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
- G06K19/06009—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking
- G06K19/06018—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking one-dimensional coding
- G06K19/06028—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking one-dimensional coding using bar codes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Bioethics (AREA)
- Signal Processing (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
本出願は、35U.S.C.§119(e)に従い、2016年5月26日出願の米国仮特許出願第62/342137号明細書;2016年8月31日出願の米国仮特許出願第62/381945号明細書;および2016年9月29日出願の米国仮特許出願第62/401720号明細書に基づく優先権を主張する。これらの出願各々の内容は、本出願をもってその全体が参照により明示的に組み込まれる。
確率バーコーディングなどの方法および技術は、細胞分析において、特に、たとえば、逆転写、ポリメラーゼ連鎖反応(PCR)増幅、および次世代シーケンシング(NGS)を用いて細胞の状態を判定するために、遺伝子発現プロフィールを解読する上で有用である。しかし、これらの方法および技術は、置換エラー(1つ以上の塩基を含む)および非置換エラーなどのエラーを導入する恐れがあり、未訂正のままだと、過大評価された分子カウントが生じうる。従って、確率バーコーディングを用いて推定される正確な分子カウントを取得するために、さまざまなエラーを訂正することができる方法および技術が求められる。
特に定義がない限り、本明細書で用いられる技術用語はすべて、本開示が属する分野の当業者により一般に理解されているものと同一の意味を有する。たとえば、Singleton et al.,Dictionary of Microbiology and Molecular Biology 2nd ed.,J. Wiley & Sons(New York,NY 1994);Sambrook et al.,Molecular Cloning,A Laboratory Manual,Cold Springs Harbor Press(Cold Springs Harbor,NY 1989)を参照されたい。本開示の目的のために、下記の用語を以下に定義する。
確率バーコーディングは、たとえば、米国特許出願公開第20150299784号明細書、国際公開第2015031691号パンフレット、およびFu et al,Proc Natl Acad Sci U.S.A.2011 May 31;108(22):9026-31に記載されており、これらの刊行物の内容は、その全体を参照により本明細書に組み込む。手短には、確率バーコードは、標的に確率標識(例えば、バーコード、タグ)を付けるために使用することができるポリヌクレオチド配列であってよい。確率バーコードは、1つ以上の標識を含みうる。例示的な標識としては、ユニバーサル標識、細胞標識、分子標識、サンプル標識、プレート標識、空間標識、および/またはプレ空間標識を挙げることができる。図1は、空間標識を有する例示的な確率バーコード104を示す。確率バーコード104は、確率バーコードを固体担体105に連結しうる5’アミンを含んでよい。確率バーコードは、ユニバーサル標識、次元標識、空間標識、細胞標識、および/または分子標識を含みうる。確率バーコード中のさまざまな標識(限定するものではないが、ユニバーサル標識、次元標識、空間標識、細胞標識、および分子標識など)の順序は変動しうる。たとえば、図1に示すように、ユニバーサル標識は、最も5’側の標識であってよく、分子標識は、最も3’側の標識であってもよい。空間標識、次元標識、および細胞標識は、任意の順序であってよい。いくつかの実施形態では、ユニバーサル標識、空間標識、次元標識、細胞標識、および分子標識は、任意の順序であってよい。
確率バーコードは1つ以上のユニバーサル標識を含みうる。いくつかの実施形態では、1つ以上のユニバーサル標識は、所与の固体担体に結合される確率バーコードのセット中のすべての確率バーコードで同一でありうる。いくつかの実施形態では、1つ以上のユニバーサル標識は、複数のビーズに結合されるすべての確率バーコードで同一でありうる。いくつかの実施形態では、ユニバーサル標識は、シーケンシングプライマーにハイブリダイズ可能な核酸配列を含みうる。シークエンシングプライマーは、ユニバーサル標識を含む確率バーコードをシーケンスするために使用可能である。シークエンシングプライマー(たとえば、ユニバーサルシークエンシングプライマー)は、高スループットシークエンシングプラットフォームに関連付けられるシークエンシングプライマーを含みうる。いくつかの実施形態では、ユニバーサル標識は、PCRプライマーにハイブリダイズ可能な核酸配列を含みうる。いくつかの実施形態では、ユニバーサル標識は、シークエンシングプライマーおよびPCRプライマーにハイブリダイズ可能な核酸配列を含みうる。シーケンシングプライマーまたはPCRプライマーにハイブリダイズ可能なユニバーサル標識の核酸配列は、プライマー結合部位として参照しうる。ユニバーサル標識は、確率バーコードの転写を開始するために使用しうる配列を含みうる。ユニバーサル標識は、確率バーコードまたは確率バーコード内の領域の伸長のために、使用しうる配列を含みうる。ユニバーサル標識は、約1、2、3、4、5、10、15、20、25、30、35、40、45、50ヌクレオチド長、またはこれらの値のいずれか2つの間の数もしくは範囲であってよい。たとえば、ユニバーサル標識は、少なくとも約10ヌクレオチドを含みうる。ユニバーサル標識は、少なくとも、または多くとも、1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、もしくは300ヌクレオチド長でありうる。いくつかの実施形態では、切断可能なリンカーまたは修飾ヌクレオチドは、担体から確率バーコードを切断して除去することを可能にするユニバーサル標識配列の一部であってよい。
確率バーコードは1つ以上の次元標識を含みうる。いくつかの実施形態では、次元標識は、確率標識化が行われた次元に関する情報を提供する核酸配列を含みうる。たとえば、次元標識は、標的に確率バーコードが付された時点に関する情報を提供可能である。次元標識は、サンプルの確率バーコーディングの時点に関連付け可能である。次元標識は、確率標識化の時点で活性化可能である。異なる時点で異なる次元標識を活性化可能である。次元標識は、標的、標的のグループ、および/またはサンプルに確率バーコードを付けた順序に関する情報を提供する。たとえば、細胞集団は、細胞周期のG0期に確率バーコードを付けることが可能である。細胞は、細胞周期のG1期に確率バーコードで再びパルスすることが可能である。細胞は、細胞周期のS期に確率バーコードで再びパルスすることが可能であり、他の時期も同様である。各パルス時(たとえば、細胞周期の各期)の確率バーコードは、異なる次元標識を含みうる。こうして、次元標識は、細胞周期のどの期に標的に標識したかに関する情報を提供する。次元標識は、多種多様な生物時間を精査することが可能である。例示的な生物時間としては、限定されるものではないが、細胞周期、転写(たとえば転写開始)、および転写物分解が挙げられうる。他の例として、薬剤治療および/または療法の前および/または後にサンプル(たとえば、細胞、細胞集団)に確率標識を付けることが可能である。識別可能な標的のコピー数の変化は、薬剤および/または療法に対するサンプルの反応の指標でありうる。
確率バーコードは1つ以上の空間標識を含みうる。いくつかの実施形態では、空間標識は、確率バーコードに関連付けられる標的分子の空間配向に関する情報を提供する核酸配列を含みうる。空間標識は、サンプル中の座標に関連付け可能である。座標は固定座標でありうる。たとえば、座標は基材を基準にして固定可能である。空間標識は二次元または三次元のグリッドを基準にしうる。座標はランドマークを基準にして固定可能である。ランドマークは空間内で同定可能である。ランドマークはイメージング可能な構造体でありうる。ランドマークは生物学的構造体たとえば解剖学的ランドマークでありうる。ランドマークは細胞ランドマーク(たとえばオルガネラ)でありうる。ランドマークは、非天然ランドマーク、たとえば、色コード、バーコード、磁性、蛍光、放射能、またはユニークなサイズもしくは形状のような同定可能な識別子を有する構造体でありうる。空間標識は、物理的パーティション(たとえば、ウェル、容器、またはドロップレット)に関連付け可能である。いくつかの実施形態では、空間内の1つ以上の位置にコードを付けるために複数の空間標識が一緒に使用される。
確率バーコードは、1つ以上の細胞標識を含みうる。いくつかの実施形態では、細胞標識は、どの標的核酸がどの細胞に由来するかを決定するための情報を提供する核酸配列を含みうる。いくつかの実施形態では、細胞標識は、所与の固体担体(たとえばビーズ)に結合されるすべての確率バーコードで同一であるが、異なる固体担体(たとえばビーズ)については異なっている。いくつかの実施形態では、同一の細胞標識を含む、同一の固体担体上の確率バーコードのパーセンテージは、60%、70%、80%、85%、90%、95%、97%、99%、100%、またはこれらの値のいずれか2つの間の数もしくは範囲、あるいはそうした近似値でありうる。いくつかの実施形態では、同一の細胞標識を含む、同一の固体担体上の確率バーコードのパーセンテージは、60%、70%、80%、85%、90%、95%、97%、99%、もしくは100%、またはそうした近似値であってよい。たとえば、同一の固体担体上の確率バーコードの少なくとも60%が、同一の細胞標識を含みうる。別の例として、同一の固体担体上の確率バーコードの少なくとも95%が、同一の細胞標識を含んでもよい。
確率バーコードは、1つ以上の分子標識を含みうる。いくつかの実施形態では、分子標識は、確率バーコードにハイブリダイズされた標的核酸種の特定のタイプを同定するための情報を提供する核酸配列を含みうる。分子標識は、確率バーコード(たとえば標的結合領域)にハイブリダイズされた標的核酸種の特定の存在に対するカウンターを提供する核酸配列を含みうる。
確率バーコードは、1つ以上の標的結合領域を含みうる。いくつかの実施形態では、標的結合領域は、対象の標的とハイブリダイズすることができる。いくつかの実施形態では、標的結合領域は、標的(たとえば、標的核酸、標的分子、たとえば、分析される細胞核酸)、たとえば、特定の遺伝子配列に特異的にハイブリダイズする核酸配列を含みうる。いくつかの実施形態では、標的結合領域は、特定の標的核酸の特定の位置に結合(たとえばハイブリダイズ)しうる核酸配列を含みうる。いくつかの実施形態では、標的結合領域は、制限酵素部位オーバーハング(たとえば、EcoRI付着末端オーバーハング)への特異的なハイブリダイゼーションが可能な核酸配列を含みうる。次いで、確率バーコードは、制限部位オーバーハングに相補的な配列を含む任意の核酸分子にライゲートしうる。
確率バーコードは、確率バーコードの配向(たとえばアライメント)のために使用することができる1つ以上の配向性を含みうる。確率バーコードは、等電点電気泳動用の部分を含みうる。異なる確率バーコードは、異なる等電点電気泳動点を含みうる。こうした確率バーコードをサンプルに導入した場合、サンプルは、確率バーコードを既知の形態にオリエントするために等電点電気泳動を行うことが可能である。こうして、オリエント性は、サンプルで確率バーコードの既知のマップを作成するために使用可能である。例示的なオリエント性としては、電気泳動移動度(たとえば、確率バーコードのサイズに基づく)、等電点、スピン、伝導率、および/またはセルフアセンブリーが挙げられうる。たとえば、セルフアセンブリーのオリエント性を含む確率バーコードは、活性化時に特定のオリエンテーションにセルフアセンブル可能である(たとえば、核酸ナノ構造)。
確率バーコードは、1つ以上の親和性を含みうる。たとえば、空間標識は、親和性を含みうる。親和性は、他のエンティティー(たとえば細胞レセプター)との確率バーコードの結合を促進することができる化学的および/または生物学的部分を含みうる。たとえば、親和性は、抗体、たとえば、サンプル上の特定の部分(たとえばレセプター)に特異的な抗体を含みうる。いくつかの実施形態では、抗体は、確率バーコードを特定の細胞型または分子に誘導することができる。特定の細胞型もしくは分子および/またはその近傍にある標的を確率標識化することができる。抗体は確率バーコードを特定の位置に誘導することができるので、いくつかの実施形態において、親和性は、空間標識のヌクレオチド配列に加え、空間情報も提供することができる。抗体は、治療用抗体、たとえば、モノクローナル抗体またはポリクローナル抗体であってもよい。抗体は、ヒト化されていても、またはキメラであってもよい。抗体は、ネイキッド抗体または融合抗体であってもよい。
確率バーコードは、1つ以上のユニバーサルアダプタープライマーを含みうる。たとえば、遺伝子特異的確率バーコードは、ユニバーサルアダプタープライマーを含みうる。ユニバーサルアダプタープライマーは、すべての確率バーコードに対してユニバーサルであるヌクレオチド配列を意味しうる。ユニバーサルアダプタープライマーは、遺伝子特異的確率バーコードを構築するために使用することができる。ユニバーサルアダプタープライマーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはこれらの値のいずれか2つの間の数もしくは範囲、あるいはそうした近似値のヌクレオチド長でありうる。ユニバーサルアダプタープライマーは、少なくとも、または多くとも、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、もしくは30ヌクレオチド長でありうる。ユニバーサルアダプタープライマーは、約5~30ヌクレオチド長であってもよい。
本明細書に開示される確率バーコードは、いくつかの実施形態において、固体担体と結合することができる。固体担体は、たとえば、合成粒子であってよい。いくつかの実施形態では、固体担体上の複数の確率バーコード(たとえば、第1の複数の確率バーコード)の分子標識(たとえば、第1の分子標識)の一部または全部が、少なくとも1ヌクレオチド異なる。同じ固体担体上の確率バーコードの細胞標識は、同じであってもよい。異なる固体担体上の確率バーコードの細胞標識は、少なくとも1ヌクレオチド異なりうる。たとえば、第1の固体担体上の第1の複数の確率バーコードの第1の細胞標識は、同じ配列を有してよく、第2の固体担体上の第2の複数の確率バーコードの第2の細胞標識は、同じ配列を有してよい。第1の固体担体上の第1の複数の確率バーコードの第1の細胞標識と、第2の固体担体上の第2の複数の確率バーコードの第2の細胞標識とは、少なくとも1ヌクレオチド異なりうる。細胞標識は、たとえば、約5~20ヌクレオチド長でありうる。分子標識は、たとえば、約5~20ヌクレオチド長でありうる。合成粒子は、たとえば、ビーズであってよい。
本明細書で使用される場合、基材はあるタイプの固体担体を意味しうる。基材は、本開示の確率バーコードを含みうる固体担体を意味しうる。基材は、たとえば、複数のマイクロウェルを含みうる。たとえば、基材は、2つ以上のマイクロウェルを含むウェルアレイであってよい。いくつかの実施形態では、マイクロウェルは、規定の体積の小さい反応チャンバーを含みうる。いくつかの実施形態では、マイクロウェルは、1つ以上の細胞を閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、1つの細胞のみを閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、1つ以上の固体担体を閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、1つの固体担体のみを閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、単一細胞および単一固体担体(たとえば、ビーズ)を閉じ込める。
本開示は、身体サンプル(たとえば、組織、器官、腫瘍、細胞)における識別可能な位置の識別可能な標的の数を推定する方法を提供する。本方法は、サンプルと接近させて確率バーコードを配置する工程と、サンプルを溶解させる工程と、識別可能な標的を確率バーコードと関連させる工程と、標的を増幅する工程および/または標的をディジタルカウントする工程と、を含みうる。本方法は、さらに、確率バーコード上の空間標識から得られた情報を分析する工程および/または視覚化する工程をさらに含みうる。いくつかの実施形態では、一方法は、サンプル中の複数の標識を視覚化する工程を含む。サンプルのマップに複数の標的をマッピングする工程は、サンプルの二次元マップまたは三次元マップの作製を含みうる。二次元マップまたは三次元マップは、サンプル中の複数の標的に確率バーコードを付ける前または後に作製することができる。サンプル中の複数の標的を視覚化する工程は、サンプルのマップに複数の標的をマッピングする工程を含みうる。サンプルのマップに複数の標的をマッピングする工程は、サンプルの二次元マップまたは三次元マップを作製するステップを含みうる。二次元マップおよび三次元マップは、サンプル中の複数の標的に確率バーコードを付ける前または後に作製することができる。いくつかの実施形態では、二次元マップおよび三次元マップは、サンプルを溶解させる前または後に作製することができる。二次元マップまたは三次元マップの作製前または後にサンプルを溶解させる工程は、サンプルを加熱する工程と、サンプルを洗剤と接触させる工程と、サンプルのpHを変化させる工程、またはそれらの任意の組合せを含みうる。
本開示は、サンプル(たとえば、細胞)を本開示の基材と接触させる方法を提供する。たとえば、細胞、器官、または組織薄片を含むサンプルを確率バーコードと接触させることができる。たとえば、重力流によって、細胞を接触させることができ、その場合、細胞は沈殿して単層を形成しうる。サンプルは、組織薄片であってよい。薄片を基材の上に配置することができる。サンプルは、一次元(たとえば、平面表面を形成する)であってよい。サンプル(たとえば、細胞)は、たとえば、基材上に細胞を増殖させる/培養することによって、基材全体に広げることができる。
細胞および確率バーコードの分配後、細胞は標的分子を遊離するように溶解可能である。細胞溶解は、さまざまな手段のいずれかにより、たとえば、化学的もしくは生化学的手段により、浸透圧ショックにより、または熱溶解、機械溶解、もしくは光学溶解により達成可能である。細胞は、界面活性剤(たとえば、SDS、Liドデシルスルフェート、Triton X-100、Tween-20、もしくはNP-40)、有機溶媒(たとえば、メタノールもしくはアセトン)、または消化酵素(たとえば、プロテイナーゼK、ペプシンまたはトリプシン)、あるいはそれらの任意の組合せを含む細胞溶解緩衝液の添加により溶解可能である。標的と確率バーコードとの関連付けを向上させるために、たとえば、温度の低下および/またはライセートの粘度の増加により、標的分子の拡散速度を変化させることが可能である。
細胞の溶解およびそれからの核酸分子の放出の後、核酸分子は、共局在化された固体担体の確率バーコードにランダムに関連付けすることができる。関連付けは、標的核酸分子の相補的部分への確率バーコードの標的認識領域のハイブリダイゼーションを含みうる(たとえば、確率バーコードのオリゴ(dT)は、標的のポリ(A)テールと相互作用可能である)。ハイブリダイゼーションに使用されるアッセイ条件(たとえば、緩衝液pH、イオン強度、温度など)は、特定の安定なハイブリッドの形成を促進するように選択可能である。いくつかの実施形態では、溶解した細胞から放出された核酸分子は、基材上の複数のプローブに関連付けする(たとえば、基板上のプローブとハイブリダイズする)ことができる。プローブが、オリゴ(dT)を含むとき、mRNA分子は、プローブにハイブリダイズして、逆転写されうる。オリゴヌクレオチドのオリゴ(dT)部分は、cDNA分子の第1鎖合成のためのプライマーとして作用しうる。たとえば、図2、ブロック216に示す確率バーコードの非限定的な例において、mRNA分子は、ビーズ上の確率バーコードをハイブリダイズすることができる。たとえば、一本鎖ヌクレオチド断片は、確率バーコードの標的結合領域にハイブリダイズすることができる。
本開示は、(たとえば、図2のブロック224で)逆転写を用いて確率標的-バーコードコンジュゲートを生成する方法を提供する。確率標的-バーコードコンジュゲートは、確率バーコードと標的核酸の全部または一部の相補的配列と(すなわち、確率バーコード付きcDNA分子)を含みうる。関連付けられたRNA分子の逆転写は、逆転写酵素と共に逆転写プライマーを添加することによって起こりうる。逆転写プライマーは、オリゴ(dT)プライマー、ランダムヘキサヌクレオチドプライマー、または標的特異的オリゴヌクレオチドプライマーでありうる。オリゴ(dT)プライマーは、12~18ヌクレオチド長、または概ねそうしたヌクレオチド長であってよく、哺乳動物mRNAの3’末端の内因性ポリ(A)テールに結合することができる。ランダムヘキサヌクレオチドプライマーは、さまざまな相補的部位でmRNAと結合しうる。標的特異的オリゴヌクレオチドプライマーは、典型的には対象のmRNAを選択的にプライミングする。
核酸増幅反応(たとえば、図2のブロック228で)は、標識標的核酸分子の複数のコピーを生成するために1回以上実施することができる。増幅は、複数の標的核酸配列が同時に増幅される、多重方式で実施してよい。増幅反応は、核酸分子にシーケンシングアダプターを付加するために使用することができる。増幅反応は、存在するのであれば、サンプル標識の少なくとも一部を増幅する工程を含みうる。増幅反応は、細胞および/または分子標識の少なくとも一部を増幅する工程を含みうる。増幅反応は、サンプルタグ、細胞標識、空間標識、分子標識、標的核酸、またはそれらの組合せの少なくとも一部を増幅する工程を含みうる。増幅反応は、複数の核酸の0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%、またはこれらの値のいずれか2つの間の範囲もしくは数を増幅する工程を含みうる。本方法は、サンプル標識、細胞標識、空間標識、および/または分子標識を含む標的-バーコード分子のcDNAコピーを1つ以上生成するために、cDNA合成反応を1回以上行う工程をさらに含みうる。
本明細書には、標的の数を決定するための方法が開示される。いくつかの実施形態では、本方法は、(a)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程であって、複数の確率バーコードの各々が分子標識を含む工程と;(b)確率バーコード付き標的のシーケンシングデータを取得する工程と;(c)複数の標的の1つ以上について:(i)シーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;(ii)(b)で得られたシーケンシングデータ中の標的のクオリティステータスを決定する工程と;(iii)(b)で得られたシーケンシングデータ中の1つ以上のシーケンシングデータエラーを決定する工程であって、シーケンシングデータ中の1つ以上のシーケンシングデータエラーを決定する工程が、以下:シーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数、シーケンシングデータ中の標的のクオリティステータス、および複数の確率バーコードに識別可能な配列を有する分子標識の数のうち1つ以上を決定することを含む工程と;(iv)標的の数を推定する工程であって、推定された標的の数が、(iii)で決定された1つ以上のシーケンシングデータエラーに応じて調節された、(i)でカウントされたシーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数と相関する工程と、を含む。工程(i)、(ii)、(iii)、および(iv)は、複数の標的の各々について実施することができる。本方法は、多重化することができる。
図5は、分子標識を用いてPCRおよびシーケンシングエラーを訂正する非限定的な例示的実施形態500を示すフローチャートである。実施形態500は、複数の確率バーコードを用いて、複数の標的に確率バーコード(複数の確率バーコードの各々は、分子標識を含む)を付けて、複数の確率バーコード付き標的を生成する工程の後、ならびに、確率バーコード付き標的のシーケンシングデータを取得する工程の後、開始ブロック504から開始する。
ブロック512で、シーケンシングデータを折りたたむことができる。シーケンシングデータを折りたたむ工程は、類似分子標識を有し、かつ所定の折りたたみ発生数閾値よりも少ない発生数を有する標的のコピーを、複数の標的について同じ分子標識を有するものとして帰属させる工程を含みうる。所定の折りたたみ発生数閾値は、1~100の範囲で変動しうる。いくつかの実施形態では、所定の折りたたみ発生数閾値は、確率バーコードが、識別可能な配列を有する約6561の分子標識を含む場合、1、2、3、4、5、6、7、8、9、10、17、20、30、40、50、60、70、80、90、100、または概ねそうした値であるか、あるいはこれらの値のいずれか2つの間の数もしくは範囲でありうる。いくつかの実施形態では、所定の折りたたみ発生数閾値は、確率バーコードが、識別可能な配列を有する約6561の分子標識を含む場合、少なくとも、または多くとも、1、2、3、4、5、6、7、8、9、10、17、20、30、40、50、60、70、80、90、もしくは100でありうる。たとえば、分子標識は、8ヌクレオチド長であってよく、各ヌクレオチド位置は、アデニン(A)、シトシン(C)、グアニン(G);C、G、チミン(T);A、G、T;またはA、C、Tなどの3つの可能性を有しうるため、38=6561のユニーク分子標識を生成しうる。
の分子標識を有するものであってよく、分子標識当たりのリードの数は、それぞれ、261、2、2、1、および1である。分子標識
は、それらが、分子標識TGTGCGTGと1ヌクレオチド(下線部)異なっているため、分子標識TGTGCGTGと類似している。識別可能な配列を有する6561の分子標識があり、かつ所定の折りたたみ発生数閾値が7である場合、分子標識
の発生数は、分子標識TGTGCGTGに帰属させることができる。
の分子標識を有するものであってよく、分子標識当たりのリードの数は、それぞれ、10、7、5、4、1、1、および1である。分子標識
は、分子標識CGCGTTCAと、互いに1ヌクレオチド(下線部)異なっているため、類似している。識別可能な配列を有する6561の分子標識があり、かつ所定の折りたたみ発生数閾値が7である場合、分子標識
の発生数は、分子標識CGCGTTCAに帰属させることができる。
本明細書に開示する方法は、シーケンシングデータエラー、たとえば、1つ以上の標的核酸をカウントする方法に発生するエラーを同定および/または訂正するために使用することができる。いくつかの実施形態では、シーケンシングデータエラーは、PCR導入エラー、シーケンシング導入エラー、バーコード混入に起因するエラー、ライブラリー作製エラー、またはそれらの任意の組合せを含むか、これらでありうる。PCR導入エラーは、PCR増幅エラー、PCR増幅バイアス、不十分なPCR増幅、またはそれらの任意の組合せの結果を含むか、これらでありうる。シーケンシング導入エラーは、不正確なベースコーリング、不十分なシーケンシング、またはそれらの任意の組合せの結果を含むか、これらでありうる。エラーは、1つ以上のヌクレオチドの欠失、1つ以上のヌクレオチドの置換、1つ以上のヌクレオチドの付加、またはそれらの任意の組合せを含むか、これらでありうる。
前述したように、複数の確率バーコードを用いて、複数の標的に確率バーコードを付けることにより、複数の確率バーコード付き標的を生成することができ、複数の確率バーコードの各々は、分子標識、ならびに確率バーコード付き標的のシーケンシングデータの取得を含みうる。標識、たとえば、マイクロウェルアレイのマイクロウェル内の1細胞に由来する遺伝子の場合、シーケンシングデータ中の標的と関連付けられた識別可能な配列を有する分子標識の数をカウントすることができる。カウントされたシーケンシングデータは、たとえば、類似した分子標識を有し、かつ所定の折りたたみ発生数閾値よりも少ない発生数を有する標的のコピーを、複数の標的について同じ分子標識を有するものとして帰属させる工程によって、折りたたむことができる。シーケンシングデータを折りたたんだ後、標的のクオリティステータスを決定することができる。
本明細書に開示する方法は、標的が、完全シーケンシングクオリティステータスを有する場合、シーケンシングライブラリー中の標的の数の推定値を提供することができる。シーケンシングライブラリー中の標的が、完全シーケンシングクオリティステータスを有する場合、真の確率バーコードおよびエラー確率バーコードのシーケンシングリードについて個別のポアソンモデルを介して閾値を確立することができる。標的のクオリティステータスは、真の分子標識またはリアル分子標識のすべてがシーケンシングランの深度で観察されたか否かに依存しうる。真の分子標識またはリアル分子標識は、エラーまたは偽の分子標識ではない分子標識を意味しうる。エラーまたは偽の分子標識は、PCRエラー、人工物、またはシーケンシングエラーから生じた配列を有する分子標識を意味しうる。
本明細書に開示する方法は、分子標識カウントを推定する際の大きな不確実性のために、標的が飽和シーケンシングクオリティステータスを有する場合、シーケンシングライブ中の標的の数の推定値を提供することができないこともある。図5を参照にして、いくつかの実施形態では、決定状態520で、シーケンシングステータスが完全シーケンシングステータスではない場合、実施形態500は、決定状態540に進む。決定状態540で、標的が、飽和シーケンシングステータスを有する場合、実施形態500は、終点ブロック536に進む。飽和シーケンシングステータスの場合、分子標識カウントを推定する際の大きな不確実性のために、標的の数が決定されないことがある。
本明細書に開示する方法は、標的が不完全シーケンシングクオリティステータスを有する場合、シーケンシングライブラリー中の標的の数の推定値を提供することができる。シーケンシングライブラリー中の標的は、不完全シーケンシングクオリティステータスを有するとき、ノイジー標的、たとえば、ノイジー遺伝子は除去することができる。標的は、その増幅速度(分子標識当たりの平均リード)が、標的を含む同じライブラリー中の完全にシーケンシングされた遺伝子からに由来するエラーの増幅速度と類似していれば、ノイジーでありうる。ライブラリー中に存在する識別可能な分子標識を有する標的を含む確率バーコードの数の推定値を補外するために、不完全シーケンシングのクオリティステータスを有する標的のシーケンシングリードに対して、ゼロ切断ポアソンモデルを適用することができる。
本明細書に開示する方法は、シーケンシングデータエラー、たとえば、1つ以上の標的核酸をカウントする方法に発生するエラーを同定および/または訂正するために使用することができる。いくつかの実施形態ではエラーは、1つ以上のヌクレオチドの欠失、1つ以上のヌクレオチドの置換、1つ以上のヌクレオチドの付加、またはそれらの任意の組合せを含むか、そうしたものでありうる。エラーは、分子標識(ML)、サンプル標識(SL)、確率バーコード上の他の標識に存在しうる。いくつかの実施形態では、シーケンシングデータエラーは、PCR導入エラー、シーケンシング導入エラー、逆転写(RT)プライマー混入エラー、またはそれらの任意の組合せを含むか、またはそうしたものでありうる。PCR導入エラーは、PCR増幅エラー、PCR増幅バイアス、不十分なPCR増幅、またはそれらの任意の組合せの結果を含むか、またはそうしたものでありうる。シーケンシング導入エラーは、不正確なベースコーリング、不十分なシーケンシング、またはそれらの任意の組合せの結果を含むか、またはそうしたものでありうる。RTプライマー混入エラーは、PCRに進入した逆転写プライマーに起因するエラーでありうる。
本明細書には、PCRまたはシーケンシングエラーを訂正する方法が開示される。いくつかの実施形態では、本方法は、(a)確率バーコード付き標的のシーケンシングデータを受け取る工程を含む。確率バーコード付き標的は、複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程により取得することができ、ここで、複数の確率バーコードの各々が分子標識を含む。いくつかの実施形態では、本方法は、(b)複数の標的の1つ以上について:(i)シーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;(ii)方向近接性を用いて、標的の分子標識のクラスターを同定する工程と;(iii)(ii)で同定された標的の分子標識のクラスターを用いて、(b)で受け取られたシーケンシングデータを折りたたむ工程と;(iv)標的の数を推定する工程であって、推定された標的の数が、(ii)でシーケンシングデータを折りたたんだ後、(i)でカウントされたシーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数と相関する工程と、を含む。複数の標的は、細胞の全トランスクリプトームの標的を含む。いくつかの実施形態では、本方法は、さらに、(c)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程と;(d)確率バーコード付き標的をシーケンシングして、受け取った確率バーコード付き標的のシーケンシングデータを生成する工程と、を含む。
本明細書には、標的の数を決定する方法が開示される。いくつかの実施形態では、一方法は、(a)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程であって、複数の確率バーコードの各々が分子標識を含む工程と;(b)確率バーコード付き標的のシーケンシングデータを取得する工程と;(c)複数の標的の1つ以上について:(i)シーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;(ii)方向近接性を用いて、標的の分子標識のクラスターを同定する工程と;(iii)(ii)で同定された標的の分子標識のクラスターを用いて、(b)で得られたシーケンシングデータを折りたたむ工程と;(iv)標的の数を推定する工程であって、推定された標的の数が、(ii)でシーケンシングデータを折りたたんだ後、(i)でカウントされたシーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数と相関する工程と、を含む。複数の標的は、細胞の全トランスクリプトームの標的を含みうる。
本明細書には、PCRまたはシーケンシングエラーを訂正する方法が開示される。本方法を用いて、標的の数を決定することができる。いくつかの実施形態では、本方法は、(a)確率バーコード付き標的のシーケンシングデータを受け取る工程を含む。確率バーコード付き標的は、複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程により取得することができ、ここで、複数の確率バーコードの各々が分子標識を含む。いくつかの実施形態では、本方法は、(b)複数の標的の1つ以上について:(i)シーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;(ii)シーケンシングデータ中の標的に関連付けられた識別可能な配列を有するノイズ分子標識の数を決定する工程と;(iii)標的の数を推定する工程と、を含み、ここで、推定された標的の数は、(ii)で決定されたノイズ分子標識の数に従って調節される、(i)でカウントされたシーケンシングデータ中の標的に関連付けられた識別可能な配列を有する分子標識の数と相関する。いくつかの実施形態では、本方法は、シーケンシングデータ中の標的のシーケンシングステータスを決定する工程を含む。いくつかの実施形態では、本方法は、さらに、(c)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程と;(d)確率バーコード付き標的をシーケンシングして、受け取った確率バーコード付き標的のシーケンシングデータを生成する工程と、を含む。
図11は、2つのネガティブ二項分布を用いたエラー訂正の非限定的な例示的実施形態1100を示すフローチャートである。方法1100のブロック(たとえば、ブロック904~952)は、図9を参照にして説明されている。手短には、方法1100は、複数の確率バーコード付き標的のシーケンシングデータを受け取った後、ブロック904で開始する。いくつかの実施形態では、方法1100は、複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程をさらに含み、ここで、複数の確率バーコードの各々は、分子標識を含む。いくつかの実施形態では、方法1100は、さらに、複数の確率バーコード付き標的をシーケンシングして、シーケンシングデータを取得する工程も含む。
図13は、再帰による再帰的置換エラー訂正および分布ベースのエラー訂正に基づくPCRおよびシーケンシングエラーの訂正の非限定的な例示的実施形態13を示すフローチャートである。本方法1300のブロック(たとえば、ブロック904~952)は、図9を参照にして説明されている。手短には、方法1300は、複数の確率バーコード付き標的のシーケンシングデータを受け取った後、ブロック904で開始する。いくつかの実施形態では、方法1300は、複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程をさらに含み、ここで、複数の確率バーコードの各々は、分子標識を含む。いくつかの実施形態では、方法1300は、さらに、複数の確率バーコード付き標的をシーケンシングして、シーケンシングデータを取得する工程も含む。
いくつかの実施形態では、確率バーコード付き標的の数を推定する工程は、標識標的、空間標識、分子標識、サンプル標識、細胞標識、またはその任意の産物(たとえば、標識アンプリコン、もしくは標識cDNA分子)の配列を決定する工程を含みうる。増幅された標的をシーケンシングに付すことができる。確率バーコード付き標的またはその任意の産物の配列を決定する工程は、サンプル標識の少なくとも一部、空間標識、細胞標識、分子標識、確率バーコード付き標的の少なくとも一部、その相補鎖、逆相補鎖、またはその任意の組合せの配列を決定するために、シーケンシング反応を実施する工程を含みうる。
Torrent、Complete Genomics、PacificBioscience、Helicos、またはPolonatorプラットホームといったプラットホームを用いた環状アレイシーケンシングなどのハイスループットシーケンシング方法も使用することができる。いくつかの実施形態では、シーケンシングは、MiSeqシーケンシングを含みうる。いくつかの実施形態では、シーケンシングは、HiSeqシーケンシングを含みうる。
いくつかの実施形態では、1つ以上のサンプル中に複数の標識が含有されうる。1サンプルは、1つ以上の細胞、または1つ以上の細胞由来の核酸を含みうる。1サンプルは、単一細胞、または1細胞由来の核酸であってよい。1つ以上の細胞は、1つ以上の細胞型であってよい。1つ以上の細胞型の少なくとも1つは、脳細胞、心臓細胞、癌細胞、循環腫瘍細胞、器官細胞、上皮細胞、転移性細胞、良性細胞、一次細胞、循環細胞、またはそれらの任意の組合せである。
データ解析および標的の空間分解能の可視化
本開示は、確率バーコーディングおよび空間標識を使ってディジタルカウンティングを用いて標的の数および位置を推定する方法を提供する。本開示の方法から得られるデータはマップ上に可視化可能である。サンプルの標的の数および位置のマップは、本明細書に記載の方法を用いて生成された情報を用いて構築可能である。マップは、標的の物理的位置を決定するために使用可能である。マップは、複数の標的の位置を同定するために使用可能である。複数の標的は標的の同一種でありうるか、または複数の標的は複数の異なる標的でありうる。たとえば、脳のマップを構築して複数の標的のディジタルカウントおよび位置を示すことが可能である。
一般的には、本開示の機器システム方法にての使用に適したコンピュータまたはプロセッサーは、図15に示すように、固定媒体1512を有するサーバー1509に任意選択的に接続可能な媒体1511またはネットワークポート1505から命令を読取り可能な論理装置としてさらに理解しうる。システム1500は、図15に示すように、CPU1501、ディスクドライブ1503、キーボード1515やマウス1516などのオプションの入力デバイス、およびオプションのモニター1507を含みうる。データ通信は、ローカル位置またはリモート位置のサーバーに対して指定の通信媒体を介して達成可能である。通信媒体は、データを送受信する任意の手段を含みうる。たとえば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続でありうる。かかる接続は、World Wide Webによる通信を提供可能である。本開示に関するデータは、図15に示すように、かかるネットワークまたは接続を介してあるパーティー1522による受信または閲覧のために伝送可能である。
一般的には、図に示すように、本開示の機器システムに含まれるコンピュータまたはプロセッサーは、固定媒体12を有するサーバー09に任意選択的に接続可能な媒体11またはネットワークポート05から命令を読み取ることができる論理装置としてさらに理解しうる。図に示すようなシステム00は、CPU01、ディスクドライブ03、キーボード15もしくはマウス16などのオプションの入力デバイス、およびオプションのモニター07を含みうる。データ通信は、ローカル位置またはリモート位置のサーバーに対して指定の通信媒体を介して達成することができる。通信媒体は、データを送受信する任意の手段を含みうる。たとえば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続でありうる。かかる接続は、World Wide Webによる通信を提供可能である。図示される通り本開示に関するデータは、かかるネットワークまたは接続を介して、あるパーティー22による受信または閲覧のために伝送することができる。
1塩基置換エラーの訂正
本実施例は、1塩基置換を含むPCRまたはシーケンシングエラーの訂正を示す。1塩基置換を含むPCRまたはシーケンシングエラーは、類似の分子標識と、38のユニーク確率バーコードが存在した場合(48のユニーク確率バーコードが存在した場合、17)、≦7の発生数、すなわちシーケンシングリードとを有する標的のコピーを、複数の標的の同じ分子標識を有するものとして帰属させる工程により除去した。
シーケンシングデータ中の標的のクオリティステータスの決定
この実施例は、シーケンシングデータ中の標的のクオリティステータスが、完全シーケンシングクオリティステータス、不完全シーケンシングクオリティステータス、または飽和シーケンシングクオリティステータスであることを決定する工程を明らかにする。標的のクオリティステータスは、真またはリアル分子標識のすべてが観察されたか否かに依存した。
完全にシーケンシングされた遺伝子の1塩基置換によるPCRまたはシーケンシングエラーの訂正
この実施例は、完全にシーケンシングされた遺伝子、すなわちシーケンシングデータ中の完全シーケンシングのクオリティステータスを有する遺伝子について1塩基置換によるPCRまたはシーケンシングエラーを訂正する工程を示す。この実施例はまた、シーケンシンデータ中の標的に関連付けられた真の分子標識および偽の分子標識を決定するために、標的、たとえば、遺伝子の分子標識を閾値化する工程も示す。
親分子標識は、>25シーケンシングリードを有することが要求され、子供分子標識は、3以下のシーケンシングリードを有することが要求されうる。これらの要件は、下記の推論に基づくものであった。ヌクレオチドごとのシーケンシングエラーの確率が0.5%と仮定する。分子標識が、25回シーケンシングされて、合計して200のヌクレオチドが生成された場合、200*0.005=1であるから、1ヌクレオチドがエラーであることが予想された。従って、25のシーケンシングリードを有する各分子標識について、少なくとも1つの子供分子標識を有することが予想された。親分子標識は、25のシーケンシングリードを有するべきであると想定されうる。4のシーケンシングリードを有する子供分子標識は、シーケンシングエラーである可能性は低かった。これは、1つの分子標識中に同じエラーを4回導入する確率が、8*0.0054=10-9であるためであった。もし、合計106シーケンシングエラーリードが存在した場合には、4回反復されたシーケンシングエラーの予想数は、5*109*106=0.005となり、これは無視することができた。従って、子供分子標識は、リード≦3を有するべきである。
親分子標識と、シーケンシングリード(Rchild1、Rchild2、・・・、Rchildm)を有する、親分子標識とは1塩基相違する子供分子標識のセットとを仮定し、多重二項検定を用いて、真の子供分子標識を同定することができる。帰無仮説の下で、真の子供分子標識の存在量は、Rpar*p以下になるはずであり(数学的に、H0:p<e/2);そうでなければ、存在量は、Rpar*pより大きい(HA:p<e/2)という別の仮説を支持する結論が下され、分子標識は、真の子供分子標識であったという仮説は拒絶されうる。次に、親分子標識とは1塩基相違する子供分子標識が1回観察された確率は、p=e/2となる。次に、数学的に、総存在量(Rchild+Rpar)から、この子供分子標識を少なくともRchild回観察する確率pchildは、以下の通りとなる:
シーケンシングエラーは、完全シーケンシングの下で出現する可能性が高くなりうる。1塩基シーケンシングエラーなどのいくつかのタイプのエラーは、訂正可能であるが、人工的分子標識のランダム組込みといった他のエラーは、配列類似性に基づいて訂正することができないであろう。その代わり、これらのタイプのエラーは、モデル化によって同定することができる。前述したように、完全シーケンシングは、ポアソンに対して過剰散布される傾向がある。従って、過剰散布を特徴とする2つの特有のポアソンモデルを作製した:1つは、真の分子標識(すなわち、確率バーコード付け工程中に、標的分子を標識するのに用いられる分子標識配列)のためのシーケンシングリードをモデル化するために使用することができ、2つ目のモデルは、エラー分子標識(すなわち、確率バーコード付け工程中に使用されないが、エラーのためにシーケンシング後に出現した分子標識配列)のために使用することができる。シーケンシングエラー率は、約0.1~1%であり、PCRサイクルエラー率は、約0.001%でありうる。PCRエラーは、PCRの後のサイクル中に、より多く起こって、低シーケンシングリードを有するエラー分子標識を生じうるが、すべての観察された分子標識配列の大部分に寄与しうる。従って、PCRおよびシーケンシングによって生じたエラーは、多くの場合、真の分子標識よりも低いシーケンシングリードを有しうる。そのため、真の分子標識のシーケンシングリードのポアソン平均は、エラー分子標識のポアソン平均より大きくなる。
(式中、P(Xi=Ri|μt)は、平均μtを有するポアソン過程の下で、存在量Riを有するi番目の分子標識を観察する確率を示す)。
不完全にシーケンシングされた遺伝子の調節
この実施例は、ノイジー遺伝子を除去するとともに、ゼロ切断ポアソンモデルを用いて、ライブラリー中に存在することが予想される分子標識の総数を推定することにより不完全にシーケンシングされた遺伝子を調節する工程を示す。
分子標識およびそのシーケンシングリードの統計学を考慮する以外に、遺伝子レベルの解析も有益となりうる。ある遺伝子について、検出された分子標識が非常に少なく、しかも各分子標識が、完全にシーケンシングされた遺伝子に比べて著しく低いリードを有する場合、その遺伝子をノイジーとみなすことができる。この想定は、同じライブラリー内の確率バーコード付き分子が、概ね同じ頻度で増幅およびシーケンシングされるはずであるという論証に基づくものであった。こうした期待は、各分子のシーケンシングの相違に起因するPCRおよびシーケンシングバイアスによって影響されうるが、それらはPCR中におけるサンプルの汚染や望ましくない分子の再結合などの事象によって発生する「ノイズ」に応じて小さいと想定されていた。遺伝子は、その増幅速度(分子標識当たりの平均リード)が、同じライブラリー中で完全にシーケンシングされた遺伝子に由来するエラーの増幅率と類似であった場合、ノイジーでありうる。
であった。同様にして、他の完全にシーケンシングされた遺伝子すべてのg2、g3、・・・、gxについて、EAMPを計算することができる。観察された計5未満の分子標識を有する潜在的ノイジー遺伝子g’1、ならびに各分子標識にマッピングされたRg’1,1、Rg’1,2、・・・、Rg’1,kシーケンシングリードについて、カットオフを適用することができ、その増幅速度を
として決定する。ampg’1<中央(ampg’1、ampg’2、・・・、ampg’x)であれば、遺伝子g’1をノイジー遺伝子であると考えた。そうでなければ、これは、不完全遺伝子とみなすことができる。同様に、他のノイジー遺伝子も検定し、除去した。5の分子標識をカットオフとして選択した理由は、低い増幅速度を有する遺伝子を2つの個別のケース:人工物(5未満の分子標識が観察されたもの)と不完全シーケンシング(低PCR/シーケンシングのプライマー失敗により≧5の分子標識が観察されたもの)に処理することが望ましいと思われるためである。
シーケンシングが不完全であったとき、エラーはデータ中に依然として存在しうるが、全体として不十分なシーケンシングリードのために同定することが困難となりうる。シーケンシングが浅く、ライブラリー中に存在する分子標識のすべてが観察されていない場合、重要な分析のためにいくつかの想定が必要となりうる。すべての観察された分子標識が真であること、ならびに観察されていない真の分子標識が、ゼロで切断されている、すなわち、ゼロ時間で観察された切断分子標識であると想定することができる。所与の遺伝子について確率バーコード付き転写物のすべてがシーケンシングにサンプリングされているわけではないが、検出された分子標識のリードの頻度を用い、ゼロ切断ポアソンモデルを適用することにより、全ライブラリー中に存在する分子標識の完全な多様性を推定することができる。
L(S,μ)∝S!/(S-k)!μnexp(-Sμ) (式3)
完全シーケンシング遺伝子および不完全シーケンシング遺伝子
この実施例は、完全シーケンシング遺伝子および不完全シーケンシング遺伝子のシーケンシングリードを調節した後に生成されたアウトプットの一例を示す。
n=-mlog(1-k/m)、式(4)
(式中、mは、分子標識(38)の全多様性であり、kは、観察されたユニーク分子標識の総数であった)。nの分散であるvar(n)は、テイラー展開を用いて導かれた:var(n)=(m/(m-k))2var(k)(式中、var(k)は、m*(1-(1-1/m)n)(1-1/m)n+m(m-1)((1-2/m)n-(1-1/m)2n)として表すことができる)。出発分子の推定数の下限および上限(推定Mol LBおよび推定Mol UB)は、
を用いて計算した。
完全シーケンシング遺伝子および不完全シーケンシング遺伝子の訂正の性能
この実施例は、完全シーケンシング遺伝子のシーケンシングリードの訂正の性能を示す。この性能は、除去された未補正分子標識カウントおよび除去されたシーケンシングリードのエラーおよびノイズに基づいた。
確率バーコード付き標的のカウンティングデータを要約および視覚化するためのツール
この実施例は、前の実施例に示される確率バーコード付き標的のカウンティングデータを要約および視覚化するためのツールを示す。
高度発現遺伝子-ACTBのプレートにおける各MLのMLカバー率
この実施例は、シーケンシングまたはPCRの最中に生じたMLエラーの識別可能な分布が、一般に、MLからの識別可能な分布を有することを実証する。
PCRまたはシーケンシングエラーによる分子標識の訂正
この実施例は、PCRおよびシーケンシング置換エラーによる分子標識を訂正する方法を明らかにするものであり、これは、均一カバー率の想定なしに、かつ、完全シーケンシングステータスのために高いシーケンシングカバー率を必要とすることなく、全トランスクリプトームアッセイに適用することができる。
高入力サンプルのための分子標識カウンティング
この実施例は、入力分子が増加するとき、使用されるユニーク分子標識を説明する。
再帰的置換エラー訂正(RSEC)
この実施例では、再帰的置換エラー訂正を明らかにする。
カバー率(y)>2*カバー率(x)+1 式(5)
(式中、yは、「親ML」を示し、xは、「子供ML」を示す)。
は、
へ折りたたまれうる。なぜなら、2つのMLは、1ヌクレオチド(下線部)相違し、ML GTCAAATTは、GTCAAAATより低いMLカウントを有するからである。次に、ML
は、GTCAAAATより高いMLカウントを有するML
(ML配列中の相違を下線で示す)へ折りたたまれうる。同様に、ML TTCAGAAAおよびCTCAAAAAは、ML TTCAAAAAへ折りたたまれうる。ML TTCAAACTは、ML TTCAAAATへ折りたたまれ、これが、今度は、ML TTCAAAAAに折りたたまれうる。ML TTCAAACAは、他のすべてのMLと2ヌクレオチド以上相違するため、他の8つのMLのいずれにも折りたたまれない。RSEC訂正前に、未補正MLカウントは9であった。RSEC訂正後、MLカウントは2つ:ML TTCAAAAAおよびTTCAAAAAであった。
MLカバー率計算
この実施例は、MLカバー率計算を説明する。
分布ベースのエラー訂正(DBEC)
この実施例は、分布ベースのエラー訂正を説明する。
所与の遺伝子について、検出されたMLが増加するにつれて、再使用されるML(すなわち、同じ遺伝子由来する2つ以上のmRNAを標識するために同じMLが使用される)のパーセンテージは、増加することから、推定することができる。ポアソン分布(γnon-unique)を用いて、ウェルiの再使用MLの数(nnon-unique,i)をML再使用率方程式(方程式(6))から推定する。推定再使用MLが、ウェルiにおける所与の遺伝子の総MLの5%より大きければ、ウェルiにおけるこの遺伝子は、「高入力」と表示される。これらの「高入力」データの場合、より優れた二項分布を取得するために、最大MLカバー率MLは、分布当てはめから除外される(しかし、後のカウント工程のために保存される)。
P(X>1│λnon-unique),λnon-unique=Number of
ML/6561 式(6)
MLの固有の数が10未満である場合、往々にして、データの希薄さのために分布を当てはめるのが難しくなる。この問題を改善するために、DBECは、分布当てはめを補助するために用いられる1%シグナルカウントの擬似点を追加するが、それでもなおデータに影響を与えない。
2つのネガティブ二項分布を当てはめて、シグナルMLからエラーを区別するために、パラメータ推定のための2組の出発数値を概算する。エラー分布は、平均および1の散布を有するネガティブ二項分布であると想定される。
シグナルおよびエラー分布をそれぞれNegativeBinomial(μsignal,sizesignal)およびNegativeBinomial(μerror,sizeerror)として想定する。シグナルMLの数を小さい順に決定するために、所与のMLからのリードの数が、シグナルおよびエラー分布に由来する確率を、方程式(8)が満たされるまで計算し、ここで、先行するMLはすべて、エラーMLとみなされる。
P(X=r│μ=μerror,size=sizeerror)<P(X=r│μ=μsignal,size=sizesignal) 式(8)
二次導関数に基づくSLエラーの調節
この実施例は、二次導関数に基づくSLエラーの調節を示す。
DBECに基づくPCRおよびシーケンシングエラーの訂正
この実施例は、2つのネガティブ二項分布に基づくPCRおよびシーケンシングエラーの訂正を示す。
ML再使用
この実施例は、高度発現遺伝子のためのML再使用、ならびに分布当てはめ前に高度発現遺伝子の入力データを調節する必要性を明らかにする。
2つのネガティブ二項分布を用いたMLカウントの訂正
この実施例は、2つのネガティブ二項分布を用いて訂正された10の標的のMLカウントを示す。
混合されたJurkatおよび乳癌(BrCa)単一細胞の96ウェルからのBD Precise(商標)Targeted Assayのt-確率的近傍埋込み視覚化
この実施例は、混合されたJurkatおよび乳癌(BrCa)単一細胞についての再帰的置換エラー訂正および分布ベースのエラー訂正に基づいてPCRおよびシーケンシングエラーを訂正する方法を示す。
細胞クラスター間の差異発現分析
この実施例は、低シグナル細胞および乳癌(BrCa)細胞についての再帰的置換エラー訂正および分布ベースのエラー訂正に基づいてPCRおよびシーケンシングエラーを訂正する方法を示す。
混合JurkatおよびT47D細胞の分子標識の調節
この実施例は、混合JurkatおよびT47D細胞の分子標識を調節する方法を示す。
なお、本発明としては、以下の態様も好ましい。
〔1〕 標的の数を決定する方法であって、
(a)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程であって、前記複数の確率バーコードの各々が分子標識を含む工程と;
(b)前記確率バーコード付き標的のシーケンシングデータを取得する工程と;
(c)前記複数の標的の1つ以上について:
(i)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;
(ii)方向近接性を用いて、前記標的の分子標識のクラスターを同定する工程と;
(iii)(ii)で同定された前記標的の分子標識の前記クラスターを用いて、(b)で得られた前記シーケンシングデータを折りたたむ工程と;
(iv)前記標的の数を推定する工程であって、推定された前記標的の数が、(ii)の前記シーケンシングデータの折りたたみ後に、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数と相関する工程と、
を含む、方法。
〔2〕 前記複数の標的が、細胞の全トランスクリプトームの標的を含む、〔1〕に記載の方法。
〔3〕 クラスター内の前記標的の分子標識が、互いの所定の方向近接性閾値内にある、〔1〕~〔2〕のいずれか一項に記載の方法。
〔4〕 前記方向近接性閾値が、1のハミング距離である、〔3〕に記載の方法。
〔5〕 前記クラスター内の前記標的の前記分子標識が、1つ以上の親分子標識と、前記1つ以上の親分子標識の子供分子標識とを含み、前記親分子標識の発生数が、所定の方向近接性発生数閾値以上である、〔1〕~〔4〕のいずれか一項に記載の方法。
〔6〕 前記所定の方向近接性発生数閾値が、2×(子供分子標識の発生数)-1である、〔5〕に記載の方法。
〔7〕 (ii)で同定された前記標的の分子標識の前記クラスターを用いて、(b)で得られた前記シーケンシングデータを折りたたむ工程が、
前記子供分子標識の発生数を前記親分子標識に帰属させる工程
を含む、〔1〕~〔6〕のいずれか一項に記載の方法。
〔8〕 前記標的のシーケンシング深度を決定する工程をさらに含む、〔1〕~〔7〕のいずれか一項に記載の方法。
〔9〕 前記標的の前記シーケンシング深度が所定のシーケンシング深度閾値を超える場合、前記標的の数を推定する工程が、(i)でカウントされた前記シーケンシングデータを調節する工程を含む、〔8〕に記載の方法。
〔10〕 前記所定のシーケンシング深度閾値が、15~20である、〔9〕に記載の方法。
〔11〕 (i)でカウントされた前記シーケンシングデータを調節する工程が、
前記標的の分子標識を閾値化して、(b)で得られた前記シーケンシングデータ中の前記標的に関連付けられた真の分子標識および偽の分子標識を決定する工程
を含む、〔9〕~〔10〕のいずれか一項に記載の方法。
〔12〕 前記標的の前記分子標識を閾値化する工程が、前記標的の前記分子標識について統計解析を実施する工程を含む、〔11〕に記載の方法。
〔13〕 前記統計解析を実施する工程が、
前記標的の前記分子標識の分布およびそれらの発生数を2つのネガティブ二項分布に当てはめる工程と;
前記2つのネガティブ二項分布を用いて真の分子標識の数nを決定する工程と;
(b)で得られた前記シーケンシングデータから前記偽の分子標識を除去する工程と、
を含み、
前記偽の分子標識が、n番目に豊富な分子標識の発生数よりも低い発生数を有する分子標識を含み、前記真の分子標識が、n番目に豊富な分子標識の発生数以上の発生数を有する分子標識を含む、〔12〕に記載の方法。
〔14〕 前記ネガティブ二項分布が、前記真の分子標識に対応する第1のネガティブ二項分布と、前記偽の分子標識に対応する第2のネガティブ二項分布を含む、〔13〕に記載の方法。
〔15〕 標的の数を決定する方法であって、
(a)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程であって、前記複数の確率バーコードの各々が分子標識を含む工程と;
(b)前記確率バーコード付き標的のシーケンシングデータを取得する工程と;
(c)前記複数の標的の1つ以上について:
(i)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;
(ii)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有するノイズ分子標識の数を決定する工程と;
(iii)前記標的の数を推定する工程と、
を含み、
推定された前記標的の数が、(ii)で決定された前記ノイズ分子標識の数に応じて調節された、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた前記識別可能な配列を有する分子標識の数と相関する、方法。
〔16〕 前記シーケンシングデータ中の前記標的のシーケンシングステータスを決定する工程をさらに含む、〔15〕に記載の方法。
〔17〕 前記シーケンシングデータ中の前記標的の前記シーケンシングステータスが、飽和シーケンシング、過少シーケンシング、または過剰シーケンシングである、〔16〕に記載の方法。
〔18〕 前記飽和シーケンシングステータスが、所定の飽和閾値よりも大きい、識別可能な配列を含む分子標識の数を有する前記標的によって決定される、〔17〕に記載の方法。
〔19〕 前記確率バーコードが、識別可能な配列を有する約6561の分子標識を含む場合、前記所定の飽和閾値が、約6557である、〔18〕に記載の方法。
〔20〕 前記確率バーコードが、識別可能な配列を有する約65536の分子標識を含む場合、前記所定の飽和閾値が、約65532である、〔18〕~〔19〕のいずれか一項に記載の方法。
〔21〕 前記シーケンシングデータ中の前記標的の前記シーケンシグステータスが、前記飽和シーケンシングステータスである場合、(ii)で決定された前記ノイズ分子標識の数が、ゼロである、〔17〕~〔20〕のいずれか一項に記載の方法。
〔22〕 前記過少シーケンシングステータスが、所定の過少シーケンシング閾値より小さい深度を有する前記標的によって決定され、前記対象の前記深度が、前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の、平均、最小、または最大深度を含む、〔17〕~〔21〕のいずれか一項に記載の方法。
〔23〕 前記過少シーケンシング閾値が約4である、〔22〕に記載の方法。
〔24〕 前記過少シーケンシング閾値は、識別可能な配列を有する前記分子標識の数とは無関係である、〔23〕に記載の方法。
〔25〕 前記シーケンシングデータ中の前記標的の前記シーケンシグステータスが、前記過少シーケンシングステータスである場合、(ii)で決定された前記ノイズ分子標識の数が、ゼロである、〔17〕~〔24〕のいずれか一項に記載の方法。
〔26〕 前記過剰シーケンシングステータスが、所定の過剰シーケンシング閾値より大きい深度を有する前記標的によって決定され、前記対象の前記深度が、前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の、平均、最小、または最大深度を含む、〔17〕~〔25〕のいずれか一項に記載の方法。
〔27〕 前記確率バーコードが、識別可能な配列を有する約6561の分子標識を含む場合、前記過剰シーケンシング閾値が、約250である、〔26〕に記載の方法。
〔28〕 前記シーケンシングデータ中の前記標的の前記シーケンシングテータスが、前記過剰シーケンシングステータスである場合、
前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数を、前記所定の過剰シーケンシング閾値にサブサンプリングする工程
をさらに含む、〔26〕~〔27〕のいずれか一項に記載の方法。
〔29〕 前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する工程が、
ネガティブ二項分布当てはめ条件が満たされる場合、
(iv)シグナルネガティブ二項分布を、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数に当てはめる工程であって、前記シグナルネガティブ二項分布が、シグナル分子標識である、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数に対応するステップと;
(v)ノイズネガティブ二項分布を、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数に当てはめる工程であって、前記ノイズネガティブ二項分布が、ノイズ分子標識である、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数に対応する工程と;
(vi)(v)で当てはめた前記シグナルネガティブ二項分布および(vi)で当てはめた前記ノイズネガティブ二項分布を用いて、前記ノイズ分子標識の数を決定する工程と、を含む、
〔17〕~〔28〕のいずれか一項に記載の方法。
〔30〕 前記ネガティブ二項分布当てはめ条件が、前記シーケンシングデータ中の前記標的の前記シーケンシングステータスが、前記過少シーケンシングステータスまたは前記過剰シーケンシングステータスではないことを含む、〔29〕に記載の方法。
〔31〕 (v)で当てはめた前記シグナルネガティブ二項分布および(vi)で当てはめた前記ノイズネガティブ二項分布を用いて、前記ノイズ分子標識の数を決定する工程が、
前記シーケンシングデータ中の前記標的に関連付けられた前記識別可能な配列の各々について、
前記識別可能な配列のシグナル確率が、前記シグナルネガティブ二項分布であることを決定する工程と;
前記識別可能な配列のノイズ確率が、前記ノイズネガティブ二項分布であることを決定する工程と;
前記シグナル確率が前記ノイズ確率より小さければ、前記識別可能な配列がノイズ分子標識であることを決定する工程と、
を含む、〔29〕~〔30〕のいずれか一項に記載の方法。
〔32〕 前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する工程が、
前記シーケンシングデータ中の前記標的の前記シーケンシングステータスが、前記過少シーケンシングステータスまたは前記過剰シーケンシングステータスではなく、かつ、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数が、擬似点閾値より少ない場合、(ii)で前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する前に、前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数に擬似点を加える工程を含む、
〔17〕~〔31〕のいずれか一項に記載の方法。
〔33〕 前記擬似点閾値が10である、〔32〕に記載の方法。
〔34〕 前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する工程が、
前記シーケンシングデータ中の前記標的の前記シーケンシングステータスが、前記過少シーケンシングステータスまたは前記過剰シーケンシングステータスではなく、かつ、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数が、擬似点閾値以上である場合、(ii)で前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する際に、非ユニーク分子標識を除去する工程を含む、
〔17〕~〔33〕のいずれか一項に記載の方法。
〔35〕 前記非ユニーク分子標識を除去する工程が、前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数が、所定の再使用分子標識閾値より大きい場合、(ii)で前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する際に、前記非ユニーク分子標識を除去する工程を含む、〔34〕に記載の方法。
〔36〕 前記確率バーコードが、識別可能な配列を有する約6561の分子標識を含む場合、前記再使用分子標識閾値が、約650である、〔35〕に記載の方法。
〔37〕 前記非ユニーク分子標識を除去する工程が、
前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数について非ユニーク分子標識の理論上の数を決定する工程と;
前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有するn番目に豊富な前記分子標識よりも大きい発生数を有する分子標識を除去する工程と、
を含み、
nが、非ユニーク分子標識の理論数である、〔34〕~〔36〕のいずれか一項に記載の方法。
〔38〕 ハードウェアプロセッサーと、
前記ハードウェアプロセッサーによって実行される場合、前記プロセッサーに〔1〕~〔37〕のいずれか一項に記載の方法を実行させる命令を記憶した非一過性メモリーと、
を含む、ターゲットの数を決定するためのコンピュータシステム。
〔39〕 〔1〕~〔37〕のいずれか一項に記載の方法を実行するためのコードを含むソフトウェアプログラムを含む、コンピュータ読取り媒体。
〔40〕 標的の数を決定する方法であって、
(a)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程であって、前記複数の確率バーコードの各々が分子標識を含む工程と;
(b)前記確率バーコード付き標的のシーケンシングデータを取得する工程と;
(c)前記複数の標的の1つ以上について:
(i)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;
(ii)(b)で得られた前記シーケンシングデータ中の前記標的のクオリティステータスを決定する工程と;
(iii)(b)で得られた前記シーケンシングデータ中の1つ以上のシーケンシングデータエラーを決定する工程であって、前記シーケンシングデータ中の前記1つ以上のシーケンシングデータエラーを決定する工程が、以下:前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数、前記シーケンシングデータ中の前記標的の前記クオリティステータス、および前記複数の確率バーコード中の識別可能な配列を有する前記分子標識の数のうち1つ以上を決定することを含む工程と;
(iv)前記標的の数を推定する工程であって、推定された前記標的の数が、(iii)で決定された前記1つ以上のシーケンシングデータエラーに応じて調節された、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数と相関する工程と、
を含む、方法。
〔41〕 前記1つ以上のシーケンシングデータエラーを決定する前に、(b)で得られた前記シーケンシングデータを折りたたむ工程
をさらに含む、〔40〕に記載の方法。
〔42〕 (b)で得られた前記シーケンシングデータを折りたたむ工程が、
類似した分子標識を有し、かつ、所定の折りたたみ発生数閾値よりも少ない発生数を有する標的のコピーを、前記複数の標的について同じ分子標識を有するものとして帰属させる工程を含み、前記標的の2つのコピーは、前記標的の前記2つのコピーの分子標識の配列が少なくとも1塩基相違する場合、類似の分子標識を有する、
〔41〕に記載の方法。
〔43〕 前記確率バーコードが、識別可能な配列を有する約6561の分子標識を含む場合、前記所定の折りたたみ発生数閾値が7である、〔42〕に記載の方法。
〔44〕 前記確率バーコードが、識別可能な配列を有する約65536の分子標識を含む場合、前記所定の折りたたみ発生数閾値が17である、〔42〕に記載の方法。
〔45〕 前記標的の2つのコピーが、前記標的の前記2つのコピーの分子標識の配列が少なくとも1塩基相違する場合、類似の分子標識を有する、〔42〕~〔44〕のいずれか一項に記載の方法。
〔46〕 前記分子標識が、5~20個のヌクレオチドを含む、〔40〕~〔45〕のいずれか一項に記載の方法。
〔47〕 異なる確率バーコードの前記分子標識が、互いに異なっている、〔40〕~〔46〕のいずれか一項に記載の方法。
〔48〕 前記複数の確率バーコードが、識別可能な配列を有する約6561の分子標識を含む、〔40〕~〔47〕のいずれか一項に記載の方法。
〔49〕 前記複数の確率バーコードが、識別可能な配列を有する約65536の分子標識を含む、〔40〕~〔47〕のいずれか一項に記載の方法。
〔50〕 前記シーケンシングデータが、50ヌクレオチド以上のリード長を有する前記複数の標的の配列を含む、〔40〕~〔49〕のいずれか一項に記載の方法。
〔51〕 前記シーケンシングデータが、75ヌクレオチド以上のリード長を有する前記複数の標的の配列を含む、〔40〕~〔49〕のいずれか一項に記載の方法。
〔52〕 前記シーケンシングデータが、100ヌクレオチド以上のリード長を有する前記複数の標的の配列を含む、〔40〕~〔49〕のいずれか一項に記載の方法。
〔53〕 (b)で得られた前記シーケンシングデータが、前記複数の確率バーコード付き標的に対してポリメラーゼ連鎖反応(PCR)増幅を実施することによって生成することができる、〔40〕~〔52〕のいずれか一項に記載の方法。
〔54〕 前記1つ以上のシーケンシングデータエラーが、PCR導入エラー、シーケンシング導入エラー、バーコード混入に起因するエラー、ライブラリー作製エラー、またはそれらの任意の組合せである、〔40〕~〔53〕のいずれか一項に記載の方法。
〔55〕 前記PCR導入エラーが、PCR増幅エラー、PCR増幅バイアス、不十分なPCR増幅、またはそれらの任意の組合せの結果である、〔54〕に記載の方法。
〔56〕 前記シーケンシング導入エラーが、不正確なベースコーリング、不十分なシーケンシング、またはそれらの任意の組合せの結果である、〔54〕~〔55〕のいずれか一項に記載の方法。
〔57〕 工程(i)、(ii)、(iii)、および(iv)が、前記複数の標的の各々について実施される、〔40〕~〔56〕のいずれか一項に記載の方法。
〔58〕 前記シーケンシングデータ中の前記標的の前記クオリティステータスが、完全シーケンシング、不完全シーケンシング、または飽和シーケンシングである、〔40〕~〔57〕のいずれか一項に記載の方法。
〔59〕 前記シーケンシングデータ中の標的のクオリティステータスが、前記複数の確率バーコード中に識別可能な配列を有する前記分子標識の数と、カウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数とによって決定される、〔58〕に記載の方法。
〔60〕 前記完全シーケンシングクオリティステータスが、所定の完全シーケンシング散布閾値以上の前記ポアソン分布と比較した散布指数によって決定され、前記所定の完全シーケンシング散布閾値が、0.9である、〔58〕~〔59〕のいずれか一項に記載の方法。
〔61〕 前記所定の完全シーケンシング散布閾値が、1である、〔60〕に記載の方法。
〔62〕 前記所定の完全シーケンシング散布閾値が、4である、〔60〕に記載の方法。
〔63〕 前記完全シーケンシングクオリティステータスが、(b)で得られた前記シーケンシングデータ中の所定の完全シーケンシング発生数閾値以上の発生数を有する分子標識によってさらに決定され、前記所定の完全シーケンシング発生数閾値が、10である、〔60〕~〔62〕のいずれか一項に記載の方法。
〔64〕 前記所定の完全シーケンシング発生数閾値が、18である、〔63〕に記載の方法。
〔65〕 前記飽和シーケンシングクオリティステータスが、所定の飽和閾値よりも大きい、識別可能な配列を含む分子標識の数を有する前記標的によって決定される、〔58〕~〔64〕のいずれか一項に記載の方法。
〔66〕 前記飽和シーケンシングクオリティステータスが、前記所定の飽和閾値よりも大きい、識別可能な配列を含む分子標識の数を有する前記複数の標的のうちの1つの他の標的によって、さらに決定される、〔65〕に記載の方法。
〔67〕 前記確率バーコードが、識別可能な配列を有する約6561の分子標識を含む場合、前記所定の飽和閾値が、6557である、〔65〕に記載の方法。
〔68〕 前記確率バーコードが、識別可能な配列を有する約65536の分子標識を含む場合、前記所定の飽和閾値が、65532である、〔65〕に記載の方法。
〔69〕 前記シーケンシングデータ中の前記標的の前記クオリティステータスは、(b)で得られた前記シーケンシングデータ中の前記標的の前記クオリティステータスが、完全シーケンシングではなく、かつ、飽和シーケンシングではない場合に、不完全シーケンシングとして分類される、〔40〕~〔68〕のいずれか一項に記載の方法。
〔70〕 (i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数が、(iv)において、
前記標的が前記完全シーケンシングクオリティステータスを有している場合、
1つ以上の親分子標識についてすべての子供分子標識を決定する工程と;
少なくとも1つの子供分子標識および前記親分子標識について第1の統計解析を実施する工程と;
前記第1の統計解析の帰無仮説が容認される場合、前記子供分子標識の前記発生数を前記親分子標識に帰属させる工程と、
によって調節される、〔50〕~〔69〕のいずれか一項に記載の方法。
〔71〕 前記1つ以上の親分子標識が、所定の完全シーケンシング親閾値以上の発生数を有する分子標識を含み、前記所定の完全シーケンシング親閾値が、前記所定の完全シーケンシング発生数閾値と等しい、〔70〕に記載の方法。
〔72〕 前記子供分子標識が、前記親分子標識と1塩基相違し、かつ、所定の完全シーケンシング子供閾値以下の発生数を有する分子標識を含み、前記所定の完全シーケンシング子供閾値が、3である、〔70〕~〔71〕のいずれか一項に記載の方法。
〔73〕 前記所定の完全シーケンシング子供閾値が、5である、〔72〕に記載の方法。
〔74〕 前記帰無仮説が真である確率が偽発見率を下回る場合、前記第1の統計解析の前記帰無仮説が容認され、前記偽発見率が、5%である、〔70〕~〔73〕のいずれか一項に記載の方法。
〔75〕 前記偽発見率が10%である、〔74〕に記載の方法。
〔76〕 前記第1の統計解析が、多重二項検定である、〔70〕~〔75〕のいずれか一項に記載の方法。
〔77〕 (i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数は、(iv)において、
前記標的が前記完全シーケンシングクオリティステータスを有する場合、
前記標的の分子標識を閾値化して、(b)で得られた前記シーケンシングデータ中の前記標的に関連付けられた真の分子標識および偽の分子標識を決定する工程
によって調節される、〔50〕~〔76〕のいずれか一項に記載の方法。
〔78〕 前記標的の前記分子標識を閾値化する工程が、前記標的の前記分子標識について第2の統計解析を実施する工程を含む、〔77〕に記載の方法。
〔79〕 前記第2の統計解析を実施する工程が、
前記標的の前記分子標識の分布およびそれらの発生数を2つのポアソン分布に当てはめる工程と;
前記2つのポアソン分布を用いて真の分子標識の数nを決定する工程と;
(b)で得られた前記シーケンシングデータから前記偽の分子標識を除去する工程と、
を含み、
前記偽の分子標識が、n番目に豊富な分子標識の前記発生数よりも低い発生数を有する分子標識を含み、前記真の分子標識が、n番目に豊富な分子標識の前記発生数以上の発生数を有する分子標識を含む、〔78〕に記載の方法。
〔80〕 前記2つのポアソン分布が、前記真の分子標識に対応する第1のポアソン分布と、前記偽の分子標識に対応する第2のポアソン分布を含む、〔79〕に記載の方法。
〔81〕 (i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数が、(iv)において、
(b)で得られた前記シーケンシングデータ中の前記標的の前記クオリティステータスが、前記不完全シーケンシングクオリティステータスである場合、
前記標的が、(b)で得られたシーケンシングデータにおいてノイジーであるか否かを決定する工程と;
(b)で得られた前記シーケンシングデータから前記ノイジー標的を除去する工程と、
によって調節される、〔58〕~〔80〕のいずれか一項に記載の方法。
〔82〕 前記ノイジー標的の前記分子標識の前記発生数が、不完全シーケンシングクノイジー標的閾値以下であれば、前記標的はノイジーであり、前記不完全シーケンシングノイジー遺伝子閾値が、5である、〔81〕に記載の方法。
〔83〕 前記不完全シーケンシングノイジー標的閾値が、完全シーケンシングのクオリティステータスを有する前記複数の標的の前記分子標識の前記中央発生数と等しい、〔82〕に記載の方法。
〔84〕 前記不完全シーケンシングノイジー標的閾値が、完全シーケンシングのクオリティステータスを有する前記複数の標的の前記分子標識の前記平均発生数と等しい、〔82〕に記載の方法。
〔85〕 (i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する前記分子標識の数が、(iv)において、
(b)で得られた前記シーケンシングデータ中の前記標的の前記クオリティステータスが前記不完全シーケンシングクオリティステータスである場合、
前記標的の前記分子標識を閾値化して、(b)で得られた前記シーケンシングデータ中の真の分子標識および偽の分子標識を決定する工程
によって調節される、〔50〕~〔84〕のいずれか一項に記載の方法。
〔86〕 前記標的の前記分子標識を閾値化する工程が、前記分子標識について第3の統計解析を実施する工程を含む、〔85〕に記載の方法。
〔87〕 前記分子標識について前記第3の統計解析を実施する工程が、
ゼロ切断ポアソンモデルを用いて、真の分子標識の数nを決定する工程と;
(b)で得られた前記シーケンシングデータから前記偽の分子標識を除去する工程と、
を含み、
前記偽の分子標識が、n番目に豊富な分子標識の発生数よりも低い発生数を有する分子標識を含み、前記真の分子標識が、n番目に豊富な分子標識の前記発生数以上の発生数を有する分子標識を含む、〔86〕に記載の方法。
〔88〕 (i)でカウントされた前記シーケンシングデータが、(iii)で決定された前記1つ以上のシーケンシングデータエラーに応じて調節された後、(b)で得られた前記シーケンシングデータ中の前記分子標識の少なくとも50%が保持される、〔40〕~〔87〕のいずれか一項に記載の方法。
〔89〕 (i)でカウントされた前記シーケンシングデータが、(iii)で決定された前記1つ以上のシーケンシングデータエラーに応じて調節された後、(b)b)で得られた前記シーケンシングデータ中の前記分子標識の少なくとも80%が保持される、〔40〕~〔87〕のいずれか一項に記載の方法。
〔90〕 前記複数の標的に確率バーコードを付ける工程が、前記複数の確率バーコードを前記複数の標的とハイブリダイズさせて、前記確率バーコード付き標的を生成する工程を含む、〔40〕~〔87〕のいずれか一項に記載の方法。
〔91〕 前記複数の標的に確率バーコードを付ける工程が、前記確率バーコード付き標的のインデックス付きライブラリーを作製する工程を含む、〔89〕に記載の方法。
〔92〕 前記確率バーコード付き標的のインデックス付きライブラリーを作製する工程が、前記複数の確率バーコードを含む固体担体を用いて実施される、〔89〕~〔91〕のいずれか一項に記載の方法。
〔93〕 前記固体担体が、前記複数の確率バーコードと結合した複数の合成粒子を含む、〔92〕に記載の方法。
〔94〕 前記複数の確率バーコードの各々が、サンプル標識、ユニバーサル標識および細胞標識の1つ以上を含み、前記サンプル標識が、前記固体担体上の前記複数の確率バーコードに対するものと同じであり、ユニバーサル標識が、前記固体担体上の前記複数の確率バーコードに対するものと同じであり、細胞標識が、前記固体担体上の前記複数の確率バーコードに対するものと同じである、〔92〕~〔93〕のいずれか一項に記載の方法。
〔95〕 前記サンプル標識が、5~20ヌクレオチドを含む、〔94〕に記載の方法。
〔96〕 前記ユニバーサル標識が、5~20ヌクレオチドを含む、〔94〕~〔95〕のいずれか一項に記載の方法。
〔97〕 前記細胞標識が、5~20ヌクレオチドを含む、〔94〕~〔96〕のいずれか一項に記載の方法。
〔98〕 前記固体担体が、2次元または3次元の前記複数の確率バーコードを含む、〔92〕~〔95〕のいずれか一項に記載の方法。
〔99〕 前記合成粒子がビーズである、〔93〕~〔98〕のいずれか一項に記載の方法。
〔100〕 前記ビーズが、シリカゲルビーズ、調節多孔性ガラスビーズ、磁気ビーズ、ダイナビーズ、セファデックス/セファロースビーズ、セルロースビーズ、ポリスチレンビーズ、またはそれらの任意の組合せである、〔99〕に記載の方法。
〔101〕 前記固体担体が、ポリマー、マトリックス、ヒドロゲル、ニードルアレイデバイス、抗体、またはそれらの任意の組合せを含む、〔40〕~〔100〕に記載の方法。
〔102〕 前記複数の標的がサンプル中に含まれる、〔40〕~〔101〕のいずれか一項に記載の方法。
〔103〕 前記サンプルが、1つ以上の細胞を含む、〔102〕に記載の方法。
〔104〕 前記サンプルが単一細胞である、〔102〕に記載の方法。
〔105〕 前記1つ以上の細胞を溶解する工程をさらに含む、〔102〕に記載の方法。
〔106〕 前記1つ以上の細胞を溶解する工程が、前記サンプルを加熱する工程、前記サンプルを洗剤と接触させる工程、前記サンプルのpHを変える工程、またはそれらの任意の組合せを含む、〔105〕に記載の方法。
〔107〕 前記1つ以上の細胞が、1つ以上の細胞型を含む、〔102〕に記載の方法。
〔108〕 前記1つ以上の細胞型の少なくとも1つが、脳細胞、心細胞、癌細胞、循環腫瘍細胞、臓器細胞、上皮細胞、転移細胞、良性細胞、一次細胞、循環細胞、またはそれらの任意の組合せである、〔107〕に記載の方法。
〔109〕 前記複数の標的が、リボ核酸(RNA)、メッセンジャーRNA(mRNA)、microRNA、低分子干渉RNA(siRNA)、RNA分解産物、ポリ(A)テールを各々含むRNA、またはそれらの任意の組合せを含む、〔40〕~〔108〕のいずれか一項に記載の方法。
〔110〕 前記方法が多重化される、〔40〕~〔109〕のいずれか一項に記載の方法。
〔111〕 標的の数を決定する方法であって、
(a)複数の確率バーコードを用いて、複数の標的に確率バーコードを付けて、複数の確率バーコード付き標的を生成する工程であって、前記複数の確率バーコードの各々が分子標識を含む工程と;
(b)前記確率バーコード付き標的のシーケンシングデータを取得する工程と;
(c)前記複数の標的の1つ以上について:
(i)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;
(ii)方向近接性を用いて、前記標的の分子標識のクラスターを同定する工程と;
(iii)(ii)で同定された前記標的の分子標識の前記クラスターを用いて、(b)で得られた前記シーケンシングデータを折りたたむ工程と;
(iv)前記標的の数を推定する工程であって、推定された前記標的の数が、(ii)の前記シーケンシングデータの折りたたみ後に、(i)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数と相関する工程と、
を含む、方法。
〔112〕 前記複数の標的が、細胞の全トランスクリプトームの標的を含む、〔111〕に記載の方法。
〔113〕 クラスター内の前記標的の分子標識が、互いの所定の方向近接性閾値内にある、〔111〕~〔112〕のいずれか一項に記載の方法。
〔114〕 前記方向近接性閾値が、1のハミング距離である、〔113〕に記載の方法。
〔115〕 前記クラスター内の前記標的の前記分子標識が、1つ以上の親分子標識と、前記1つ以上の親分子標識の子供分子標識とを含み、前記親分子標識の発生数が、所定の方向近接性発生数閾値以上である、〔112〕~〔114〕のいずれか一項に記載の方法。
〔116〕 前記所定の方向近接性発生数閾値が、2×(子供分子標識の発生数)-1である、〔115〕に記載の方法。
〔117〕 (ii)で同定された前記標的の分子標識の前記クラスターを用いて、(b)で得られたシーケンシングデータを折りたたむ工程が、
前記子供分子標識の前記発生数を前記親分子標識に帰属させる工程
を含む、〔111〕~〔116〕のいずれか一項に記載の方法。
〔118〕 前記標的のシーケンシング深度を決定する工程をさらに含む、〔111〕~〔117〕のいずれか一項に記載の方法。
〔119〕 前記標的の前記シーケンシング深度が所定のシーケンシング深度閾値を超える場合、前記標的の数を推定する工程が、(i)でカウントされた前記シーケンシングデータを調節する工程を含む、〔118〕に記載の方法。
〔120〕 前記所定のシーケンシング深度閾値が、15~20である、〔119〕に記載の方法。
〔121〕 (i)でカウントされた前記シーケンシングデータを調節する工程が、
前記標的の分子標識を閾値化して、(b)で得られた前記シーケンシングデータ中の前記標的に関連付けられた真の分子標識および偽の分子標識を決定する工程
を含む、〔119〕~〔120〕のいずれか一項に記載の方法。
〔122〕 前記標的の前記分子標識を閾値化する工程が、前記標的の前記分子標識について統計解析を実施する工程を含む、〔121〕に記載の方法。
〔123〕 前記統計解析を実施する工程が、
前記標的の前記分子標識の分布およびそれらの発生数を2つのポアソン分布に当てはめる工程と;
前記2つのポアソン分布を用いて真の分子標識の数nを決定する工程と;
(b)で得られた前記シーケンシングデータから前記偽の分子標識を除去する工程と、
を含み、
前記偽の分子標識が、n番目に豊富な分子標識の前記発生数よりも低い発生数を有する分子標識を含み、前記真の分子標識が、n番目に豊富な分子標識の前記発生数以上の発生数を有する分子標識を含む、〔122〕に記載の方法。
〔124〕 前記2つのポアソン分布が、前記真の分子標識に対応する第1のポアソン分布と、前記偽の分子標識に対応する第2のポアソン分布を含む、〔123〕に記載の方法。
〔125〕 ハードウェアプロセッサーと、
前記ハードウェアプロセッサーによって実行される場合、前記プロセッサーに〔40〕~〔124〕のいずれか一項に記載の方法を実行させる命令を記憶した非一過性メモリーと、を含む、ターゲットの数を決定するためのコンピュータシステム。
〔126〕 〔40〕~〔124〕のいずれか一項に記載の方法を実行するためのコードを含むソフトウェアプログラムを含む、コンピュータ読取り媒体。
Claims (28)
- サンプル中の核酸標的の数を決定する方法であって、
(a)複数の確率バーコードを用いて、複数の核酸標的に確率バーコードを付けて、複数の確率バーコード付き核酸標的を生成する工程、ここで前記複数の確率バーコードの各々は分子標識を含む;
(b)前記確率バーコード付き核酸標的のシーケンシングデータを取得する工程;及び
(c)前記複数の核酸標的の1つ以上について、以下の(i)~(iv)の工程:
(i)前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程;
(ii)方向近接性を用いて、前記核酸標的の分子標識のクラスターを同定する工程、
ここで、前記同定する工程は、識別可能な配列を有する全ての分子標識について再帰的に、子供分子標識が1以上の親分子標識を含むクラスターに属するかどうかを決定することを含み、前記クラスター内の前記核酸標的の前記分子標識は、1つ以上の親分子標識と、前記1つ以上の親分子標識の子供分子標識とを含み、且つ、前記親分子標識の発生数は、所定の方向近接性発生数閾値以上である;
(iii)(ii)で同定された前記核酸標的の分子標識の前記クラスターを用いて、(b)で得られた前記シーケンシングデータを折りたたむ工程;及び
(iv)前記核酸標的の数を推定する工程、ここで推定される前記核酸標的の数は、(iii)の前記シーケンシングデータの折りたたみ後の、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する分子標識の数と相関する、
を含む、方法。 - クラスター内の前記核酸標的の分子標識が、互いの所定の方向近接性閾値内にある、請求項1に記載の方法。
- 前記方向近接性閾値が、1のハミング距離である、請求項2に記載の方法。
- 前記所定の方向近接性発生数閾値が、2×(子供分子標識の発生数)-1である、請求項1に記載の方法。
- (ii)で同定された前記核酸標的の分子標識の前記クラスターを用いて、(b)で得られた前記シーケンシングデータを折りたたむ工程が、
前記子供分子標識の発生数を前記親分子標識に帰属させる工程
を含む、請求項1~4のいずれか一項に記載の方法。 - 前記核酸標的のシーケンシング深度を決定する工程をさらに含む、請求項1~5のいずれか一項に記載の方法。
- 前記核酸標的の前記シーケンシング深度が所定のシーケンシング深度閾値を超える場合、前記核酸標的の数を推定する工程が、(i)でカウントされた前記シーケンシングデータを調節する工程を含む、請求項6に記載の方法。
- (i)でカウントされた前記シーケンシングデータを調節する工程が、
前記核酸標的の分子標識を閾値化して、(b)で得られた前記シーケンシングデータ中の前記核酸標的に関連付けられた真の分子標識および偽の分子標識を決定する工程
を含む、請求項7に記載の方法。 - 前記核酸標的の前記分子標識を閾値化する工程が、前記核酸標的の前記分子標識について統計解析を実施する工程を含む、請求項8に記載の方法。
- 前記統計解析を実施する工程が、
前記核酸標的の前記分子標識の分布およびそれらの発生数を2つのネガティブ二項分布に当てはめる工程;
前記2つのネガティブ二項分布を用いて真の分子標識の数nを決定する工程;及び
(b)で得られた前記シーケンシングデータから前記偽の分子標識を除去する工程、ここで前記偽の分子標識は、n番目に豊富な分子標識の発生数よりも低い発生数を有する分子標識を含み、前記真の分子標識が、n番目に豊富な分子標識の発生数以上の発生数を有する分子標識を含む
を含む、請求項9に記載の方法。 - 前記ネガティブ二項分布が、前記真の分子標識に対応する第1のネガティブ二項分布と、前記偽の分子標識に対応する第2のネガティブ二項分布を含む、請求項10に記載の方法。
- 核酸標的の数を決定する方法であって、
(a)複数の確率バーコードを用いて、複数の核酸標的に確率バーコードを付けて、複数の確率バーコード付き核酸標的を生成する工程、ここで前記複数の確率バーコードの各々は分子標識を含む;
(b)前記確率バーコード付き核酸標的のシーケンシングデータを取得する工程;
(c)前記シーケンシングデータにおける前記核酸標的のシーケンシングステータスを決定する工程;
(d)前記複数の核酸標的の1つ以上について、以下の(i)~(iii):
(i)前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程;
(ii)前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有するノイズ分子標識の数を決定する工程、ここで、当該工程は、
前記シーケンシングステータスに基づきネガティブ二項分布当てはめ条件が満たされる場合、
(1)シグナルネガティブ二項分布を、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数に当てはめること、ここで前記シグナルネガティブ二項分布は、シグナル分子標識である、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する分子標識の数に対応する;
(2)ノイズネガティブ二項分布を、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数に当てはめること、ここで前記ノイズネガティブ二項分布は、ノイズ分子標識である、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する分子標識の数に対応する;及び
(3)前記(1)で当てはめた前記シグナルネガティブ二項分布および(2)で当てはめた前記ノイズネガティブ二項分布を用いて、前記ノイズ分子標識の数を決定すること、
を含む;及び
(iii)前記核酸標的の数を推定する工程、ここで推定される前記核酸標的の数は、(ii)で決定された前記ノイズ分子標識の数に応じて調節された、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた前記識別可能な配列を有する分子標識の数と相関する、
を含む、方法。 - 前記シーケンシングデータ中の前記核酸標的の前記シーケンシングステータスが、飽和シーケンシング、過少シーケンシング、または過剰シーケンシングである、請求項12に記載の方法。
- 前記飽和シーケンシングステータスが、所定の飽和閾値よりも大きい、識別可能な配列を含む分子標識の数を有する前記核酸標的によって決定される、請求項13に記載の方法。
- 前記シーケンシングデータ中の前記核酸標的の前記シーケンシグステータスが、前記飽和シーケンシングステータスである場合、(ii)で決定される前記ノイズ分子標識の数が、ゼロである、請求項13または14に記載の方法。
- 前記過少シーケンシングステータスが、所定の過少シーケンシング閾値より小さい深度を有する前記核酸標的によって決定され、前記核酸標的の前記深度が、前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の、平均、最小、または最大深度を含む、請求項13~15のいずれか一項に記載の方法。
- 前記過少シーケンシング閾値は、識別可能な配列を有する前記分子標識の数とは無関係である、請求項16に記載の方法。
- 前記シーケンシングデータ中の前記核酸標的の前記シーケンシグステータスが、前記過少シーケンシングステータスである場合、(ii)で決定される前記ノイズ分子標識の数が、ゼロである、請求項13~17のいずれか一項に記載の方法。
- 前記過剰シーケンシングステータスが、所定の過剰シーケンシング閾値より大きい深度を有する前記核酸標的によって決定され、前記核酸標的の前記深度が、前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の、平均、最小、または最大深度を含む、請求項13~18のいずれか一項に記載の方法。
- 前記シーケンシングデータ中の前記核酸標的の前記シーケンシングテータスが、前記過剰シーケンシングステータスである場合、
前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数を、前記所定の過剰シーケンシング閾値付近にサブサンプリングする工程
をさらに含む、請求項19に記載の方法。 - 前記ネガティブ二項分布当てはめ条件が、前記シーケンシングデータ中の前記核酸標的の前記シーケンシングステータスが、前記過少シーケンシングステータスまたは前記過剰シーケンシングステータスではないことを含む、請求項12に記載の方法。
- (v)で当てはめた前記シグナルネガティブ二項分布および(vi)で当てはめた前記ノイズネガティブ二項分布を用いて、前記ノイズ分子標識の数を決定する工程が、
前記シーケンシングデータ中の前記核酸標的に関連付けられた前記識別可能な配列の各々について、
前記識別可能な配列のシグナル確率が、前記シグナルネガティブ二項分布内であることを決定する工程と;
前記識別可能な配列のノイズ確率が、前記ノイズネガティブ二項分布内であることを決定する工程と;
前記シグナル確率が前記ノイズ確率より小さければ、前記識別可能な配列がノイズ分子標識であることを決定する工程と、
を含む、請求項12~21のいずれか一項に記載の方法。 - 前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する工程が、
前記シーケンシングデータ中の前記核酸標的の前記シーケンシングステータスが、前記過少シーケンシングステータスまたは前記過剰シーケンシングステータスではなく、かつ、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数が、擬似点閾値より少ない場合、(ii)で前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する前に、前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数に擬似点を加える工程を含む、
請求項13~22のいずれか一項に記載の方法。 - 前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する工程が、
前記シーケンシングデータ中の前記核酸標的の前記シーケンシングステータスが、前記過少シーケンシングステータスまたは前記過剰シーケンシングステータスではなく、かつ、(i)でカウントされた前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数が、擬似点閾値以上である場合、(ii)で前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する際に、非ユニーク分子標識を除去する工程を含む、
請求項13~23のいずれか一項に記載の方法。 - 前記非ユニーク分子標識を除去する工程が、前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数が、所定の再使用分子標識閾値より大きい場合、(ii)で前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記ノイズ分子標識の数を決定する際に、前記非ユニーク分子標識を除去する工程を含む、請求項24に記載の方法。
- 前記非ユニーク分子標識を除去する工程が、
前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する前記分子標識の数について非ユニーク分子標識の理論上の数を決定する工程;及び
前記シーケンシングデータ中の前記核酸標的に関連付けられた識別可能な配列を有する分子標識のうちn番目に豊富な前記分子標識よりも大きい発生数を有する分子標識を除去する工程、ここでnは、非ユニーク分子標識の理論数である
を含む、請求項24又は25に記載の方法。 - ハードウェアプロセッサーと、
前記ハードウェアプロセッサーによって実行される場合、前記プロセッサーに請求項1~26のいずれか一項に記載の方法を実行させる命令を記憶した非一過性メモリーと、
を含む、核酸標的の数を決定するためのコンピュータシステム。 - 請求項1~26のいずれか一項に記載の方法を実行するためのコードを含むソフトウェアプログラムを含む、コンピュータ読取り媒体。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662342137P | 2016-05-26 | 2016-05-26 | |
US62/342,137 | 2016-05-26 | ||
US201662381945P | 2016-08-31 | 2016-08-31 | |
US62/381,945 | 2016-08-31 | ||
US201662401720P | 2016-09-29 | 2016-09-29 | |
US62/401,720 | 2016-09-29 | ||
PCT/US2017/034576 WO2017205691A1 (en) | 2016-05-26 | 2017-05-25 | Molecular label counting adjustment methods |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019522268A JP2019522268A (ja) | 2019-08-08 |
JP2019522268A5 JP2019522268A5 (ja) | 2020-07-02 |
JP7046007B2 true JP7046007B2 (ja) | 2022-04-01 |
Family
ID=59014820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018561218A Active JP7046007B2 (ja) | 2016-05-26 | 2017-05-25 | 分子標識カウントの調節方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11397882B2 (ja) |
EP (2) | EP4407625A2 (ja) |
JP (1) | JP7046007B2 (ja) |
CN (1) | CN109074430B (ja) |
WO (1) | WO2017205691A1 (ja) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
GB2513024B (en) | 2012-02-27 | 2016-08-31 | Cellular Res Inc | A clonal amplification method |
GB2525104B (en) | 2013-08-28 | 2016-09-28 | Cellular Res Inc | Massively Parallel Single Cell Nucleic Acid Analysis |
EP3259371B1 (en) | 2015-02-19 | 2020-09-02 | Becton, Dickinson and Company | High-throughput single-cell analysis combining proteomic and genomic information |
WO2016138496A1 (en) | 2015-02-27 | 2016-09-01 | Cellular Research, Inc. | Spatially addressable molecular barcoding |
US11535882B2 (en) | 2015-03-30 | 2022-12-27 | Becton, Dickinson And Company | Methods and compositions for combinatorial barcoding |
WO2016172373A1 (en) | 2015-04-23 | 2016-10-27 | Cellular Research, Inc. | Methods and compositions for whole transcriptome amplification |
US11124823B2 (en) | 2015-06-01 | 2021-09-21 | Becton, Dickinson And Company | Methods for RNA quantification |
EP3347465B1 (en) | 2015-09-11 | 2019-06-26 | Cellular Research, Inc. | Methods and compositions for nucleic acid library normalization |
EP3452614B1 (en) | 2016-05-02 | 2023-06-28 | Becton, Dickinson and Company | Accurate molecular barcoding |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
WO2017205691A1 (en) | 2016-05-26 | 2017-11-30 | Cellular Research, Inc. | Molecular label counting adjustment methods |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
CA3034924A1 (en) | 2016-09-26 | 2018-03-29 | Cellular Research, Inc. | Measurement of protein expression using reagents with barcoded oligonucleotide sequences |
KR20190077061A (ko) | 2016-11-08 | 2019-07-02 | 셀룰러 리서치, 인크. | 세포 표지 분류 방법 |
CN109952612B (zh) | 2016-11-08 | 2023-12-01 | 贝克顿迪金森公司 | 用于表达谱分类的方法 |
WO2018132610A1 (en) | 2017-01-13 | 2018-07-19 | Cellular Research, Inc. | Hydrophilic coating of fluidic channels |
US11319583B2 (en) | 2017-02-01 | 2022-05-03 | Becton, Dickinson And Company | Selective amplification using blocking oligonucleotides |
AU2018281745B2 (en) | 2017-06-05 | 2022-05-19 | Becton, Dickinson And Company | Sample indexing for single cells |
EP3460071A1 (en) | 2017-09-22 | 2019-03-27 | Lexogen GmbH | Estimating pre-pcr fragment numbers from post-pcr frequencies of unique molecular identifiers |
ES2969957T3 (es) * | 2017-09-25 | 2024-05-23 | Becton Dickinson Co | Corrección de errores del código de barras del receptor inmunitario |
WO2019126209A1 (en) * | 2017-12-19 | 2019-06-27 | Cellular Research, Inc. | Particles associated with oligonucleotides |
CN112041459B (zh) | 2018-01-29 | 2024-09-10 | 圣祖德儿童研究医院 | 核酸扩增方法 |
WO2019213237A1 (en) | 2018-05-03 | 2019-11-07 | Becton, Dickinson And Company | Molecular barcoding on opposite transcript ends |
US11773441B2 (en) | 2018-05-03 | 2023-10-03 | Becton, Dickinson And Company | High throughput multiomics sample analysis |
WO2020072380A1 (en) | 2018-10-01 | 2020-04-09 | Cellular Research, Inc. | Determining 5' transcript sequences |
US11932849B2 (en) | 2018-11-08 | 2024-03-19 | Becton, Dickinson And Company | Whole transcriptome analysis of single cells using random priming |
CN113195717A (zh) | 2018-12-13 | 2021-07-30 | 贝克顿迪金森公司 | 单细胞全转录组分析中的选择性延伸 |
US11371076B2 (en) | 2019-01-16 | 2022-06-28 | Becton, Dickinson And Company | Polymerase chain reaction normalization through primer titration |
ES2945227T3 (es) | 2019-01-23 | 2023-06-29 | Becton Dickinson Co | Oligonucleótidos asociados con anticuerpos |
US20200255888A1 (en) * | 2019-02-12 | 2020-08-13 | Becton, Dickinson And Company | Determining expressions of transcript variants and polyadenylation sites |
US12071617B2 (en) | 2019-02-14 | 2024-08-27 | Becton, Dickinson And Company | Hybrid targeted and whole transcriptome amplification |
CN110222745B (zh) * | 2019-05-24 | 2021-04-30 | 中南大学 | 一种基于相似性学习及其增强的细胞类型鉴定方法 |
CN114051534A (zh) | 2019-07-22 | 2022-02-15 | 贝克顿迪金森公司 | 单细胞染色质免疫沉淀测序测定 |
JP7522189B2 (ja) | 2019-11-08 | 2024-07-24 | ベクトン・ディキンソン・アンド・カンパニー | 免疫レパートリーシーケンシングのための完全長v(d)j情報を得るためのランダムプライミングの使用 |
EP4090763A1 (en) | 2020-01-13 | 2022-11-23 | Becton Dickinson and Company | Methods and compositions for quantitation of proteins and rna |
WO2021142625A1 (zh) * | 2020-01-14 | 2021-07-22 | 北京大学 | 基于单细胞转录组测序数据预测细胞空间关系的方法 |
CN111521591B (zh) * | 2020-05-09 | 2021-04-16 | 艾普拜生物科技(苏州)有限公司 | 用于微滴式数字pcr仪的计数校准装置、制备及使用方法 |
EP4150118A1 (en) | 2020-05-14 | 2023-03-22 | Becton Dickinson and Company | Primers for immune repertoire profiling |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
EP4247967A1 (en) | 2020-11-20 | 2023-09-27 | Becton, Dickinson and Company | Profiling of highly expressed and lowly expressed proteins |
WO2022192671A1 (en) * | 2021-03-12 | 2022-09-15 | Singular Genomics Systems, Inc. | Nanoarrays and methods of use thereof |
US11884977B2 (en) | 2021-03-12 | 2024-01-30 | Singular Genomics Systems, Inc. | Nanoarrays and methods of use thereof |
CN113096734B (zh) * | 2021-05-11 | 2021-12-14 | 中国科学院水生生物研究所 | 一种筛选用于二倍体群体亲子鉴定的分子标记组合的方法 |
WO2023232940A1 (en) * | 2022-06-01 | 2023-12-07 | Gmendel Aps | A computer implemented method for identifying, if present, a preselected genetic disorder |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110160078A1 (en) | 2009-12-15 | 2011-06-30 | Affymetrix, Inc. | Digital Counting of Individual Molecules by Stochastic Attachment of Diverse Labels |
WO2015002908A1 (en) | 2013-07-01 | 2015-01-08 | Sequenta, Inc. | Large-scale biomolecular analysis with sequence tags |
Family Cites Families (291)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4510244A (en) | 1980-04-17 | 1985-04-09 | The Board Of Trustees Of The Leland Stanford Jr. University | Cell labeling with antigen-coupled microspheres |
US4725536A (en) | 1985-09-19 | 1988-02-16 | Genetics Institute, Inc. | Reagent polynucleotide complex with multiple target binding regions, and kit and methods |
US6150517A (en) | 1986-11-24 | 2000-11-21 | Gen-Probe | Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms |
IE72468B1 (en) | 1987-07-31 | 1997-04-09 | Univ Leland Stanford Junior | Selective amplification of target polynucleotide sequences |
US5149625A (en) | 1987-08-11 | 1992-09-22 | President And Fellows Of Harvard College | Multiplex analysis of DNA |
US5656731A (en) | 1987-10-15 | 1997-08-12 | Chiron Corporation | Nucleic acid-amplified immunoassay probes |
US5124246A (en) | 1987-10-15 | 1992-06-23 | Chiron Corporation | Nucleic acid multimers and amplified nucleic acid hybridization assays using same |
EP0426756A4 (en) | 1988-07-26 | 1991-11-21 | Genelabs Incorporated | Rna and dna amplification techniques |
US6309822B1 (en) | 1989-06-07 | 2001-10-30 | Affymetrix, Inc. | Method for comparing copy number of nucleic acid sequences |
US6551784B2 (en) | 1989-06-07 | 2003-04-22 | Affymetrix Inc | Method of comparing nucleic acid sequences |
US5871928A (en) | 1989-06-07 | 1999-02-16 | Fodor; Stephen P. A. | Methods for nucleic acid analysis |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5424186A (en) | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
US5925525A (en) | 1989-06-07 | 1999-07-20 | Affymetrix, Inc. | Method of identifying nucleotide differences |
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5200314A (en) | 1990-03-23 | 1993-04-06 | Chiron Corporation | Polynucleotide capture assay employing in vitro amplification |
US5119316A (en) | 1990-06-29 | 1992-06-02 | E. I. Du Pont De Nemours And Company | Method for determining dna sequences |
DE69132843T2 (de) | 1990-12-06 | 2002-09-12 | Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) | Identifizierung von Nukleinsäuren in Proben |
US5981179A (en) | 1991-11-14 | 1999-11-09 | Digene Diagnostics, Inc. | Continuous amplification reaction |
US5424413A (en) | 1992-01-22 | 1995-06-13 | Gen-Probe Incorporated | Branched nucleic acid probes |
US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
US5981176A (en) | 1992-06-17 | 1999-11-09 | City Of Hope | Method of detecting and discriminating between nucleic acid sequences |
JP3954092B2 (ja) | 1993-06-25 | 2007-08-08 | アフィメトリックス インコーポレイテッド | 核酸配列のハイブリダイゼーションと配列決定 |
US5500356A (en) | 1993-08-10 | 1996-03-19 | Life Technologies, Inc. | Method of nucleic acid sequence selection |
US6309823B1 (en) | 1993-10-26 | 2001-10-30 | Affymetrix, Inc. | Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same |
US5681697A (en) | 1993-12-08 | 1997-10-28 | Chiron Corporation | Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor |
US5714330A (en) | 1994-04-04 | 1998-02-03 | Lynx Therapeutics, Inc. | DNA sequencing by stepwise ligation and cleavage |
US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
US6013445A (en) | 1996-06-06 | 2000-01-11 | Lynx Therapeutics, Inc. | Massively parallel signature sequencing by ligation of encoded adaptors |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US6600996B2 (en) | 1994-10-21 | 2003-07-29 | Affymetrix, Inc. | Computer-aided techniques for analyzing biological sequences |
EP0709466B1 (en) | 1994-10-28 | 2006-09-27 | Gen-Probe Incorporated | Compositions and methods for the simultaneous detection and quantification of multiple specific nucleic acid sequences |
KR19990008052A (ko) | 1995-04-25 | 1999-01-25 | 마이클 피 노바 | 기억 장치를 갖는 원격적으로 프로그램 가능한 매트릭스 및 이의 용도 |
US5648245A (en) | 1995-05-09 | 1997-07-15 | Carnegie Institution Of Washington | Method for constructing an oligonucleotide concatamer library by rolling circle replication |
US5968740A (en) | 1995-07-24 | 1999-10-19 | Affymetrix, Inc. | Method of Identifying a Base in a Nucleic Acid |
US5763175A (en) | 1995-11-17 | 1998-06-09 | Lynx Therapeutics, Inc. | Simultaneous sequencing of tagged polynucleotides |
US5854033A (en) | 1995-11-21 | 1998-12-29 | Yale University | Rolling circle replication reporter systems |
US5962271A (en) | 1996-01-03 | 1999-10-05 | Cloutech Laboratories, Inc. | Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
EP1736554B1 (en) | 1996-05-29 | 2013-10-09 | Cornell Research Foundation, Inc. | Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions |
JPH1021373A (ja) | 1996-07-05 | 1998-01-23 | Fuji Photo Film Co Ltd | 画像解析装置 |
US5935793A (en) | 1996-09-27 | 1999-08-10 | The Chinese University Of Hong Kong | Parallel polynucleotide sequencing method using tagged primers |
US6124092A (en) | 1996-10-04 | 2000-09-26 | The Perkin-Elmer Corporation | Multiplex polynucleotide capture methods and compositions |
US6117631A (en) | 1996-10-29 | 2000-09-12 | Polyprobe, Inc. | Detection of antigens via oligonucleotide antibody conjugates |
US6046005A (en) | 1997-01-15 | 2000-04-04 | Incyte Pharmaceuticals, Inc. | Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group |
CA2291180A1 (en) | 1997-05-23 | 1998-11-26 | Lynx Therapeutics, Inc. | System and apparatus for sequential processing of analytes |
US6399334B1 (en) | 1997-09-24 | 2002-06-04 | Invitrogen Corporation | Normalized nucleic acid libraries and methods of production thereof |
WO1999028505A1 (en) | 1997-12-03 | 1999-06-10 | Curagen Corporation | Methods and devices for measuring differential gene expression |
US6265163B1 (en) | 1998-01-09 | 2001-07-24 | Lynx Therapeutics, Inc. | Solid phase selection of differentially expressed genes |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
WO2000014282A1 (en) | 1998-09-04 | 2000-03-16 | Lynx Therapeutics, Inc. | Method of screening for genetic polymorphism |
US6480791B1 (en) | 1998-10-28 | 2002-11-12 | Michael P. Strathmann | Parallel methods for genomic analysis |
US6197554B1 (en) | 1998-11-20 | 2001-03-06 | Shi-Lung Lin | Method for generating full-length cDNA library from single cells |
US6629040B1 (en) | 1999-03-19 | 2003-09-30 | University Of Washington | Isotope distribution encoded tags for protein identification |
JP2002539849A (ja) | 1999-03-26 | 2002-11-26 | ホワイトヘッド インスチチュート フォアー バイオメディカル リサーチ | ユニバーサルアレイ |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
EP1046717B1 (en) | 1999-04-20 | 2010-10-06 | National Institute of Advanced Industrial Science and Technology | Method and probes for determining a concentration of target nucleic acid molecules and method for analyzing data obtained by the method |
US6326148B1 (en) | 1999-07-12 | 2001-12-04 | The Regents Of The University Of California | Detection of copy number changes in colon cancer |
US6440706B1 (en) | 1999-08-02 | 2002-08-27 | Johns Hopkins University | Digital amplification |
SE9903988D0 (sv) | 1999-11-03 | 1999-11-03 | Amersham Pharm Biotech Ab | Method of analysis |
US6489114B2 (en) | 1999-12-17 | 2002-12-03 | Bio Merieux | Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby |
US6235483B1 (en) | 2000-01-31 | 2001-05-22 | Agilent Technologies, Inc. | Methods and kits for indirect labeling of nucleic acids |
DK1259643T3 (da) | 2000-02-07 | 2009-02-23 | Illumina Inc | Fremgangsmåde til detektion af nukleinsyre ved anvendelse af universel priming |
GB2364054B (en) | 2000-03-24 | 2002-05-29 | Smithkline Beecham Corp | Method of amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof |
DK2278029T3 (en) | 2000-04-10 | 2016-10-03 | Taxon Biosciences Inc | Methods of study and genetic analysis of populations |
US20030207300A1 (en) | 2000-04-28 | 2003-11-06 | Matray Tracy J. | Multiplex analytical platform using molecular tags |
US7630063B2 (en) | 2000-08-02 | 2009-12-08 | Honeywell International Inc. | Miniaturized cytometer for detecting multiple species in a sample |
AU2001282881B2 (en) | 2000-07-07 | 2007-06-14 | Visigen Biotechnologies, Inc. | Real-time sequence determination |
ATE380883T1 (de) | 2000-10-24 | 2007-12-15 | Univ Leland Stanford Junior | Direkte multiplex charakterisierung von genomischer dna |
US20020142345A1 (en) | 2000-12-22 | 2002-10-03 | Nelsen Anita J. | Methods for encoding and decoding complex mixtures in arrayed assays |
US20030049616A1 (en) | 2001-01-08 | 2003-03-13 | Sydney Brenner | Enzymatic synthesis of oligonucleotide tags |
WO2002070684A2 (en) | 2001-01-11 | 2002-09-12 | Lion Bioscience Ag | Gene library for screening methods |
CA2435612C (en) | 2001-01-25 | 2014-12-23 | Tm Bioscience Corporation | Polynucleotides for use as tags and tag complements, manufacture and use thereof |
US7027932B2 (en) | 2001-03-21 | 2006-04-11 | Olympus Optical Co., Ltd. | Biochemical examination method |
CA2344599C (en) | 2001-05-07 | 2011-07-12 | Bioneer Corporation | Selective polymerase chain reaction of dna of which base sequence is completely unknown |
US6905827B2 (en) | 2001-06-08 | 2005-06-14 | Expression Diagnostics, Inc. | Methods and compositions for diagnosing or monitoring auto immune and chronic inflammatory diseases |
US6830931B2 (en) | 2001-07-12 | 2004-12-14 | Automated Cell, Inc. | Method and apparatus for monitoring of proteins and cells |
US20060141493A1 (en) | 2001-11-09 | 2006-06-29 | Duke University Office Of Science And Technology | Atherosclerotic phenotype determinative genes and methods for using the same |
JP2005515792A (ja) | 2002-01-29 | 2005-06-02 | グローバル ジェノミクス アクティエボラーグ | 核酸を操作するための方法および手段 |
US20030186251A1 (en) | 2002-04-01 | 2003-10-02 | Brookhaven Science Associates, Llc | Genome sequence tags |
US20070178478A1 (en) | 2002-05-08 | 2007-08-02 | Dhallan Ravinder S | Methods for detection of genetic disorders |
US7955800B2 (en) | 2002-06-25 | 2011-06-07 | Advpharma Inc. | Metastasis-associated gene profiling for identification of tumor tissue, subtyping, and prediction of prognosis of patients |
US20040096368A1 (en) | 2002-06-28 | 2004-05-20 | Igen International, Inc. | Assay systems and components |
US20050019776A1 (en) | 2002-06-28 | 2005-01-27 | Callow Matthew James | Universal selective genome amplification and universal genotyping system |
WO2004018623A2 (en) | 2002-08-16 | 2004-03-04 | Clinical Microarrays, Inc. | Substrates for isolating, reacting and microscopically analyzing materials |
US7361821B2 (en) | 2002-09-20 | 2008-04-22 | Intel Corporation | Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading |
EP1546376B9 (en) | 2002-09-30 | 2009-08-12 | F.Hoffmann-La Roche Ag | Oligonucleotides for genotyping thymidylate synthase gene |
WO2004040001A2 (en) | 2002-10-02 | 2004-05-13 | California Institute Of Technology | Microfluidic nucleic acid analysis |
US7822555B2 (en) | 2002-11-11 | 2010-10-26 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
CA2505472A1 (en) | 2002-11-11 | 2004-05-27 | Affymetrix, Inc. | Methods for identifying dna copy number changes |
US7704687B2 (en) | 2002-11-15 | 2010-04-27 | The Johns Hopkins University | Digital karyotyping |
US7269518B2 (en) | 2003-04-30 | 2007-09-11 | Agilent Technologies, Inc. | Chemical array reading |
US20060078941A1 (en) | 2003-06-09 | 2006-04-13 | Santin Alessandro D | Gene expression profiling in primary ovarian serous papillary tumors and normal ovarian epithelium |
US20040259118A1 (en) | 2003-06-23 | 2004-12-23 | Macevicz Stephen C. | Methods and compositions for nucleic acid sequence analysis |
EP1641809B2 (en) | 2003-07-05 | 2018-10-03 | The Johns Hopkins University | Method and compositions for detection and enumeration of genetic variations |
GB0319332D0 (en) | 2003-08-16 | 2003-09-17 | Astrazeneca Ab | Amplification |
US20050048498A1 (en) | 2003-08-29 | 2005-03-03 | Applera Corporation | Compositions, methods, and kits for assembling probes |
US7354706B2 (en) | 2003-09-09 | 2008-04-08 | The Regents Of The University Of Colorado, A Body Corporate | Use of photopolymerization for amplification and detection of a molecular recognition event |
CA2536565A1 (en) | 2003-09-10 | 2005-05-12 | Althea Technologies, Inc. | Expression profiling using microarrays |
JP2007512811A (ja) | 2003-11-10 | 2007-05-24 | インベスチゲン, インコーポレイテッド | 検出のための核酸を調製する方法 |
EP1709203A2 (en) | 2004-01-23 | 2006-10-11 | Lingvitae AS | Improving polynucleotide ligation reactions |
ATE451478T1 (de) | 2004-02-12 | 2009-12-15 | Population Genetics Technologi | Genetische analyse mittels sequenzspezifischem sortieren |
US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
CA2565450C (en) | 2004-05-07 | 2018-03-06 | Gyorgy Petrovics | Methods of diagnosing or treating prostate cancer using the erg gene, alone or in combination with other over or under expressed genes in prostate cancer |
US20050250147A1 (en) | 2004-05-10 | 2005-11-10 | Macevicz Stephen C | Digital profiling of polynucleotide populations |
JP2008505345A (ja) | 2004-06-07 | 2008-02-21 | アイアールエム エルエルシー | 分注システム、ソフトウェア、および関連する方法 |
US20060035258A1 (en) | 2004-08-06 | 2006-02-16 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
US20060041385A1 (en) | 2004-08-18 | 2006-02-23 | Bauer Kenneth D | Method of quantitating proteins and genes in cells using a combination of immunohistochemistry and in situ hybridization |
EP1647600A3 (en) | 2004-09-17 | 2006-06-28 | Affymetrix, Inc. (A US Entity) | Methods for identifying biological samples by addition of nucleic acid bar-code tags |
EP1836302B1 (en) | 2004-12-23 | 2010-04-14 | Amersham Biosciences Corp. | Ligation-based rna amplification |
EP2418018B1 (en) | 2004-12-23 | 2013-05-22 | Abbott Point of Care Inc. | Methods for the separation nucleic acids |
US9222129B2 (en) | 2005-02-10 | 2015-12-29 | Riken | Method for amplification of nucleotide sequence |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
EP1856293A2 (en) | 2005-03-16 | 2007-11-21 | Compass Genetics, Llc | Methods and compositions for assay readouts on multiple analytical platforms |
EP2518161A1 (en) | 2005-03-18 | 2012-10-31 | Fluidigm Corporation | Method for detection of mutant alleles |
US20060263789A1 (en) | 2005-05-19 | 2006-11-23 | Robert Kincaid | Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using |
US7695886B2 (en) | 2005-05-19 | 2010-04-13 | Fuji Xerox Co., Ltd. | Process for producing resin particle liquid dispersion for electrostatic image developing toner, electrostatic image developing toner and production process thereof |
US8407013B2 (en) | 2005-06-07 | 2013-03-26 | Peter K. Rogan | AB initio generation of single copy genomic probes |
US7796815B2 (en) | 2005-06-10 | 2010-09-14 | The Cleveland Clinic Foundation | Image analysis of biological objects |
US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
US20070117121A1 (en) | 2005-09-16 | 2007-05-24 | Hutchison Stephen K | cDNA library preparation |
US8313711B2 (en) | 2005-11-01 | 2012-11-20 | Freeslate, Inc. | Liquid dispensing for high-throughput experimentation |
US7375211B2 (en) | 2005-11-18 | 2008-05-20 | Kou Zhong C | Method for detection and quantification of T-cell receptor Vβ repertoire |
US20080070303A1 (en) | 2005-11-21 | 2008-03-20 | West Michael D | Methods to accelerate the isolation of novel cell strains from pluripotent stem cells and cells obtained thereby |
US7636465B2 (en) | 2005-12-09 | 2009-12-22 | Cytyc Corporation | Cross-frame object reconstruction for image-based cytology applications |
US7537897B2 (en) | 2006-01-23 | 2009-05-26 | Population Genetics Technologies, Ltd. | Molecular counting |
US7544473B2 (en) | 2006-01-23 | 2009-06-09 | Population Genetics Technologies Ltd. | Nucleic acid analysis using sequence tokens |
EP1994180A4 (en) * | 2006-02-24 | 2009-11-25 | Callida Genomics Inc | GENOME SEQUENCING ON DNA ARRAYS WITH HIGH THROUGHPUT |
US20080038727A1 (en) | 2006-03-10 | 2008-02-14 | Applera Corporation | MicroRNA and Messenger RNA Detection on Arrays |
US7752233B2 (en) | 2006-03-29 | 2010-07-06 | Massachusetts Institute Of Technology | Techniques for clustering a set of objects |
US7880142B2 (en) | 2006-04-04 | 2011-02-01 | Sidec Technologies Ab | Extended electron tomography |
US20080194414A1 (en) | 2006-04-24 | 2008-08-14 | Albert Thomas J | Enrichment and sequence analysis of genomic regions |
US9074242B2 (en) | 2010-02-12 | 2015-07-07 | Raindance Technologies, Inc. | Digital analyte analysis |
WO2007136874A2 (en) | 2006-05-18 | 2007-11-29 | President And Fellows Of Harvard College | Genomic library construction |
WO2007147079A2 (en) | 2006-06-14 | 2007-12-21 | Living Microsystems, Inc. | Rare cell analysis using sample splitting and dna tags |
US8603749B2 (en) | 2006-11-15 | 2013-12-10 | Biospherex, LLC | Multitag sequencing ecogenomics analysis-US |
US8050476B2 (en) | 2006-11-22 | 2011-11-01 | General Electric Company | Heart rate demodulation of periodic movement in ultrasound data for object identification |
EP2677308B1 (en) | 2006-12-14 | 2017-04-26 | Life Technologies Corporation | Method for fabricating large scale FET arrays |
JP5489469B2 (ja) | 2007-01-16 | 2014-05-14 | オリンパス株式会社 | 蛍光信号解析装置および蛍光信号解析方法 |
US9063133B2 (en) | 2007-01-30 | 2015-06-23 | The Regents Of The University Of California | Methods and devices for biomolecular arrays |
US20080269068A1 (en) | 2007-02-06 | 2008-10-30 | President And Fellows Of Harvard College | Multiplex decoding of sequence tags in barcodes |
WO2008096318A2 (en) | 2007-02-09 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Identification system |
KR100882711B1 (ko) | 2007-03-12 | 2009-02-06 | 성균관대학교산학협력단 | 사이크로박터 스피시스 hj147 균주 유래의 우라실-dna글리코실라제 및 이의 용도 |
US20080274458A1 (en) | 2007-05-01 | 2008-11-06 | Latham Gary J | Nucleic acid quantitation methods |
US20090061513A1 (en) | 2007-05-15 | 2009-03-05 | Picovitro Ab | Cell sorting and cell cultivation methods |
CN101720359A (zh) | 2007-06-01 | 2010-06-02 | 454生命科学公司 | 从多重混合物中识别个别样本的系统和方法 |
US7635566B2 (en) | 2007-06-29 | 2009-12-22 | Population Genetics Technologies Ltd. | Methods and compositions for isolating nucleic acid sequence variants |
US10300482B2 (en) | 2010-12-09 | 2019-05-28 | Akonni Biosystems, Inc. | Sample analysis system |
US20090253586A1 (en) | 2008-02-21 | 2009-10-08 | Gentel Biosciences, Inc. | Substrates for multiplexed assays and uses thereof |
US8687189B2 (en) | 2008-03-03 | 2014-04-01 | Ajjer, Llc | Analysis of arrays by laser induced breakdown spectroscopy |
US20090298709A1 (en) | 2008-05-28 | 2009-12-03 | Affymetrix, Inc. | Assays for determining telomere length and repeated sequence copy number |
DE102008025656B4 (de) | 2008-05-28 | 2016-07-28 | Genxpro Gmbh | Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung |
US20100120097A1 (en) | 2008-05-30 | 2010-05-13 | Board Of Regents, The University Of Texas System | Methods and compositions for nucleic acid sequencing |
CN102099480A (zh) * | 2008-07-17 | 2011-06-15 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物和用于产生该植物的方法 |
US20100069250A1 (en) | 2008-08-16 | 2010-03-18 | The Board Of Trustees Of The Leland Stanford Junior University | Digital PCR Calibration for High Throughput Sequencing |
US8476013B2 (en) | 2008-09-16 | 2013-07-02 | Sequenom, Inc. | Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses |
MX2011004588A (es) | 2008-10-31 | 2011-08-03 | Abbott Lab | Clasificacion genomica de carcinoma de pulmon de celulas no pequeñas basadas en patrones de alteraciones de numero de copias de gene. |
US20100159533A1 (en) | 2008-11-24 | 2010-06-24 | Helicos Biosciences Corporation | Simplified sample preparation for rna analysis |
US8492096B2 (en) | 2008-12-24 | 2013-07-23 | Boris Pasche | TGFBR1 expression modifies risk for colorectal cancer |
AU2010206843B2 (en) | 2009-01-20 | 2015-01-29 | The Board Of Trustees Of The Leland Stanford Junior University | Single cell gene expression for diagnosis, prognosis and identification of drug targets |
US20100323348A1 (en) | 2009-01-31 | 2010-12-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process |
CA2754446A1 (en) | 2009-03-05 | 2010-09-10 | Daiichi Sankyo Company, Limited | Pyridine derivative |
EP2230312A1 (en) | 2009-03-19 | 2010-09-22 | Helmholtz-Zentrum für Infektionsforschung GmbH | Probe compound for detecting and isolating enzymes and means and methods using the same |
WO2010117620A2 (en) | 2009-03-30 | 2010-10-14 | Illumina, Inc. | Gene expression analysis in single cells |
AU2010232439C1 (en) | 2009-04-02 | 2017-07-13 | Fluidigm Corporation | Multi-primer amplification method for barcoding of target nucleic acids |
WO2010127186A1 (en) | 2009-04-30 | 2010-11-04 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
FR2945545B1 (fr) | 2009-05-14 | 2011-08-05 | Univ Aix Marseille Ii | Methode de detection d'adn procaryote extrait d'un echantillon de selles |
GB0909923D0 (en) | 2009-06-09 | 2009-07-22 | Oxford Gene Tech Ip Ltd | Picowell capture devices for analysing single cells or other particles |
US8330957B2 (en) | 2009-06-29 | 2012-12-11 | Hager Enviromental and Atmospheric Technologies, LLC | Device and method for quantification of gases in plumes by remote sensing |
CN102686728B (zh) | 2009-06-29 | 2018-09-18 | 卢米耐克斯公司 | 具有发夹构象的嵌合引物及其使用方法 |
CN102482668A (zh) | 2009-08-20 | 2012-05-30 | 群体遗传学科技有限公司 | 分子内核酸重排的组合物和方法 |
EP2473625B1 (en) | 2009-09-01 | 2018-03-07 | Koninklijke Philips N.V. | Devices and methods for microarray selection |
WO2011028818A2 (en) | 2009-09-01 | 2011-03-10 | Trustees Of Boston University | High throughput multichannel reader and uses thereof |
US9625454B2 (en) | 2009-09-04 | 2017-04-18 | The Research Foundation For The State University Of New York | Rapid and continuous analyte processing in droplet microfluidic devices |
US20120184048A1 (en) * | 2009-09-28 | 2012-07-19 | Koninklijke Philips Electronics N.V. | Method for characterization of biological bonds |
WO2011041308A1 (en) | 2009-09-30 | 2011-04-07 | Quest Diagnostics Investments Incorporated | Bcr-abl truncation mutations |
US9315857B2 (en) * | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
AU2011207544A1 (en) | 2010-01-19 | 2012-09-06 | Verinata Health, Inc. | Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing |
EP2848704B1 (en) | 2010-01-19 | 2018-08-29 | Verinata Health, Inc | Sequencing methods for prenatal diagnoses |
EP2529026B1 (en) * | 2010-01-25 | 2013-11-13 | Rd Biosciences Inc. | Self-folding amplification of target nucleic acid |
JP5901046B2 (ja) | 2010-02-19 | 2016-04-06 | 国立大学法人 千葉大学 | OATP1B3mRNAの新規な選択的スプライシングバリアント |
US8951940B2 (en) | 2010-04-01 | 2015-02-10 | Illumina, Inc. | Solid-phase clonal amplification and related methods |
SG185544A1 (en) | 2010-05-14 | 2012-12-28 | Fluidigm Corp | Nucleic acid isolation methods |
US8828688B2 (en) | 2010-05-27 | 2014-09-09 | Affymetrix, Inc. | Multiplex amplification methods |
EP2580351B1 (en) | 2010-06-09 | 2018-08-29 | Keygene N.V. | Combinatorial sequence barcodes for high throughput screening |
EP2407242A1 (en) | 2010-07-13 | 2012-01-18 | Dublin City University | Direct clone analysis and selection technology |
US20120040843A1 (en) | 2010-08-12 | 2012-02-16 | Dublin City University | Centrifugal capture system |
EP2623613B8 (en) | 2010-09-21 | 2016-09-07 | Population Genetics Technologies Ltd. | Increasing confidence of allele calls with molecular counting |
WO2012042374A2 (en) | 2010-10-01 | 2012-04-05 | Anssi Jussi Nikolai Taipale | Method of determining number or concentration of molecules |
WO2012048341A1 (en) | 2010-10-08 | 2012-04-12 | President And Fellows Of Harvard College | High-throughput single cell barcoding |
US20120088691A1 (en) | 2010-10-08 | 2012-04-12 | Gao Chen | Highly multiplexed real-time pcr using encoded microbeads |
US20130225623A1 (en) | 2010-10-27 | 2013-08-29 | Mount Sinai School Of Medicine | Methods of Treating Psychiatric or Neurological Disorders with MGLUR Antagonists |
AU2011336707A1 (en) | 2010-11-29 | 2013-07-04 | Dako Denmark A/S | Methods and systems for analyzing images of specimens processed by a programmable quantitative assay |
ES2615733T3 (es) | 2010-12-16 | 2017-06-08 | Gigagen, Inc. | Métodos para el análisis masivo paralelo de ácidos nucleicos en células individuales |
WO2012092515A2 (en) | 2010-12-30 | 2012-07-05 | Life Technologies Corporation | Methods, systems, and computer readable media for nucleic acid sequencing |
US20120190021A1 (en) | 2011-01-25 | 2012-07-26 | Aria Diagnostics, Inc. | Detection of genetic abnormalities |
WO2012108864A1 (en) | 2011-02-08 | 2012-08-16 | Illumina, Inc. | Selective enrichment of nucleic acids |
US9150852B2 (en) | 2011-02-18 | 2015-10-06 | Raindance Technologies, Inc. | Compositions and methods for molecular labeling |
WO2012129363A2 (en) | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
KR20120110431A (ko) | 2011-03-29 | 2012-10-10 | 에스케이하이닉스 주식회사 | 반도체 메모리 장치 |
GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
DK3246416T3 (da) | 2011-04-15 | 2024-09-02 | Univ Johns Hopkins | Sikkert sekventeringssystem |
WO2012149042A2 (en) | 2011-04-25 | 2012-11-01 | Bio-Rad Laboratories, Inc. | Methods and compositions for nucleic acid analysis |
SG10201605049QA (en) | 2011-05-20 | 2016-07-28 | Fluidigm Corp | Nucleic acid encoding reactions |
HUE062102T2 (hu) | 2011-05-24 | 2023-09-28 | BioNTech SE | Individualizált vakcinák a rák ellen |
WO2012162621A1 (en) | 2011-05-26 | 2012-11-29 | Brandeis University | Methods for suppression pcr |
US8841071B2 (en) | 2011-06-02 | 2014-09-23 | Raindance Technologies, Inc. | Sample multiplexing |
US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
WO2013003498A2 (en) | 2011-06-27 | 2013-01-03 | Life Technologies Corporation | Acoustic cytometry methods and protocols |
WO2013019075A2 (ko) | 2011-08-01 | 2013-02-07 | 연세대학교산학협력단 | 핵산분자의 제조방법 |
KR101337094B1 (ko) | 2011-11-30 | 2013-12-05 | 삼성에스디에스 주식회사 | 염기 서열 정렬 장치 및 그 방법 |
WO2013117595A2 (en) | 2012-02-07 | 2013-08-15 | Illumina Cambridge Limited | Targeted enrichment and amplification of nucleic acids on a support |
EP2823303A4 (en) | 2012-02-10 | 2015-09-30 | Raindance Technologies Inc | MOLECULAR DIAGNOSTIC SCREEN TYPE ASSAY |
EP3309262B1 (en) | 2012-02-24 | 2019-09-25 | Bio-Rad Laboratories, Inc. | Labeling and sample preparation for sequencing |
US11177020B2 (en) | 2012-02-27 | 2021-11-16 | The University Of North Carolina At Chapel Hill | Methods and uses for molecular tags |
GB2513024B (en) * | 2012-02-27 | 2016-08-31 | Cellular Res Inc | A clonal amplification method |
US20150132754A1 (en) | 2012-05-14 | 2015-05-14 | Cb Biotechnologies, Inc. | Method for increasing accuracy in quantitative detection of polynucleotides |
SG11201407901PA (en) | 2012-05-21 | 2015-01-29 | Fluidigm Corp | Single-particle analysis of particle populations |
CN104508492B (zh) | 2012-05-25 | 2018-07-27 | 北卡罗来纳-查佩尔山大学 | 微流体装置、用于试剂的固体支持体和相关方法 |
EP2861761A1 (en) | 2012-06-15 | 2015-04-22 | Adaptive Biotechnologies Corporation | Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set |
AU2013273953B2 (en) | 2012-06-15 | 2018-12-13 | The Board Of Regents Of The University Of Texas System | High throughput sequencing of multiple transcripts of a single cell |
EP2861787B1 (en) | 2012-06-18 | 2017-09-20 | Nugen Technologies, Inc. | Compositions and methods for negative selection of non-desired nucleic acid sequences |
JP6285929B2 (ja) | 2012-07-17 | 2018-02-28 | カウンシル,インコーポレーテッド | 遺伝的変異を検出するためのシステムおよび方法 |
WO2014015098A1 (en) | 2012-07-18 | 2014-01-23 | Siemens Healthcare Diagnostics Inc. | A method of normalizing biological samples |
SG11201500313YA (en) | 2012-07-24 | 2015-02-27 | Sequenta Inc | Single cell analysis using sequence tags |
US20140378322A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CN113528634A (zh) | 2012-08-14 | 2021-10-22 | 10X基因组学有限公司 | 微胶囊组合物及方法 |
US20150005200A1 (en) | 2012-08-14 | 2015-01-01 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US20140378345A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US20150005199A1 (en) | 2012-08-14 | 2015-01-01 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US20140378349A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
CN107090491A (zh) | 2012-11-05 | 2017-08-25 | 鲁比康基因组学公司 | 条形编码核酸 |
US9489627B2 (en) | 2012-11-19 | 2016-11-08 | Bottomline Technologies (De), Inc. | Hybrid clustering for data analytics |
EP3567116A1 (en) | 2012-12-14 | 2019-11-13 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
WO2014108850A2 (en) | 2013-01-09 | 2014-07-17 | Yeda Research And Development Co. Ltd. | High throughput transcriptome analysis |
WO2014116729A2 (en) | 2013-01-22 | 2014-07-31 | The Board Of Trustees Of The Leland Stanford Junior University | Haplotying of hla loci with ultra-deep shotgun sequencing |
EP2948252A1 (en) | 2013-01-24 | 2015-12-02 | SABIC Global Technologies B.V. | Microwell plate made from a polyester-polycarbonate |
EP2951557B1 (en) | 2013-02-01 | 2022-10-05 | Becton Dickinson and Company | Methods and systems for assessing sample behavior in a flow cytometer |
KR102190198B1 (ko) | 2013-02-08 | 2020-12-14 | 10엑스 제노믹스, 인크. | 폴리뉴클레오티드 바코드 생성 |
WO2014126937A1 (en) | 2013-02-14 | 2014-08-21 | The Board Of Trustees Of The Leland Stanford Junior University | Suspension arrays and multiplexed assays based thereon |
US20140274811A1 (en) | 2013-03-14 | 2014-09-18 | Lyle J. Arnold | Methods for Amplifying a Complete Genome or Transcriptome |
EP2971138B1 (en) * | 2013-03-15 | 2020-05-13 | Bio-rad Laboratories, Inc. | Digital assays with associated targets |
US9799041B2 (en) | 2013-03-15 | 2017-10-24 | The Nielsen Company (Us), Llc | Method and apparatus for interactive evolutionary optimization of concepts |
GB2584364A (en) | 2013-03-15 | 2020-12-02 | Abvitro Llc | Single cell bar-coding for antibody discovery |
WO2014165762A1 (en) | 2013-04-05 | 2014-10-09 | Raindance Technologies, Inc. | Rare cell analysis after negative selection |
EP2805769A1 (en) | 2013-05-24 | 2014-11-26 | European Molecular Biology Laboratory | Methods for nano-scale single cell analysis |
WO2014201273A1 (en) | 2013-06-12 | 2014-12-18 | The Broad Institute, Inc. | High-throughput rna-seq |
CA2915499A1 (en) | 2013-06-27 | 2014-12-31 | 10X Genomics, Inc. | Compositions and methods for sample processing |
GB2525104B (en) | 2013-08-28 | 2016-09-28 | Cellular Res Inc | Massively Parallel Single Cell Nucleic Acid Analysis |
US10395758B2 (en) | 2013-08-30 | 2019-08-27 | 10X Genomics, Inc. | Sequencing methods |
EP3041957A4 (en) | 2013-09-04 | 2017-03-29 | Fluidigm Corporation | Proximity assays for detecting nucleic acids and proteins in a single cell |
ES2875998T3 (es) | 2013-09-30 | 2021-11-11 | Vesicode Ab | Procedimientos de perfilado de complejos moleculares mediante el uso de códigos de barras dependientes de la proximidad |
GB201317301D0 (en) | 2013-09-30 | 2013-11-13 | Linnarsson Sten | Method for capturing and encoding nucleic acid from a plurality of single cells |
JP2017504307A (ja) | 2013-10-07 | 2017-02-09 | セルラー リサーチ, インコーポレイテッド | アレイ上のフィーチャーをデジタルカウントするための方法およびシステム |
JP6571665B2 (ja) | 2013-12-28 | 2019-09-04 | ガーダント ヘルス, インコーポレイテッド | 遺伝的バリアントを検出するための方法およびシステム |
SG10201807112XA (en) | 2013-12-30 | 2018-09-27 | Atreca Inc | Analysis of nucleic acids associated with single cells using nucleic acid barcodes |
ES2741740T3 (es) | 2014-03-05 | 2020-02-12 | Adaptive Biotechnologies Corp | Métodos que usan moléculas sintéticas que contienen segmentos de nucleótidos aleatorios |
US20150298091A1 (en) | 2014-04-21 | 2015-10-22 | President And Fellows Of Harvard College | Systems and methods for barcoding nucleic acids |
GB201409282D0 (en) | 2014-05-23 | 2014-07-09 | Univ Sydney Tech | Sequencing process |
EP3161160B1 (en) | 2014-06-26 | 2021-10-13 | 10X Genomics, Inc. | Methods of analyzing nucleic acids from individual cells or cell populations |
WO2015200869A1 (en) | 2014-06-26 | 2015-12-30 | 10X Genomics, Inc. | Analysis of nucleic acid sequences |
JP6125731B2 (ja) | 2014-07-02 | 2017-05-10 | 株式会社Dnaチップ研究所 | 核酸分子数計測法 |
CN107873054B (zh) | 2014-09-09 | 2022-07-12 | 博德研究所 | 用于复合单细胞核酸分析的基于微滴的方法和设备 |
ES2880335T3 (es) * | 2014-09-09 | 2021-11-24 | Igenomx Int Genomics Corporation | Métodos y composiciones para la preparación rápida de bibliotecas de ácidos nucleicos |
EP3248018B1 (en) | 2015-01-22 | 2020-01-08 | Becton, Dickinson and Company | Devices and systems for molecular barcoding of nucleic acid targets in single cells |
EP3259371B1 (en) | 2015-02-19 | 2020-09-02 | Becton, Dickinson and Company | High-throughput single-cell analysis combining proteomic and genomic information |
ES2906221T3 (es) | 2015-02-27 | 2022-04-13 | Becton Dickinson Co | Métodos para el marcado con códigos de barras de ácidos nucleicos para secuenciación |
WO2016138496A1 (en) | 2015-02-27 | 2016-09-01 | Cellular Research, Inc. | Spatially addressable molecular barcoding |
WO2016149418A1 (en) | 2015-03-18 | 2016-09-22 | Cellular Research, Inc. | Methods and compositions for labeling targets and haplotype phasing |
US11535882B2 (en) | 2015-03-30 | 2022-12-27 | Becton, Dickinson And Company | Methods and compositions for combinatorial barcoding |
CA2982146A1 (en) | 2015-04-10 | 2016-10-13 | Spatial Transcriptomics Ab | Spatially distinguished, multiplex nucleic acid analysis of biological specimens |
WO2016172373A1 (en) | 2015-04-23 | 2016-10-27 | Cellular Research, Inc. | Methods and compositions for whole transcriptome amplification |
US9618871B2 (en) | 2015-04-28 | 2017-04-11 | Kyocera Document Solutions Inc. | Image forming apparatus |
EP3347465B1 (en) | 2015-09-11 | 2019-06-26 | Cellular Research, Inc. | Methods and compositions for nucleic acid library normalization |
WO2017164936A1 (en) | 2016-03-21 | 2017-09-28 | The Broad Institute, Inc. | Methods for determining spatial and temporal gene expression dynamics in single cells |
EP3452614B1 (en) | 2016-05-02 | 2023-06-28 | Becton, Dickinson and Company | Accurate molecular barcoding |
WO2017205691A1 (en) | 2016-05-26 | 2017-11-30 | Cellular Research, Inc. | Molecular label counting adjustment methods |
TWI600309B (zh) | 2016-05-28 | 2017-09-21 | Hon Hai Prec Ind Co Ltd | 角度調整機構 |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
US20180037942A1 (en) | 2016-08-03 | 2018-02-08 | Cellular Research, Inc. | Enzyme-independent molecular indexing |
KR20190077061A (ko) | 2016-11-08 | 2019-07-02 | 셀룰러 리서치, 인크. | 세포 표지 분류 방법 |
CN109952612B (zh) | 2016-11-08 | 2023-12-01 | 贝克顿迪金森公司 | 用于表达谱分类的方法 |
JP7169290B2 (ja) | 2017-03-24 | 2022-11-10 | ベクトン・ディキンソン・アンド・カンパニー | マルチプレットを決定するための合成マルチプレット |
JP6518720B2 (ja) | 2017-06-07 | 2019-05-22 | 日立ジョンソンコントロールズ空調株式会社 | 永久磁石式回転電機及びそれを用いた圧縮機 |
ES2969957T3 (es) | 2017-09-25 | 2024-05-23 | Becton Dickinson Co | Corrección de errores del código de barras del receptor inmunitario |
-
2017
- 2017-05-25 WO PCT/US2017/034576 patent/WO2017205691A1/en unknown
- 2017-05-25 CN CN201780028283.2A patent/CN109074430B/zh active Active
- 2017-05-25 US US15/605,874 patent/US11397882B2/en active Active
- 2017-05-25 EP EP24169193.0A patent/EP4407625A2/en active Pending
- 2017-05-25 JP JP2018561218A patent/JP7046007B2/ja active Active
- 2017-05-25 EP EP17728398.3A patent/EP3465502B1/en active Active
-
2022
- 2022-07-21 US US17/814,042 patent/US20230065324A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110160078A1 (en) | 2009-12-15 | 2011-06-30 | Affymetrix, Inc. | Digital Counting of Individual Molecules by Stochastic Attachment of Diverse Labels |
WO2015002908A1 (en) | 2013-07-01 | 2015-01-08 | Sequenta, Inc. | Large-scale biomolecular analysis with sequence tags |
Also Published As
Publication number | Publication date |
---|---|
US11397882B2 (en) | 2022-07-26 |
EP4407625A2 (en) | 2024-07-31 |
EP3465502A1 (en) | 2019-04-10 |
US20230065324A1 (en) | 2023-03-02 |
CN109074430A (zh) | 2018-12-21 |
WO2017205691A1 (en) | 2017-11-30 |
JP2019522268A (ja) | 2019-08-08 |
CN109074430B (zh) | 2022-03-29 |
EP3465502B1 (en) | 2024-04-10 |
US20170344866A1 (en) | 2017-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7046007B2 (ja) | 分子標識カウントの調節方法 | |
JP7228510B2 (ja) | 細胞標識分類の方法 | |
JP7169290B2 (ja) | マルチプレットを決定するための合成マルチプレット | |
JP7232180B2 (ja) | 発現プロファイル分類の方法 | |
US20190095578A1 (en) | Immune receptor-barcode error correction | |
US20200255888A1 (en) | Determining expressions of transcript variants and polyadenylation sites |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190926 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20191002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200525 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210708 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20211007 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211208 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20211208 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220322 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7046007 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |