JP7232180B2 - 発現プロファイル分類の方法 - Google Patents
発現プロファイル分類の方法 Download PDFInfo
- Publication number
- JP7232180B2 JP7232180B2 JP2019523873A JP2019523873A JP7232180B2 JP 7232180 B2 JP7232180 B2 JP 7232180B2 JP 2019523873 A JP2019523873 A JP 2019523873A JP 2019523873 A JP2019523873 A JP 2019523873A JP 7232180 B2 JP7232180 B2 JP 7232180B2
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- cells
- node
- correlation
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Genetics & Genomics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Bioethics (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本願は、2016年11月8日に出願された米国仮特許出願第62/419291号明細書及び2017年1月13日に出願された米国仮特許出願第62/446227号明細書の優先権を主張するものである。これらの関連出願のそれぞれの内容は全体的に、参照により明示的に本明細書に援用される。
本特許文献の開示の一部は、著作権保護の対象である試料を含む。著作権所有者は、特許商標庁の特許ファイル及び記録に見られるように、特許文献又は特許開示のいかなる者によるファクシミリ複製にも異を唱えないが、その他では何であれ、全著作権を留保する。
本開示は、一般的には発現プロファイルを分類する分野に関し、より詳細には、細胞タイプを区別する標的を識別することに関する。
バーコーディング(例えば、確率的バーコーディング)等の方法及び技法は、細胞分析に有用である。例えば、バーコーディングを使用して、単一の細胞の遺伝子発現プロファイルを解読し、例えば、逆転写、ポリメラーゼ連鎖反応(PCR)増幅、及び次世代シーケンシング(NGS)を使用して状態を特定することができる。しかしながら、細胞タイプを区別するマーカーを識別し、分析される細胞のタイプを特定するためには、これらの方法及び技法によって生成される大量のデータを更に分析する必要がある。
別段のことが定義される場合を除き、本明細書で使用される技術用語及び科学用語は、本開示が属する分野の当業者によって一般に理解されるものと同じ意味を有する。例えば、Singletonら著、Dictionary of Microbiology and Molecular Biology 2nd ed.,J.Wiley&Sons(New York,NY 1994);Sambrookら著、Molecular Cloning,A Laboratory Manual,Cold Springs Harbor Press(Cold Springs Harbor,NY 1989)参照。本開示では、以下の用語は以下のように定義される。
確率的バーコーディング等のバーコーディングは、例えば、米国特許出願第20150299784号明細書、国際公開第2015031691号パンフレット、並びにFuら,Proc Natl Acad Sci U.S.A.2011 May 31;108(22):9026-31及びFanら,Science(2015)347(6222):1258367に記載されてきており、これらの公開物の内容は全体的に、参照により本明細書に援用される。幾つかの実施形態では、本明細書に開示されるバーコードは、標的を確率的に標識する(例えば、バーコード付け、タグ付け)するのに使用し得るポリヌクレオチド配列であることができる確率的バーコードであることができる。バーコードは、確率的バーコードの異なるバーコード配列の数と標識すべき標的のいずれかの発生数との比率が、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、若しくはこれらの値の任意の2つの間の数若しくは範囲、又は約これらの値若しくは範囲であることができる場合、確率的バーコードと呼ぶことができる。標的は、例えば、同一又は略同一の配列を有するmRNA分子を含むmRNA種であることができる。バーコードは、確率的バーコードの異なるバーコード配列の数と標識すべき標的のいずれかの発生数との比率が、少なくとも又は多くとも1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、又は100:1である場合、確率的バーコードと呼ぶことができる。確率的バーコードのバーコード配列は、分子標識と呼ぶことができる。
バーコードは、1つ又は複数のユニバーサル標識を含むことができる。幾つかの実施形態では、1つ又は複数のユニバーサル標識は、所与の固体支持体に付着する1組のバーコード内の全てのバーコードで同じであることができる。幾つかの実施形態では、1つ又は複数のユニバーサル標識は、複数のビーズに付着した全てのバーコードで同じであることができる。幾つかの実施形態では、ユニバーサル標識は、シーケンシングプライマーにハイブリダイズ可能な核酸配列を含むことができる。シーケンシングプライマーは、ユニバーサル標識を含むバーコードのシーケンシングに使用することができる。シーケンシングプライマー(例えば、ユニバーサルシーケンシングプライマー)は、高スループットシーケンシングプラットフォームに関連付けられたシーケンシングプライマーを含むことができる。幾つかの実施形態では、ユニバーサル標識は、PCRプライマーにハイブリダイズ可能な核酸配列を含むことができる。幾つかの実施形態では、ユニバーサル標識は、シーケンシングプライマー及びPCRプライマーにハイブリダイズ可能な核酸配列を含むことができる。シーケンシングプライマー又はPCRプライマーにハイブリダイズ可能なユニバーサル標識の核酸配列は、プライマー結合部位と呼ぶことができる。ユニバーサル標識は、バーコードの転写の開始に使用することができる配列を含むことができる。ユニバーサル標識は、バーコード又はバーコード内の領域の拡張に使用することができる配列を含むことができる。ユニバーサル標識は、1個、2個、3個、4個、5個、10個、15個、20個、25個、30個、35個、40個、45個、50個、若しくはこれらの値の任意の2つの間の数若しくは範囲のヌクレオチドの長さ又は約これ(ら)の長さであることができる。例えば、ユニバーサル標識は、少なくとも約10個のヌクレオチドを含むことができる。ユニバーサル標識は、少なくとも又は多くとも1個、2個、3個、4個、5個、10個、15個、20個、25個、30個、35個、40個、45個、50個、100個、200個、又は300個のヌクレオチドの長さを含むことができる。幾つかの実施形態では、開裂可能リンカー又は修飾されたヌクレオチドは、バーコードが支持体から開裂できるようにするために、ユニバーサル標識配列の部分であることができる。
バーコードは、1つ又は複数の次元標識を含むことができる。幾つかの実施形態では、次元標識は、標識(例えば、確率的標識)が発生した次元についての情報を提供する核酸配列を含むことができる。例えば、次元標識は、標的が確率的にバーコーディングされた時間についての情報を提供することができる。次元標識に、試料におけるバーコーディング(例えば、確率的バーコーディング)の時間を関連付けることができる。次元標識は、標識の時間に活性化することができる。異なる次元標識を異なる時間に活性化することができる。次元標識は、標的、標的群、及び/又は試料が確率的にバーコーディングされた順序についての情報を提供する。例えば、細胞の集団は、細胞サイクルのG0フェーズにおいて確率的にバーコーディングすることができる。細胞は、細胞サイクルのG1フェーズにおいて再びバーコード(例えば、確率的バーコード)でパルスすることができる。細胞は、細胞サイクルのSフェーズで再びバーコードでパルスすることができ、以下同様である。各パルス(例えば、細胞サイクルの各フェーズ)におけるバーコードは、異なる次元標識を含むことができる。このようにして、次元標識は、どの標的が細胞サイクルのどのフェーズで標識されたかについての情報を提供する。次元標識は、多くの異なる生物時間を照合することができる。例示的な生物時間には、限定ではなく、細胞サイクル、転写(例えば、転写開始)、及び転写物分解がある。別の例では、試料(例えば、細胞、細胞の集団)は、薬剤及び/又は治療を用いた処置前及び/又は後に確率的に標識することができる。別個の標的のコピー数の変化は、薬剤及び/又は治療への試料の応答を示すことができる。
バーコードは、1つ又は複数の空間標識を含むことができる。幾つかの実施形態では、空間標識は、バーコードに関連付けられた標的分子の空間配向についての情報を提供する核酸配列を含むことができる。空間標識に、試料中の座標を関連付けることができる。座標は固定座標であることができる。例えば、座標は基板を参照して固定することができる。空間標識は、二次元又は三次元格子を参照することができる。座標は、陸標を参照して固定することができる。陸標は空間で識別可能であることができる。陸標は、撮像することができる構造物であることができる。陸標は、生体構造物、例えば、解剖学的陸標であることができる。陸標は、細胞陸標、例えば細胞小器官であることができる。陸標は、カラーコード、バーコード、磁性、蛍光性、放射性、又は一意のサイズ若しくは形状等の識別可能な識別子を有する構造物等の非天然陸標であることができる。空間標識には、物理的パーテーション(例えば、ウェル、容器、又は液滴)を関連付けることができる。幾つかの実施形態では、複数の空間標識を一緒に使用して、空間中の1つ又は複数の位置を符号化する。
バーコードは、1つ又は複数の細胞標識を含むことができる。幾つかの実施形態では、細胞標識は、どの標的核酸がどの細胞から来たのかを判断するための情報を提供する核酸配列を含むことができる。幾つかの実施形態では、細胞標識は、所与の固体支持体(例えば、ビーズ)に付着した全てのバーコードで同一であることができるが、異なる固体支持体(例えばビーズ)で異なることもできる。幾つかの実施形態では、同じ細胞標識を含む同じ固体支持体のバーコードの割合は、60%、70%、80%、85%、90%、95%、97%、99%、100%、若しくはこれらの値の任意の2つの間の数字若しくは範囲又は約これらの値若しくは範囲であることができる。幾つかの実施形態では、同じ細胞標識を含む同じ固体支持体のバーコードの割合は、少なくとも又は多くとも60%、70%、80%、85%、90%、95%、97%、99%、又は100%であることができる。例えば、同じ固体支持体のバーコードの少なくとも60%は、同じ細胞標識を含むことができる。別の例として、同じ固体支持体のバーコードの少なくとも95%は、同じ細胞標識を含むことができる。
バーコードは、1つ又は複数のバーコード配列を含むことができる。幾つかの実施形態では、バーコード配列は、バーコードにハイブリダイズした標的核酸種の特定のタイプについての識別情報を提供する核酸配列を含むことができる。バーコード配列は、バーコード(例えば、標的結合領域)にハイブリダイズした標的核酸種の特定の発生のカウンタ(例えば、大まかな近似を提供する)を提供する核酸配列を含むことができる。
確率的バーコードは、1つ又は複数の分子標識を含むことができる。分子標識はバーコード配列を含むことができる。幾つかの実施形態では、分子標識は、確率的バーコードにハイブリダイズした標的核酸種の特定のタイプについての識別情報を提供する核酸配列を含むことができる。分子標識は、確率的バーコード(例えば、標的結合領域)にハイブリダイズした標的核酸種の特定の発生のカウンタを提供する核酸配列を含むことができる。
バーコードは、捕捉プローブ等の1つ又は複数の標的結合領域を含むことができる。幾つかの実施形態では、標的結合領域は、関心のある標的とハイブリダイズすることができる。幾つかの実施形態では、標的結合領域は、標的(例えば、標的核酸、標的分子、例えば、分析する細胞核酸)、例えば、特定の遺伝子配列と特異的にハイブリダイズする核酸配列を含むことができる。幾つかの実施形態では、標的結合領域は、特定の標的核酸の特定のロケーションに付着(例えば、ハイブリダイズ)することができる核酸配列を含むことができる。幾つかの実施形態では、標的結合領域は、制限酵素部位オーバーハング(例えば、EcoRI粘着末端オーバーハング)への特異的ハイブリダイズが可能な核酸配列を含むことができる。次に、バーコードは、制限部位オーバーハングに相補的な配列を含む任意の核酸分子にライゲートすることができる。
バーコードは、バーコードの配向(例えば、位置合わせ)に使用することができる1つ又は複数の配向特性を含むことができる。バーコードは、等電点電気泳動部分を含むことができる。異なるバーコードは、異なる等電点電気泳動点を含むことができる。これらのバーコードが試料に導入されると、試料は等電点電気泳動を受けて、バーコードを既知のように配向させることができる。このようにして、配向特性を使用して、試料中にバーコードの既知のマップを作成することができる。例示的な配向特性としては、電気泳動移動度(例えば、バーコードのサイズに基づく)、等電点、スピン、伝導性、及び/又は自己集合を挙げることができる。例えば、自己集合の配向特性を有するバーコードは、特定の配向(例えば、核酸ナノ構造)に自己集合することができる。
バーコードは、1つ又は複数の親和特性を含むことができる。例えば、空間標識は親和特性を含むことができる。親和特性は、別のエンティティ(例えば、細胞レセプタ)へのバーコードの結合を促進することができる化学及び/又は生物学的部分を含むことができる。例えば、親和特性は、抗体、例えば、試料上の特定の部分(例えば、レセプタ)に特異的な抗体を含むことができる。幾つかの実施形態では、抗体は、バーコードを特定の細胞タイプ又は分子にガイドすることができる。特定の細胞タイプ又は分子における及び/又はその近傍における標的は、確率的に標識することができる。親和特性は、幾つかの実施形態では、抗体はバーコードを特定のロケーションにガイドすることができるため、空間標識のヌクレオチド配列に加えて、空間情報を提供することができる。抗体は、治療用抗体、例えば、モノクローナル抗体又はポリクローナル抗体であることができる。抗体は、ヒト化又はキメラ化することができる。抗体は、裸の抗体(naked antibody)又は融合抗体(fusion antibody)であることができる。
バーコードは、1つ又は複数のユニバーサルアダプタープライマーを含むことができる。例えば、遺伝子特異確率的バーコード等の遺伝子特異的バーコードは、ユニバーサルアダプタープライマーを含むことができる。ユニバーサルアダプタープライマーとは、全てのバーコードにわたりユニバーサルなヌクレオチド配列を指すことができる。ユニバーサルアダプタープライマーは、遺伝子特異的バーコードの構築に使用することができる。ユニバーサルアダプタープライマーは、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個若しくはこれらの値の任意の2つの間の数若しくは範囲のヌクレオチド個数分の長さであることができ、又は約これらの値若しくは範囲であることができる。ユニバーサルアダプタープライマーは、少なくとも又は多くとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、又は30個のヌクレオチドの長さであることができる。ユニバーサルアダプタープライマーは、5個~30個のヌクレオチドの長さであることができる。
バーコードが2つ以上のタイプの標識(例えば、2つ以上の細胞標識又は1つの分子標識等の2つ以上のバーコード配列)を含む場合、標識間にリンカー標識配列が混じり得る。リンカー標識配列は、少なくとも約5個、約10個、約15個、約20個、約25個、約30個、約35個、約40個、約45個、約50個、又はそれよりも多くの個数のヌクレオチドの長さであることができる。リンカー標識配列は、多くとも約5個、約10個、約15個、約20個、約25個、約30個、約35個、約40個、約45個、約50個、又はそれよりも多くの個数のヌクレオチドの長さであることができる。幾つかの場合、リンカー標識配列は、12個のヌクレオチドの長さである。リンカー標識配列は、バーコードの合成を促進するのに使用することができる。リンカー標識は、誤り修正(例えば、ハミング)コードを含むことができる。
本明細書に開示される確率的バーコード等のバーコードには、幾つかの実施形態では、固体支持体を関連付けることができる。固体支持体は、例えば、合成粒子であることができる。幾つかの実施形態では、固体支持体上の複数のバーコード(例えば、第1の複数のバーコード)の確率的バーコード(例えば、第1のバーコード配列)の分子標識等のバーコード配列の幾つか又は全ては、少なくとも1つのヌクレオチド、異なる。同じ固体支持体上のバーコードの細胞標識は、同じであることができる。異なる固体支持体上のバーコードの細胞標識は、少なくとも1つのヌクレオチド、異なることができる。例えば、第1の固体支持体上の第1の複数のバーコードの第1の細胞標識は、同じ配列を有することができ、第2の固体支持体上の第2の複数のバーコードの第2の細胞標識は、同じ配列を有することができる。第1の固体支持体上の第1の複数のバーコードの第1の細胞標識及び第2の固体支持体上の第2の複数のバーコードの第2の細胞標識は、少なくとも1つのヌクレオチド、異なることができる。細胞標識は、例えば、約5個~約20個のヌクレオチド長であることができる。バーコード配列は、例えば、約5個~約20個のヌクレオチド長であることができる。合成粒子は、例えば、ビーズであることができる。
本明細書で使用される場合、基板は一種の固体支持体を指すことができる。基板は、本開示のバーコード及び確率的バーコードを含むことができ固体支持体を指すことができる。基板は、例えば、複数のマイクロウェルを含むことができる。例えば、基板は、2つ以上のマイクロウェルを含むウェルアレイであることができる。幾つかの実施形態では、マイクロウェルは、画定された容量の小型反応チャンバを含むことができる。幾つかの実施形態では、マイクロウェルは1つ又は複数の細胞を取り込むことができる。幾つかの実施形態では、マイクロウェルは、1つのみの細胞を取り込むことができる。幾つかの実施形態では、マイクロウェルは、1つ以上の固体支持体を取り込むことができる。幾つかの実施形態では、マイクロウェルは、1つのみの固体支持体を取り込むことができる。幾つかの実施形態では、マイクロウェルは、1つの細胞及び1つの固体支持体(例えば、ビーズ)を取り込む。マイクロウェルは、本開示の組合せバーコード試薬を含むことができる。
本開示は、物理的試料(例えば、組織、臓器、腫瘍、細胞)における別個のロケーションにおける別個の標的の数を推定する方法を提供する。方法は、バーコード(例えば、確率的バーコード)を試料の近傍に配置すること、試料を溶解させること、別個の標的にバーコードを関連付けること、標的を増幅すること、及び/又は標的をデジタル的にカウントすることを含むことができる。方法は、バーコード上の空間標識から得られた情報を分析し、且つ/又は視覚化することを更に含むことができる。幾つかの実施形態では、方法は、試料中の複数の標的を視覚化することを含む。複数の標的を試料のマップにマッピングすることは、試料の二次元マップ又は三次元マップを生成することを含むことができる。二次元マップ及び三次元マップは、試料中の複数の標的をバーコーディング(例えば、確率的にバーコーディング)する前又は後、生成することができる。試料中の複数の標的を視覚化することは、複数の標的を試料のマップにマッピングすることを含むことができる。複数の標的を試料のマップにマッピングすることは、試料の二次元マップ又は三次元マップを生成することを含むことができる。二次元マップ及び三次元マップは、試料中の複数の標的をバーコーディングする前又は後、生成することができる。幾つかの実施形態では、二次元マップ及び三次元マップは、試料の溶解前又は後、生成することができる。二次元マップ又は三次元マップの生成前又は後に試料を溶解させることは、試料を加熱すること、洗剤で試料に触れること、試料のpHを変更すること、又はそれらの任意の組合せを含むことができる。
本開示は、試料(例えば、細胞)を本開示の基板に接触させる方法を提供する。例えば、細胞、臓器、又は組織の薄切片を含む試料をバーコード(例えば、確率的バーコード)に接触させることができる。細胞には、例えば、細胞が沈殿し、単層を作る重力フローによって接触することができる。試料は、組織の薄切片であることができる。薄切片は、基板に配置することができる。試料は一次元であることができる(例えば、平面を形成する)。試料(例えば、細胞)は、例えば、基板上で細胞を成長させる/培養することによって基板にわたり広げることができる。
細胞及びバーコードの分配に続き、細胞を溶解して、標的分子を遊離させることができる。細胞溶解は、任意の多種多様な手段により、例えば、化学的又は生物学的手段により、浸透圧ショックにより、又は熱溶解、機械的溶解、若しくは光学溶解により達成することができる。細胞は、洗剤(例えば、SDS、リチウムドデシル硫酸、トリトンX-100、Tween-20、若しくはNP-40)、有機溶媒(例えば、メタノール若しくはアセトン)、消化酵素(例えば、プロテイナーゼK、ペプシン、若しくはトリプシン)、又はそれらの任意の組合せを含む細胞溶解バッファーの添加によって溶解することができる。標的とバーコードとの関連付けを増すために、標的分子の拡散速度は、例えば、溶解物の温度を下げ、且つ/又は溶解物の粘度を上げることによって変更することができる。
細胞の溶解及びそこからの核酸分子の遊離に続き、核酸分子に、共存下の固体支持体のバーコードをランダムに関連付けることができる。関連付けは、バーコードの標的認識領を標的核酸分子の相補部分にハイブリダイズする(例えば、バーコードのオリゴ(dT)は標的のポリ(A)テールと相互作用することができる)ことを含むことができる。ハイブリダイゼーションに使用されるアッセイ条件(例えば、バッファーpH、イオン強度、温度等)は、特定の安定したハイブリッドの形成を促進するように選ぶことができる。幾つかの実施形態では、溶解した細胞から遊離した核酸分子には、基板上の複数のプローブを関連付ける(例えば、基板のプローブとハイブリダイズする)ことができる。プローブがオリゴ(dT)を含む場合、mRNA分子をプローブにハイブリダイズさせ、逆転写することができる。オリゴヌクレオチドのオリゴ(dT)部分は、cDNA分子の第1鎖合成のプライマーとして機能することができる。例えば、図2に示されるバーコーディングの非限定的な例では、ブロック216において、mRNA分子をビーズ上のバーコードにハイブリダイズすることができる。例えば、単鎖ヌクレオチド断片をバーコードの標的結合領域にハイブリダイズすることができる。
本開示は、逆転写を使用して標的バーコード共役を作成する方法を提供する(例えば、図2のブロック224において)。標的バーコード共役は、バーコードと、標的核酸の全て又は一部の相補配列(すなわち、確率的バーコード付きcDNA分子等のバーコード付きcDNA分子)とを含むことができる。関連付けられたRNA分子の逆転写は、逆転写酵素と共に逆転写プライマーの添加により行うことができる。逆転写プライマーは、オリゴ(dT)プライマー、ランダム六塩基プライマー、又は標的特異オリゴヌクレオチドプライマーであることができる。オリゴ(dT)プライマーは、ヌクレオチド12~18個分又は約12~18個分の長さであることができ、哺乳類mRNAの3’末端における内因性ポリ(A)テールに結合することができる。ランダム六塩基プライマーは、多種多様な相補部位においてmRNAに結合することができる。標的特異オリゴヌクレオチドプライマーは通常、関心のあるmRNAを選択的にプライミングする。
1つ又は複数の核酸増幅反応(例えば、図2のブロック228における)を実行して、標識された標的核酸分子の複数のコピーを作成することができる。増幅は多重化して実行することができ、複数の標的核酸配列は同時に増幅される。増幅反応を使用して、シーケンシングアダプターを核酸分子に追加することができる。増幅反応は、試料標識が存在する場合、試料標識の少なくとも一部を増幅することを含むことができる。増幅反応は、細胞標識及び/又はバーコード配列(例えば、分子標識)の少なくとも一部を増幅することを含むことができる。増幅反応は、試料タグ、細胞標識、空間標識、バーコード(例えば、分子標識)、標的核酸、又はそれらの組合せの少なくとも一部を増幅することを含むことができる。増幅反応は、複数の核酸の0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%、又はそれらの値の任意の2つの間の範囲若しくは数字、増幅することを含むことができる。方法は、1つ又は複数のcDNA合成反応を行い、試料標識、細胞標識、空間標識、及び/又はバーコード配列(例えば、分子標識)を含む標的バーコード分子の1つ又は複数のcDNAコピーを生成することを更に含むことができる。
本明細書に開示されるのは、細胞タイプを区別する標的を識別する方法である。幾つかの実施形態では、方法は、(a)標的カウントデータ構造を受信することであって、標的カウントデータ構造は、複数の細胞の発現プロファイルを含み、複数の細胞の発現プロファイルは、複数の細胞の各細胞の複数の標的の各標的を幾つか含む、受信することと、(b)標的カウントデータ構造及び複数の細胞の発現プロファイル間の距離に基づいて、複数の細胞の発現プロファイルを階層的にクラスタリングして、複数の細胞の発現プロファイルを表す系統樹を生成することであって、系統樹は複数のノードを含み、複数のノードは、ルートノード、複数のリーフノード、及び複数の非ルート非リーフノードを含み、複数のリーフノードの各リーフノードは、複数の細胞の異なる細胞の発現プロファイルを表し、ルートノードは、複数の細胞の発現プロファイルを表す、階層的にクラスタリングして、系統樹を生成することと、(c)系統樹の複数のノードの各ノードを通して系統樹のルートノードから系統樹の複数のリーフノードまでトラバースする間、(1)ノードをノードの子ノードに分割することが有効であるか、それとも無効であるか(例えば、子ノード間の差が有意であるか否か)を判断することと、(2)ノードをノードの子ノードに分割することが無効である場合、ノードを統合クラスタセットに追加することと、(d)統合クラスタセット内の第1のノードのそれぞれについて、繰り返し、統合クラスタセット内の第1のノードと、第1のノードに最も近い統合クラスタセット内の第2のノードとの間の距離が、統合距離閾値内である場合、第1のノードを第2のノードと統合して、第1のノード及び第2のノードによって表される発現プロファイルを含む統合ノードを生成することと、(e)統合クラスタセット内のノードのそれぞれについて、ノードによって表される細胞の複数の標的の発現プロファイルに基づいて、細胞タイプを区別する標的を識別することとを含む。
D(A,B)=maxa∈A,b∈Bd(a,b) 式[2]
このブロックにおいて、完全な系統樹を得ることができる。幾つかの実施形態では、クラスタAのクラスタ内相関及びクラスタBのクラスタ内相関は、クラスタAとクラスタBとのクラスタ間相関よりも高い。クラスタAのクラスタ内相関及びクラスタBのクラスタ内相関の尺度又は指示は、クラスタAとクラスタBとのクラスタ間相関よりも高い。クラスタAのクラスタ内相関及びクラスタBのクラスタ内相関の尺度は、クラスタA及びクラスタBのクラスタ内最大相関、クラスタA及びクラスタBのクラスタ内平均相関、クラスタA及びクラスタBのクラスタ内メジアン相関、クラスタA及びクラスタBのクラスタ内最小相関、並びにそれらの任意の組合せの少なくとも1つに基づくことができる。クラスタAのクラスタ内相関は、クラスタAのクラスタ内最大相関、クラスタAのクラスタ内平均相関、クラスタAのクラスタ内メジアン相関、クラスタAのクラスタ内最小相関、及びそれらの任意の組合せの少なくとも1つに基づくことができる。クラスタBのクラスタ内相関は、クラスタBのクラスタ内最大相関、クラスタBのクラスタ内平均相関、クラスタBのクラスタ内メジアン相関、クラスタBのクラスタ内最小相関、及びそれらの任意の組合せの少なくとも1つに基づくことができる。クラスタAとクラスタBとのクラスタ間相関は、クラスタAとクラスタBとのクラスタ間最大相関、クラスタAとクラスタBとのクラスタ間平均相関、クラスタAとクラスタBとのクラスタ間メジアン相関、クラスタAとクラスタBとのクラスタ間最小相関、及びそれらの任意の組合せの少なくとも1つに基づくことができる。例えば、2つのサブクラスタのクラスタ内メジアン相関は、クラスタ間メジアン相関よりも高い値であることができる。
本明細書に開示されるのは、細胞タイプを区別する標的を識別する方法である。幾つかの実施形態では、方法は、(a)複数の細胞の発現プロファイルを受信することであって、発現プロファイルは、複数の細胞の各細胞の複数の標的の各標的を幾つか含む、受信することと、(b)複数の細胞の発現プロファイル間の距離に基づいて、複数の細胞の発現プロファイルをクラスタリングして、発現プロファイルの複数のクラスタを生成することであって、各クラスタは、(1)親クラスタ及び(2)2つ以上の子クラスタのうちの一方又は両方との1つ又は複数の関連性を有し、親クラスタは、クラスタによって表される複数の細胞の1つ又は複数の細胞の発現プロファイルを表し、クラスタは、2つ以上の子クラスタによって表される発現プロファイルを表す、クラスタリングして生成することと、(c)2つ以上の子クラスタを有する各クラスタについて、クラスタと2つ以上の子クラスタとの関連性が無効である(2つ以上の子クラスタ間の差が有意ではない)場合、クラスタを統合クラスタセットに追加することと、(d)統合クラスタセット内の第1のクラスタのそれぞれについて、統合クラスタセット内の第1のクラスタと、第1のクラスタに最も近い統合クラスタセット内の第2のクラスタとの間の距離が、統合距離閾値内である場合、繰り返し、第1のクラスタ及び第2のクラスタを統合して、統合クラスタを生成することであって、統合クラスタは、第1のクラスタ及び第2のクラスタの発現プロファイルを含む、繰り返し統合することと、(e)統合クラスタセット内の各クラスタについて、クラスタによって表される細胞の複数の標的の発現プロファイルに基づいて細胞タイプを区別する標的を識別することとを含む。
幾つかの実施形態では、異なるバーコード付き標的(例えば、確率的バーコード付き標的)の数を推定することは、標識された標的、空間標識、分子標識、試料標識、細胞標識、又はこれらの任意の産物(例えば、標識された増幅産物又は標識されたcDNA分子)の配列を特定することを含むことができる。増幅された標的はシーケンシングを受けることができる。バーコード付き標的(例えば、確率的バーコード付き標的)又はその任意の産物の配列を特定することは、シーケンシング反応を行い、試料標識、空間標識、細胞標識、分子標識、標識された標的(例えば、確率的に標識された標的)の少なくとも一部、その相補物、その逆相補物、又はそれらの任意の組合せの少なくとも一部の配列を特定することを含むことができる。
幾つかの実施形態では、複数の標的は、1つ又は複数の試料に含まれることができる。試料は、1つ若しくは複数の細胞又は1つ若しくは複数の細胞からの核酸を含むことができる。試料は、単一の細胞又は単一の細胞からの核酸であることができる。1つ又は複数の細胞は、1つ又は複数の細胞タイプのものであることができる。1つ又は複数の細胞タイプの少なくとも1つは、脳細胞、心臓細胞、がん細胞、循環腫瘍細胞、臓器細胞、上皮細胞、転移細胞、良性細胞、初代細胞、循環細胞、又はそれらの任意の組合せであることができる。
本開示は、本開示の方法(例えば、方法400又は方法600)を実施するようにプログラムされたコンピュータシステムを提供する。図7は、本明細書に開示される任意の方法を実施するようにプログラム又は他の方法で構成されたコンピュータシステム700を示す。コンピュータシステム700は、ユーザの電子デバイス又は電子デバイスからリモートに配置されたコンピュータシステムであることができる。電子デバイスは、モバイル電子デバイスであることができる。
再帰的な系統樹の分割及び検定、それに続く統合によるクラスタリング
この実施例では、再帰的な分割(例えば、再帰的系統樹分割)及び検定、それに続く統合によるクラスタリング法を説明する。
この実施例に示される方法では、系統樹分割ステップ中、アルゴリズムが、十分に低いp値(又は十分に高い-log10(p値))を達成した少なくとも1つの遺伝子を発見することができる場合、分割は生物学的に適切であると見なされる(例えば、デフォルトにより)。言い換えれば、幾つかの実施形態では、調整すべきハイパーパラメータは、スコア閾値パラメータだけである。スコア閾値が高い(例えば、100)ほど、低いp値(10e-100)に対応し、これは、分割が有効であると見なされるためには、より有意な遺伝子を見つけなければならないことを意味する。スコア閾値が高いほど、少数のクラスタが生成される。
モジュールは以下の依存性を有した-numpy(1.10.4)-scipy(0.17.0)-matplotlib(1.5.1)-sklearn(0.17.1)-networkx(1.11)-community-rpy2(2.8.2)。
%load_ext autoreload
%autoreload2
%matplotlib inline
from dendrosplit import split,merge import pickle
import numpy as np
import matplotlib.pyplot as plt np.set_printoptions(precision=2,suppress=True)
パイプラインへの入力は、「X」と呼ばれる分子カウント(自然数)のN×Mマトリックスである。「genes」は、遺伝子名の長さMリストである。「x1」及び「x2」は、何であれユーザが選んだ方法を使用したデータの2D埋め込みを表す。「x1」及び「x2」は、中間ステップと共にパイプラインの結果を視覚化するために単独で使用される。アルゴリズムでは、合算して0になる「X」の全列が除去される必要があり、この細胞のコードがそれに対処する。
dataset=’Resolve4’
pickledir=’/Users/user1/Desktop/datasets/’
X,genes=pickle.load(file(pickledir+dataset+’.pickle’))
x1,x2=pickle.load(file(pickledir+dataset+’tsne.pickle’))
#合計で0になるXの列を削除
X,genes=split.filter_genes(X,genes)
全細胞にわたり0を超えるカウントを有する19307個の遺伝子を保持
D=split.log_correlation(X)
ys,shistory=split.dendrosplit((D,X),preprocessing=’precomputed’, score_threshold=10,verbose=True,disband_percentile=50)
潜在的な分割結果:883及び3
dendrosplit/feature selection.py:106:RuntimeWarning:log10において直面したゼロで除算
gene_scores=np.nan_to_num(-np.log10(p[keep_inds]))
分割スコア1.8E+308
潜在的な分割結果:1及び882
潜在的な分割結果:484及び398
/Users/user1/anaconda2/lib/python2.7/site-packages/scipy/stats/
_distn_infrastructure.py:1748:Runtime
cond1=(scale>0)&(x>self.a)&(x<self.b)
/Users/user1/anaconda2/lib/python2.7/site-packages/scipy/stats/_distn_infrastructure.py:1748: Runtime
cond1=(scale>0)&(x>self.a)&(x<self.b)
/Users/user1/anaconda2/lib/python2.7/site-packages/scipy/stats/_distn_infrastructure.py:1749: Runtime
cond2=cond0&(x<=self.a)
分割スコア182.26
潜在的な分割結果:481及び3分割スコア1.8E+308
潜在的な分割結果:1及び480
潜在的な分割結果:1及び479
潜在的な分割結果:195及び284
分割スコア125.49
潜在的な分割結果:177及び18
分割スコア15.35
潜在的な分割結果:1及び176
潜在的な分割結果:1及び175
潜在的な分割結果:1及び174
潜在的な分割結果:12及び162
分割スコア18.88
潜在的な分割結果:1及び11
潜在的な分割結果:1及び10
潜在的な分割結果:2及び8
分割スコア6.11
潜在的な分割結果:1及び161
潜在的な分割結果:1及び160
潜在的な分割結果:28及び132
分割スコア12.32
潜在的な分割結果:25及び3
分割スコア13.94
潜在的な分割結果:1及び24
潜在的な分割結果:11及び13
分割スコア4.77
潜在的な分割結果:1及び2
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:122及び10
分割スコア18.52
潜在的な分割結果:13及び109
分割スコア24.92
潜在的な分割結果:6及び7
分割スコア3.77
潜在的な分割結果:105及び4
分割スコア31.72
潜在的な分割結果:15及び90
分割スコア11.31
潜在的な分割結果:3及び12
分割スコア6.55
潜在的な分割結果:17及び73
分割スコア8.91
潜在的な分割結果:2及び2
分割スコア1.58
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:2及び8
分割スコア5.79
潜在的な分割結果:1及び17
潜在的な分割結果:1及び16
潜在的な分割結果:1及び15
潜在的な分割結果:4及び11
分割スコア4.57
潜在的な分割結果:1及び283
潜在的な分割結果:1及び282
潜在的な分割結果:1及び281
潜在的な分割結果:271及び10
分割スコア38.04
潜在的な分割結果:2及び269
分割スコア233.23
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:1及び268
潜在的な分割結果:265及び3
分割スコア80.24
潜在的な分割結果:4及び261
分割スコア100.26
潜在的な分割結果:1及び3
潜在的な分割結果:1及び2
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:192及び69
分割スコア9.66
潜在的な分割結果:1及び2
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:2及び8
分割スコア5.12
潜在的な分割結果:1及び2
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:1及び397
潜在的な分割結果:1及び396
潜在的な分割結果:1及び395
潜在的な分割結果:392及び3
分割スコア228.58
潜在的な分割結果:1及び391
潜在的な分割結果:1及び390
潜在的な分割結果:1及び389
潜在的な分割結果:1及び388
潜在的な分割結果:1及び387
潜在的な分割結果:1及び386
潜在的な分割結果:32及び354
分割スコア33.24
潜在的な分割結果:1及び31
潜在的な分割結果:1及び30
潜在的な分割結果:21及び9
分割スコア7.20
潜在的な分割結果:1及び353
潜在的な分割結果:1及び352
潜在的な分割結果:1及び351
潜在的な分割結果:19及び332
分割スコア32.86
潜在的な分割結果:1及び18
潜在的な分割結果:3及び15
分割スコア8.90
潜在的な分割結果:6及び326
分割スコア83.57
潜在的な分割結果:1及び5
潜在的な分割結果:1及び4
潜在的な分割結果:2及び2
分割スコア1.32
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:3及び323
分割スコア148.25
潜在的な分割結果:1及び2
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:314及び9
分割スコア71.43
潜在的な分割結果:221及び93
分割スコア48.70
潜在的な分割結果:1及び220
潜在的な分割結果:1及び219
潜在的な分割結果:1及び218
潜在的な分割結果:1及び217
潜在的な分割結果:215及び2
分割スコア133.42
潜在的な分割結果:166及び49
分割スコア7.64
潜在的な分割結果:1及び1
潜在的な分割結果:40及び53
分割スコア9.31
潜在的な分割結果:4及び5
分割スコア3.20
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:1及び2
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)潜在的な分割結果:1及び2
潜在的な分割結果:1及び1
解散(クラスタ内のポイントは互いから離れすぎている)
スコア関数が呼び出された回数:40
合計計算時間は9.532秒であった。
ym,mhistory=merge.dendromerge((D,X),ys,score_threshold=10,preprocessing=’precomputed’,verbose=True,outlier_threshold_percentile=90)
外れ値閾値は0.51である。
821の最近傍:クラスタ76中の72(D=0.375)
661の最近傍:クラスタ76中の29(D=0.379)
729の最近傍:クラスタ76中の281(D=0.381)
559の最近傍:クラスタ76中の79(D=0.381)
690の最近傍:クラスタ76中の171(D=0.381)
564の最近傍:クラスタ76中の79(D=0.381)
776の最近傍:クラスタ38中の474(D=0.387)
860の最近傍:クラスタ38中の340(D=0.390)
816の最近傍:クラスタ78中の379(D=0.390)
787の最近傍:クラスタ38中の63(D=0.391)
737の最近傍:クラスタ76中の72(D=0.392)
874の最近傍:クラスタ76中の220(D=0.392)
743の最近傍:クラスタ76中の72(D=0.394)
877の最近傍:クラスタ76中の174(D=0.394)
753の最近傍:クラスタ76中の190(D=0.397)
774の最近傍:クラスタ38中の158(D=0.398)
565の最近傍:クラスタ76中の190(D=0.399)
785の最近傍:クラスタ76中の79(D=0.401)
706の最近傍:クラスタ18中の101(D=0.403)
829の最近傍:クラスタ38中の213(D=0.404)
701の最近傍:クラスタ76中の179(D=0.404)
770の最近傍:クラスタ38中の453(D=0.404)
630の最近傍:クラスタ76中の79(D=0.406)
866の最近傍:クラスタ38中の87(D=0.407)
795の最近傍:クラスタ76中の159(D=0.407)
865の最近傍:クラスタ76中の179(D=0.407)
869の最近傍:クラスタ18中の101(D=0.409)
830の最近傍:クラスタ38中の165(D=0.412)
851の最近傍:クラスタ76中の29(D=0.412)
782の最近傍:クラスタ76中の50(D=0.412)
627の最近傍:クラスタ76中の72(D=0.412)
848の最近傍:クラスタ76中の83(D=0.413)
883の最近傍:クラスタ12中の687(D=0.413)
793の最近傍:クラスタ76中の107(D=0.414)
631の最近傍:クラスタ18中の101(D=0.416)
720の最近傍:クラスタ18中の101(D=0.418)
885の最近傍:クラスタ18中の101(D=0.418)
813の最近傍:クラスタ18中の101(D=0.419)
788の最近傍:クラスタ38中の278(D=0.420)
748の最近傍:クラスタ18中の101(D=0.422)
762の最近傍:クラスタ38中の158(D=0.423)
804の最近傍:クラスタ18中の177(D=0.425)
854の最近傍:クラスタ18中の101(D=0.426)
605の最近傍:クラスタ76中の159(D=0.437)
849の最近傍:クラスタ18中の101(D=0.437)
835の最近傍:クラスタ18中の101(D=0.438)
790の最近傍:クラスタ76中の32(D=0.442)
744の最近傍:クラスタ38中の188(D=0.448)
822の最近傍:クラスタ38中の282(D=0.449)
723の最近傍:クラスタ76中の170(D=0.456)
884の最近傍:クラスタ18中の101(D=0.459)
563の最近傍:クラスタ76中の34(D=0.463)
867の最近傍:クラスタ18中の160(D=0.463)
771の最近傍:クラスタ76中の34(D=0.473)
826の最近傍:クラスタ38中の165(D=0.475)
777の最近傍:クラスタ76中の174(D=0.478)
759の最近傍:クラスタ18中の101(D=0.483)
855の最近傍:クラスタ18中の101(D=0.485)
702の最近傍:クラスタ18中の160(D=0.492)
750の最近傍:クラスタ76中の230(D=0.495)
704の最近傍:クラスタ78中の216(D=0.497)
711の最近傍:クラスタ76中の55(D=0.502)
708の最近傍:クラスタ78中の537(D=0.510)
791の最近傍:クラスタ76中の115(D=0.534)
722の最近傍:クラスタ76中の15(D=0.547)
700の最近傍:クラスタ76中の107(D=0.549)
846の最近傍:クラスタ76中の72(D=0.552)
876の最近傍:クラスタ76中の85(D=0.560)
868の最近傍:クラスタ78中の740(D=0.562)
569の最近傍:クラスタ76中の68(D=0.572)
817の最近傍:クラスタ76中の56(D=0.582)
798の最近傍:クラスタ38中の310(D=0.585)
717の最近傍:クラスタ78中の216(D=0.597)
879の最近傍:クラスタ76中の209(D=0.612)
727の最近傍:クラスタ76中の96(D=0.616)
828の最近傍:クラスタ38中の142(D=0.618)
840の最近傍:クラスタ78中の632(D=0.640)
747の最近傍:クラスタ76中の202(D=0.698)
842の最近傍:クラスタ38中の797(D=0.703)
442の最近傍:クラスタ78中の336(D=0.735)
割り当てられたシングルトン(0.052s)
生成されたDc(13.181s)
統合前:14クラスタ
距離3.60を有する標識0(N=10)と6(N=15)とを統合
統合前:13クラスタ
距離4.31を有する標識2(N=15)と4(N=10)とを統合 統合前:12クラスタ
距離4.37を有する標識1(N=13)と11(N=25)とを統合 統合前:11クラスタ
距離5.23を有する標識0(N=25)と10(N=38)とを統合 統合前:10クラスタ
距離6.04を有する標識3(N=30)と7(N=95)とを統合 統合前:9クラスタ
距離6.81を有する標識2(N=10)と5(N=2)とを統合 統合前:8クラスタ
距離7.19を有する標識4(N=25)と5(N=63)とを統合 統合前:7クラスタ
距離7.23を有する標識2(N=18)と5(N=12)とを統合 統合前:6クラスタ
距離9.76を有する標識3(N=125)と5(N=30)とを統合 クラスタの統合に25.977sかかった。
821の最近傍:クラスタ76中の72(D=0.375)
661の最近傍:クラスタ76中の29(D=0.379)
729の最近傍:クラスタ76中の281(D=0.381)
559の最近傍:クラスタ76中の79(D=0.381)
690の最近傍:クラスタ76中の171(D=0.381)
564の最近傍:クラスタ76中の79(D=0.381)
776の最近傍:クラスタ38中の474(D=0.387)
860の最近傍:クラスタ38中の340(D=0.390)
816の最近傍:クラスタ78中の379(D=0.390)
787の最近傍:クラスタ38中の63(D=0.391)
737の最近傍:クラスタ76中の72(D=0.392)
874の最近傍:クラスタ76中の220(D=0.392)
743の最近傍:クラスタ76中の72(D=0.394)
877の最近傍:クラスタ76中の174(D=0.394)
753の最近傍:クラスタ76中の190(D=0.397)
774の最近傍:クラスタ38中の158(D=0.398)
565の最近傍:クラスタ76中の190(D=0.399)
785の最近傍:クラスタ76中の79(D=0.401)
706の最近傍:クラスタ18中の101(D=0.403)
829の最近傍:クラスタ38中の213(D=0.404)
701の最近傍:クラスタ76中の179(D=0.404)
770の最近傍:クラスタ38中の453(D=0.404)
630の最近傍:クラスタ76中の79(D=0.406)
866の最近傍:クラスタ38中の87(D=0.407)
795の最近傍:クラスタ76中の159(D=0.407)
865の最近傍:クラスタ76中の179(D=0.407)
869の最近傍:クラスタ18中の101(D=0.409)
830の最近傍:クラスタ38中の165(D=0.412)
851の最近傍:クラスタ76中の29(D=0.412)
782の最近傍:クラスタ76中の50(D=0.412)
627の最近傍:クラスタ76中の72(D=0.412)
848の最近傍:クラスタ76中の83(D=0.413)
883の最近傍:クラスタ12中の687(D=0.413)
793の最近傍:クラスタ76中の107(D=0.414)
631の最近傍:クラスタ18中の101(D=0.416)
720の最近傍:クラスタ18中の101(D=0.418)
885の最近傍:クラスタ18中の101(D=0.418)
813の最近傍:クラスタ18中の101(D=0.419)
788の最近傍:クラスタ38中の278(D=0.420)
748の最近傍:クラスタ18中の101(D=0.422)
762の最近傍:クラスタ38中の158(D=0.423)
804の最近傍:クラスタ18中の177(D=0.425)
854の最近傍:クラスタ18中の101(D=0.426)
605の最近傍:クラスタ76中の159(D=0.437)
849の最近傍:クラスタ18中の101(D=0.437)
835の最近傍:クラスタ18中の101(D=0.438)
790の最近傍:クラスタ76中の32(D=0.442)
744の最近傍:クラスタ38中の188(D=0.448)
822の最近傍:クラスタ38中の282(D=0.449)
723の最近傍:クラスタ76中の170(D=0.456)
884の最近傍:クラスタ18中の101(D=0.459)
563の最近傍:クラスタ76中の34(D=0.463)
867の最近傍:クラスタ18中の160(D=0.463)
771の最近傍:クラスタ76中の34(D=0.473)
826の最近傍:クラスタ38中の165(D=0.475)
777の最近傍:クラスタ76中の174(D=0.478)
759の最近傍:クラスタ18中の101(D=0.483)
855の最近傍:クラスタ18中の101(D=0.485)
702の最近傍:クラスタ18中の160(D=0.492)
750の最近傍:クラスタ76中の230(D=0.495)
704の最近傍:クラスタ78中の216(D=0.497)
711の最近傍:クラスタ76中の55(D=0.502)
708の最近傍:クラスタ78中の537(D=0.510)
791の最近傍:クラスタ76中の115(D=0.534)
722の最近傍:クラスタ76中の15(D=0.547)
700の最近傍:クラスタ76中の107(D=0.549)
846の最近傍:クラスタ76中の72(D=0.552)
876の最近傍:クラスタ76中の85(D=0.560)
868の最近傍:クラスタ78中の740(D=0.562)
569の最近傍:クラスタ76中の68(D=0.572)
817の最近傍:クラスタ76中の56(D=0.582)
798の最近傍:クラスタ38中の310(D=0.585)
717の最近傍:クラスタ78中の216(D=0.597)
879の最近傍:クラスタ76中の209(D=0.612)
727の最近傍:クラスタ76中の96(D=0.616)
828の最近傍:クラスタ38中の142(D=0.618)
840の最近傍:クラスタ78中の632(D=0.640)
747の最近傍:クラスタ76中の202(D=0.698)
842の最近傍:クラスタ38中の797(D=0.703)
442の最近傍:クラスタ78中の336(D=0.735)
割り当てられたシングルトン(0.054s)
生成されたDc(12.773s)
14のノード及び24のエッジを有するグラフが構築された(12.774s)
クラスタの統合に12.775sかかった。
系統樹の再帰的な分割及び検定、それに続く統合によるクラスタリングの結果の視覚化
この実施例では、実施例1に示された系統樹の再帰的な分割及び検定、それに続く統合によるクラスタリングの結果の視覚化について説明する。
_=plt.axis(’off’)
plt.title(’Pre-clustering’)
#事前統合標識(標識シングルトン)を使用したクラスタリング結果
plt.figure()
split.plot_labels_legend(x1,x2,split.str_labels_to_ints(ys))
plt.title(’After splitting step’)
#統合後標識を使用したクラスタリング結果
plt.figure()
split.plot_labels_legend(x1,x2,ym)
plt.title(’After merging step’)
#統合後標識を使用したクラスタリング結果
plt.figure()
split.plot_labels_legend(x1,x2,ym_community)
plt.title(’After merging step using community detection’)
Out[6]:<matplotlib.text.Text at 0x112674510>
「print_history」関数を使用して、方法の分割ステップがいかに、「print_history」関数を使用してデータセットを取り扱うかを探ることができる。行iはi番目の有効分割を記述する。分割は、生成された両クラスタが「min_clust_size」を上回り、分割から生成された最低p値が閾値を下回る場合、有効と見なされる。
事前分割:886 L:883 R:3 スコア:1.8E+308 トップ遺伝子:RPL31 トップ遺伝子スコア:1.8E+308
事前分割:882 L:484 R:398 スコア:182.26 トップ遺伝子:FTL トップ遺伝子スコア:182.26
事前分割:484 L:481 R:3 スコア:1.8E+308 トップ遺伝子:RPL23 トップ遺伝子スコア:1.8E+308
事前分割:479 L:195 R:284 スコア:125.49 トップ遺伝子:IGHM トップ遺伝子スコア:125.49
事前分割:195 L:177 R:18 スコア:15.35 トップ遺伝子:RRP7A トップ遺伝子スコア:15.35
事前分割:174 L:12 R:162 スコア:18.88 トップ遺伝子:ANXA11 トップ遺伝子スコア:18.88
事前分割:160 L:28 R:132 スコア:12.32 トップ遺伝子:TTF1 トップ遺伝子スコア:12.32
事前分割:28 L:25 R:3 スコア:13.94 トップ遺伝子:SRPK1 トップ遺伝子スコア:13.94
事前分割:132 L:122 R:10 スコア:18.52 トップ遺伝子:TOP2A トップ遺伝子スコア:18.52
事前分割:122 L:13 R:109 スコア:24.92 トップ遺伝子:CACYBP トップ遺伝子スコア:24.92
事前分割:109 L:105 R:4 スコア:31.72 トップ遺伝子:RPSA トップ遺伝子スコア:31.72
事前分割:105 L:15 R:90 スコア:11.31 トップ遺伝子:PSMD14 トップ遺伝子スコア:11.31
事前分割:281 L:271 R:10 スコア:38.04 トップ遺伝子:RNASEH2B トップ遺伝子スコア:38.04
事前分割:271 L:2 R:269 スコア:233.23 トップ遺伝子:GAS8 トップ遺伝子スコア:233.23
事前分割:268 L:265 R:3 スコア:80.24 トップ遺伝子:CNPY3 トップ遺伝子スコア:80.24
事前分割:265 L:4 R:261 スコア:100.26 トップ遺伝子:MZB1 トップ遺伝子スコア:100.26
事前分割:395 L:392 R:3 スコア:228.58 トップ遺伝子:CREB3L1 トップ遺伝子スコア:228.58
事前分割:386 L:32 R:354 スコア:33.24 トップ遺伝子:VMP1 トップ遺伝子スコア:33.24
事前分割:351 L:19 R:332 スコア:32.86 トップ遺伝子:EIF2B1 トップ遺伝子スコア:32.86
事前分割:332 L:6 R:326 スコア:83.57 トップ遺伝子:NUDT5 トップ遺伝子スコア:83.57
事前分割:326 L:3 R:323 スコア:148.25 トップ遺伝子:TMSB4X トップ遺伝子スコア:148.25
事前分割:323 L:314 R:9 スコア:71.43 トップ遺伝子:C12orf57 トップ遺伝子スコア:71.43
事前分割:314 L:221 R:93 スコア:48.70 トップ遺伝子:RPL27A トップ遺伝子スコア:48.70
事前分割:217 L:215 R:2 スコア:133.42 トップ遺伝子:JUN トップ遺伝子スコア:133.42
/Users/user1/anaconda2/lib/python2.7/site-packages/matplotlib/pyplot.py:516: RuntimeWarning: More max open warning, RuntimeWarning)
split_num=5
cluster_of_interest=None
show_background=False
split.analyze_split(X,x1,x2,genes,shistory,split_num,num_genes=12,
show_background=show_background,clust=cluster_of_interest)
分割がいかに決定されたかを探るための関数を使用して、統合がいかに実行されたかを探ることができる。
split.visualize_history(np.log(1+X),x1,x2,genes,mhistory)
886の試料のうち80はシングルトンである
シングルトン442,569,700,708,717,722,727,747,791,798,817,828,840,842,846,868,876,879 m
シングルトン15はクラスタ12(N=24)と統合されて、クラスタ1(N=25)を形成した
シングルトン3,4,6,7,9,10,11,13,14,19,20,21,22,24,25,26はクラスタ18(N=90)と統合された
シングルトン5,29,30,31,32,33,34,35,36,37,39,40,41はクラスタ38(N=261)と統合されて、シングルトン28,53,55,56,58,59,60,61,63,64,65,67,68,69,70,71,72,73,74,75,79,80,81を形成した
シングルトン54,66はクラスタ78(N=93)と統合されて、クラスタ13(N=95)を形成した
統合後:25 L:10 R:15 スコア:3.60 トップ遺伝子:ENOSF1 トップ遺伝子スコア:3.60
統合後:25 L:15 R:10 スコア:4.31 トップ遺伝子:MAGED1 トップ遺伝子スコア:4.31
統合後:38 L:13 R:25 スコア:4.37 トップ遺伝子:PRPF40A トップ遺伝子スコア:4.37
統合後:63 L:25 R:38 スコア:5.23 トップ遺伝子:ALDOC トップ遺伝子スコア:5.23
統合後:125 L:30 R:95 スコア:6.04 トップ遺伝子:PARP1 トップ遺伝子スコア:6.04
統合後:12 L:10 R:2 スコア:6.81 トップ遺伝子:IGLC3 トップ遺伝子スコア:6.81
統合後:88 L:25 R:63 スコア:7.19 トップ遺伝子:HMGB2 トップ遺伝子スコア:7.19
統合後:30 L:18 R:12 スコア:7.23 トップ遺伝子:VIM トップ遺伝子スコア:7.23
統合後:155 L:125 R:30 スコア:9.76 トップ遺伝子:HMGN5 トップ遺伝子スコア:9.76
merge_num=2
cluster_of_interest=None
show_background=False
split.analyze_split(X,x1,x2,genes,mhistory,merge_num,num_genes=4,
show_background=show_background,clust=cluster_of_interest)
モジュールは、2種類の単純な差次的発現分析を可能にする。第1の種類は、各クラスタのone-v-rest比較を行い、各遺伝子のt検定に従って各クラスタの最も重要な遺伝子を視覚化する。第2の種類は、クラスタの2つのあらゆるペアに対してペア毎比較を行う。
dendrosplit/utils.py:39:FutureWarning:要素毎の比較失敗;代わりにスカラーを返すが,しかし、plt.plot(x1[y==i],x2[y==i],’.’,c=RGBs[j],label=str(i)+’(’+str(np.sum(y==i))+’)’)において
dendrosplit/feature selection.py:221:RuntimeWarning:二重スカラーフォールドで直面したゼロで除算=g mean j/g mean i
モジュールは、ユーザが各クラスタ内の距離の分布の視覚化をできるようにもする。所与のクラスタについて、この関数は、ペア毎距離の組全体の各パーセンタイルビンのペア毎距離(クラスタ内の点間の)の割合をプロットする。例えば、1における0.3は、ペア毎距離の30%が、全体距離の5パーセンタイルと10パーセンタイルとの間にあることを示す。この関数を使用し、凝集したクラスタがいかに元の距離マトリックスに従うかの感覚を得る。直観的に、良好なクラスタは、全ての互いに近い点を有するはずである。例えば、下部の10個のビン(すなわち、下部50パーセンタイル)内に距離を有さないクラスタは、不良と見なされる。予期されるように、これは、外れ値を含む以下のクラスタ「-1」の場合であることに留意する。
モジュールは、ユーザが系統樹を生成し、系統樹に従って細胞の順序を得られるようにすることもできる。系統樹は、iPython notebookで見ることが難しいことがある。幾つかの実施形態では、系統樹は、以下に示されるように保存することができる。ユーザは、クラスタ標識(「標識」キーワード)において供給することができる。所望の場合、この関数は、クラスタ内の全試料の名称を同じ色にすることができる。
dendrosplit/split.py:233:FutureWarning:
「None」との比較は、標識が「!」である場合、要素毎のオブジェクト比較に繋がる
=None:
系統樹の再帰的な分割及び検定、それに続く統合によるクラスタリングのパラメータ掃引
この実施例は、再帰的な分割及び検定、それに続く統合に向けてパラメータを最適化するパラメータ掃引について説明する。
score_threshold=2,verbose=False,disband_percentile=50)
ys_sweep=[]
thresholds=range(5,100,5)
for threshold in thresholds:
ys_sweep.append(split.get_clusters_from_history(D,shistory,threshold,50))
plt.figure()
split.plot_labels_legend(x1,x2,split.str_labels_to_ints(ys_sweep[-1]))
plt.title(’Clustering result using a threshold of%.3f’%(threshold))
return sum([1 for i in np.unique(y) if np.sum(y==i)!=1])
plt.plot(thresholds,[count_nonsingleton_clusters(i) for i in ys_sweep])
plt.grid()
plt.xlabel(’thresholds (-log10(p-value))’)
plt.ylabel(’number of nonsingletone clusters’)
Out[17]:<matplotlib.text.Text at 0x117fb3290>
系統樹の再帰的な分割及び検定、それに続く統合によるクラスタリング
この実施例は、再帰的な分割(例えば、再帰的な系統樹の分割)及び検定、それに続く統合によるクラスタリング法を説明する。この実施例において、系統樹の各クラスタ又はノードにおいて(リーフノードを除く)、2つのサブクラスタのクラスタ内メジアン相関は、クラスタ間メジアン相関よりも高かった。
本発明のまた別の態様は、以下のとおりであってもよい。
〔1〕細胞タイプを区別する標的を識別する方法であって、
(a)標的カウントデータ構造を受信することであって、前記標的カウントデータ構造は、複数の細胞の発現プロファイルを含み、前記複数の細胞の前記発現プロファイルは、前記複数の細胞の各細胞の複数の標的の各標的を幾つか含む、受信することと、
(b)前記標的カウントデータ構造及び前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の発現プロファイルを階層的にクラスタリングして、前記複数の細胞の前記発現プロファイルを表す系統樹を生成することであって、前記系統樹は複数のノードを含み、前記複数のノードは、ルートノード、複数のリーフノード、及び複数の非ルート非リーフノードを含み、前記複数のリーフノードの各リーフノードは、前記複数の細胞の異なる細胞の発現プロファイルを表し、前記ルートノードは、前記複数の細胞の発現プロファイルを表す、階層的にクラスタリングして、系統樹を生成することと、
(c)前記系統樹の前記複数のノードの各ノードを通して前記系統樹の前記ルートノードから前記系統樹の前記複数のリーフノードまでトラバースする間、
(1)前記ノードを前記ノードの子ノードに分割することが有効であるか、それとも無効であるかを判断することと、
(2)前記ノードを前記ノードの子ノードに分割することが無効である場合、前記ノードを統合クラスタセットに追加することと、
(d)前記統合クラスタセット内の第1のノードのそれぞれについて、繰り返し、
前記統合クラスタセット内の前記第1のノードと、前記第1のノードに最も近い前記統合クラスタセット内の第2のノードとの間の距離が、統合距離閾値内である場合、前記第1のノードを前記第2のノードと統合して、前記第1のノード及び前記第2のノードによって表される発現プロファイルを含む統合ノードを生成することと、
(e)前記統合クラスタセット内のノードのそれぞれについて、前記ノードによって表される細胞の前記複数の標的の発現プロファイルに基づいて、細胞タイプを区別する標的を識別することと、
を含む、方法。
〔2〕前記標的カウントデータ構造は、標的カウントマトリックスを含む、前記〔1〕に記載の方法。
〔3〕前記標的カウントマトリックスの各行又は各列は、前記複数の細胞の異なる個々の細胞の複数の標的の各標的を幾つか含む、前記〔2〕に記載の方法。
〔4〕前記複数のリーフノード及び前記複数の非ルート非リーフノードのそれぞれには、親ノードが関連付けられ、
前記ルートノード及び前記複数の非ルート非リーフノードのそれぞれには、左子ノード及び右子ノードが関連付けられ、前記ルートノード及び前記複数の非ルート非リーフノードのそれぞれは、前記ノードの前記左子ノード及び前記右子ノードによって表される発現プロファイルを表す、前記〔1〕に記載の方法。
〔5〕(a)において、前記標的カウントデータ構造を受信する前、
(f)複数のバーコードを使用して前記複数の細胞内の前記複数の標的をバーコーディングして、複数のバーコード付き標的を作成することであって、前記複数のバーコードのそれぞれは、細胞標識及び分子標識を含み、異なる細胞の標的から作成されるバーコード付き標的は、異なる細胞標識を有し、前記複数の細胞の1つの細胞の標的から作成されるバーコード付き標的は、異なる分子標識を有する、バーコーディングして複数のバーコード付き標的を作成することと、
(g)前記複数のバーコード付き標的の配列データを取得することと、
(h)前記複数の細胞のそれぞれについて、
(1)前記細胞の前記配列データ内の前記複数の標的の各標的に関連付けられた別個の配列を有する分子標識の数をカウントすることと、
(2)(h)(1)においてカウントされた前記配列データ内の前記標的に関連付けられた別個の配列を有する分子標識の数に基づいて、前記細胞の前記複数の標的の各標的の数を推定することと
を含む、前記〔1〕~〔4〕のいずれか一項に記載の方法。
〔6〕前記標的カウントデータ構造を受信することは、
(h)(2)において推定された前記細胞の前記複数の標的の各標的の数から、標的カウントデータ構造を生成することであって、前記複数の細胞のうちの前記細胞の前記発現プロファイルは、(h)(2)において推定された前記細胞の前記複数の標的の各標的の数を含む、生成することを含む、前記〔5〕に記載の方法。
〔7〕(b)において、前記標的カウントデータ構造及び前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルを階層的にクラスタリングして、前記複数の細胞の前記発現プロファイルを表す前記系統樹を生成する前、
(i)前記標的カウントデータ構造の要素の距離データ構造を特定することであって、前記距離データ構造は、前記複数の細胞の前記発現プロファイル間の距離を含む、特定すること
を含む、前記〔1〕~〔6〕のいずれか一項に記載の方法。
〔8〕前記距離データ構造は距離マトリックスを含む、前記〔7〕に記載の方法。
〔9〕前記距離マトリックスの各対角線要素は0の値を有する、前記〔8〕に記載の方法。
〔10〕(b)において、前記標的カウントデータ構造及び前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルを階層的にクラスタリングして、前記複数の細胞の前記発現プロファイルを表す前記系統樹を生成することは、前記標的カウントデータ構造及び前記距離データ構造に基づいて、前記複数の細胞の前記発現プロファイルを階層的にクラスタリングすることを含む、前記〔7〕~〔9〕のいずれか一項に記載の方法。
〔11〕前記複数の細胞の前記発現プロファイル間の前記距離は、前記複数の細胞の前記発現プロファイル間のペア毎の相関距離を含む、前記〔7〕~〔10〕のいずれか一項に記載の方法。
〔12〕(i)において前記標的カウントデータ構造の要素の距離データ構造を特定する前、前記標的カウントデータ構造を対数変換して、対数変換済み標的カウントデータ構造にすることを含み、
前記標的カウントデータ構造の要素の前記距離データ構造を特定することは、前記対数変換済み標的カウントデータ構造の前記距離データ構造を特定することを含み、
(b)において、前記標的カウントデータ構造及び前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルを階層的にクラスタリングすることは、前記対数変換済み標的カウントデータ構造及び前記距離データ構造に基づいて前記複数の細胞の前記発現プロファイルを階層的にクラスタリングして、前記系統樹を生成することを含む、前記〔7〕~〔11〕のいずれか一項に記載の方法。
〔13〕前記標的カウントデータ構造を前記対数変換済み標的カウントデータ構造に対数変換することは、前記標的カウントデータ構造の各要素の値を増分によって増大させることを含む、前記〔12〕に記載の方法。
〔14〕前記増分は1である、前記〔13〕に記載の方法。
〔15〕(b)において、前記標的カウントデータ構造及び前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルを階層的にクラスタリングすることは、
前記複数の細胞の各発現プロファイルを異なるリーフノードに割り当てることと、
前記第2のノードが前記第1のノードへの前記複数のノードの最近傍ノードである場合、前記複数のノードの前記第1のノード及び前記第2のノードを繰り返し結合して、前記第1のノード及び前記第2のノードの親ノードを生成することと、
を含む、前記〔1〕~〔14〕のいずれか一項に記載の方法。
〔16〕前記第1のノードと前記第2のノードとの間の前記距離は、前記第1のノードによって表される発現プロファイルを有する任意の細胞と、前記第2のノードによって表される発現プロファイルを有する任意の細胞との間の最大距離である、前記〔15〕に記載の方法。
〔17〕前記第1のノードのノード内相関及び前記第2のノードのノード内相関の少なくとも一方は、前記第1のノードと前記第2のノードとのノード間相関よりも高い、前記〔15〕又は〔16〕に記載の方法。
〔18〕前記第1のノードのノード内相関及び前記第2のノードのノード内相関の指示は、前記第1のノードと前記第2のノードとのノード間相関よりも高い、前記〔15〕又は〔16〕に記載の方法。
〔19〕前記第1のノードのノード内相関及び前記第2のノードのノード内相関の指示は、
前記第1のノード及び前記第2のノードのノード内最大相関、
前記第1のノード及び前記第2のノードのノード内平均相関、
前記第1のノード及び前記第2のノードのノード内メジアン相関、
前記第1のノード及び前記第2のノードのノード内最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔18〕に記載の方法。
〔20〕前記第1のノードの前記ノード内相関は、
前記第1のノードのノード内最大相関、
前記第1のノードのノード内平均相関、
前記第1のノードのノード内メジアン相関、
前記第1のノードのノード内最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔17〕~〔19〕のいずれか一項に記載の方法。
〔21〕前記第2のノードの前記ノード内相関は、
前記第2のノードのノード内最大相関、
前記第2のノードのノード内平均相関、
前記第2のノードのノード内メジアン相関、
前記第2のノードのノード内最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔17〕~〔20〕のいずれか一項に記載の方法。
〔22〕前記第1のノードと前記第2のノードとの前記ノード間相関は、
前記第1のノードと前記第2のノードとのノード間最大相関、
前記第1のノードと前記第2のノードとのノード間平均相関、
前記第1のノードと前記第2のノードとのノード間メジアン相関、
前記第1のノードと前記第2のノードとのノード間最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔17〕~〔21〕のいずれか一項に記載の方法。
〔23〕前記系統樹の前記複数のノードをトラバースする際、各ノードにおいて、
前記分割が有効である場合、前記ノードから前記左子ノード及び前記ノードの前記右子ノードに引き続きトラバースすることと、
前記分割が無効である場合、前記ノードから前記左子ノード及び前記ノードの前記右子ノードへのトラバースを停止することと、
を含む、前記〔4〕~〔16〕のいずれか一項に記載の方法。
〔24〕前記ノードの前記子ノードを有する前記ノードの前記分割が有効であるか、それとも無効であるかを判断することは、
前記左子ノードと前記右子ノードとの間の距離が分割閾値を超える場合、前記分割を有効と判断することと、
その他の場合、無効と判断することと、
を含む、前記〔4〕~〔23〕のいずれか一項に記載の方法。
〔25〕前記左子ノードと前記右子ノードとの間の距離は、前記左子ノード及び前記右子ノードによって表される発現プロファイル間の前記複数の標的の各標的で実行される統計検定に基づいて特定される、前記〔24〕に記載の方法。
〔26〕前記統計検定はウェルチt検定を含む、前記〔25〕に記載の方法。
〔27〕前記左子ノードと前記右子ノードとの間の距離は、前記左子ノードによって表される各発現プロファイルと前記右子ノードによって表される各発現プロファイルとの間の前記複数の標的の各標的に対して実行される前記統計検定の最大p値に基づいて特定される、前記〔25〕又は〔26〕に記載の方法。
〔28〕前記系統樹の前記複数のノードをトラバースする際、各ノードにおいて、(3)前記ノードが1つの細胞の発現プロファイルを表す場合、前記ノードを前記統合クラスタセットに追加することを含む、前記〔1〕~〔27〕のいずれか一項に記載の方法。
〔29〕前記系統樹の前記複数のノードをトラバースする際、各ノードにおいて、前記ノード標識を前記ノードに割り当てることを含む、前記〔4〕~〔28〕のいずれか一項に記載の方法。
〔30〕前記ノードが1つの細胞の発現プロファイルを表す場合、前記ノードの前記ノード標識は、1つの細胞名称を含み、
その他の場合、前記ノードが前記親ノードの前記左子ノードであるとき、前記ノードの前記ノード標識は、前記親ノードの前記ノード標識及び左名称を含み、
その他のとき、前記ノードの前記ノード標識は、前記親ノードの前記ノード標識及び右名称を含む、前記〔29〕に記載の方法。
〔31〕前記統合クラスタセット内の各ノードについて、前記ノードによって表される前記細胞の前記複数の標的の前記発現プロファイルに基づいて前記細胞タイプを区別する前記標的を識別することは、
前記細胞タイプを区別する前記標的に関連付けられた別個の配列を有する分子標識数を単位として、前記ノードによって表される発現プロファイルと、前記統合クラスタセット内の別のノードによって表される発現プロファイルとの差が有意な閾値よりも大きいと判断すること
を含む、前記〔1〕~〔30〕のいずれか一項に記載の方法。
〔32〕(d)において前記第1のノードを前記第2のノードと統合して、前記統合ノードを生成する前、
第3のノードと第4のノードとの間の距離がノード距離閾値内にある場合、1つの細胞の発現プロファイルを表す前記統合クラスタセット内の前記第3のノードのそれぞれを前記統合クラスタセット内の前記第4のノードと統合すること
を含む、前記〔1〕~〔31〕のいずれか一項に記載の方法。
〔33〕前記細胞の発現プロファイルを表す前記統合クラスタセット内の前記ノードに基づいて前記複数の細胞を分類することを含む、前記〔1〕~〔32〕のいずれか一項に記載の方法。
〔34〕識別された細胞タイプを区別する前記標的に基づいて全体トランスクリプトームアッセイを指定することを含む、前記〔1〕~〔33〕のいずれか一項に記載の方法。
〔35〕識別された細胞タイプを区別する前記標的に基づいて、標的とされるトランスクリプトームアッセイを指定することを含む、前記〔1〕~〔33〕のいずれか一項に記載の方法。
〔36〕細胞タイプを区別する標的を識別する方法であって、
(a)複数の細胞の発現プロファイルを受信することであって、前記発現プロファイルは、前記複数の細胞の各細胞の複数の標的の各標的を幾つか含む、受信することと、
(b)前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの複数のクラスタを生成することであって、各クラスタは、(1)親クラスタ及び(2)2つ以上の子クラスタのうちの一方又は両方との1つ又は複数の関連性を有し、前記親クラスタは、前記クラスタによって表される前記複数の細胞の1つ又は複数の細胞の発現プロファイルを表し、前記クラスタは、前記2つ以上の子クラスタによって表される発現プロファイルを表す、クラスタリングして生成することと、
(c)前記2つ以上の子クラスタを有する各クラスタについて、前記クラスタと前記2つ以上の子クラスタとの関連性が無効である場合、前記クラスタを統合クラスタセットに追加することと、
(d)前記統合クラスタセット内の第1のクラスタのそれぞれについて、前記統合クラスタセット内の前記第1のクラスタと、前記第1のクラスタに最も近い前記統合クラスタセット内の第2のクラスタとの間の距離が、統合距離閾値内である場合、繰り返し、前記第1のクラスタ及び前記第2のクラスタを統合して、統合クラスタを生成することであって、前記統合クラスタは、前記第1のクラスタ及び前記第2のクラスタの発現プロファイルを含む、繰り返し統合することと、
(e)前記統合クラスタセット内の各クラスタについて、前記クラスタによって表される細胞の前記複数の標的の発現プロファイルに基づいて細胞タイプを区別する標的を識別することと、
を含む、方法。
〔37〕前記複数の細胞の発現プロファイルを受信することは、標的カウントデータ構造を受信することを含む、前記〔36〕に記載の方法。
〔38〕前記標的カウントデータ構造は、標的カウントマトリックスを含む、前記〔37〕に記載の方法。
〔39〕前記標的カウントマトリックスの各行又は各列は、前記複数の細胞の異なる個々の細胞の発現プロファイルを含む、前記〔38〕に記載の方法。
〔40〕前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルを発現プロファイルの前記複数のクラスタにクラスタリングすることは、
前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルを階層的にクラスタリングして、前記複数の細胞の前記発現プロファイルを表す系統樹を生成することであって、前記系統樹は複数のクラスタを含み、前記複数のクラスタはルートクラスタ、複数のリーフクラスタ、及び複数の非ルート非リーフクラスタを含む、階層的にクラスタリングして、系統樹を生成すること
を含む、前記〔36〕~〔39〕のいずれか一項に記載の方法。
〔41〕前記複数のリーフクラスタ及び前記複数の非ルート非リーフクラスタのそれぞれは、親クラスタとの関連性を有し、
前記ルートクラスタ及び前記複数の非ルート非リーフクラスタのそれぞれは、左子クラスタ及び右子クラスタとの関連性を有し、前記クラスタの前記左子クラスタ及び前記右子クラスタによって表される発現プロファイルを表し、
前記ルートクラスタは、前記複数の細胞の前記発現プロファイルを表す、前記〔40〕に記載の方法。
〔42〕2つ以上の子クラスタを有する各クラスタについて、前記2つ以上の子クラスタとの前記クラスタ間の関連性が無効である場合、前記クラスタを統合クラスタセットに追加することは、
前記系統樹の前記ルートクラスタから前記系統樹の各クラスタを通して前記系統樹の前記複数のリーフクラスタにトラバースする間、
(1)前記クラスタと前記クラスタの前記子クラスタとの関連性が有効であるか、それとも無効であるかを判断することと、
(2)前記関連性が無効である場合、前記クラスタを統合クラスタセットに追加することと、
を含む、前記〔40〕又は〔41〕に記載の方法。
〔43〕(a)において、前記複数の細胞の前記発現プロファイルを受信する前、
(f)複数のバーコードを使用して前記複数の細胞内の前記複数の標的をバーコーディングして、複数のバーコード付き標的を作成することであって、前記複数のバーコードのそれぞれは、細胞標識及び分子標識を含み、異なる細胞の標的から作成されるバーコード付き標的は、異なる細胞標識を有し、前記複数の細胞の1つの細胞の標的から作成されるバーコード付き標的は、異なる分子標識を有する、バーコーディングして複数のバーコード付き標的を作成することと、
(g)前記複数のバーコード付き標的の配列データを取得することと、
(h)前記複数の細胞のそれぞれについて、
(1)前記細胞の前記配列データ内の前記複数の標的の各標的に関連付けられた別個の配列を有する分子標識の数をカウントすることと、
(2)(h)(1)においてカウントされた前記配列データ内の前記標的に関連付けられた別個の配列を有する分子標識の数に基づいて、前記細胞の前記複数の標的の各標的の数を推定することと、
を含む、を含む、前記〔36〕~〔42〕に記載の方法。
〔44〕前記複数の細胞のうちの前記細胞の前記発現プロファイルは、(h)(2)において推定された前記細胞の前記複数の標的の各標的の数を含む、前記〔43〕に記載の方法。
〔45〕(b)において、前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの複数のクラスタを生成する前、
(i)前記複数の細胞の前記発現プロファイルの距離データ構造を特定すること
を含む、前記〔36〕~〔44〕のいずれか一項に記載の方法。
〔46〕前記距離データ構造は、前記複数の細胞の前記発現プロファイルの距離マトリックスを含む、前記〔45〕に記載の方法。
〔47〕前記距離マトリックスの各対角線要素は0の値を有する、前記〔46〕に記載の方法。
〔48〕(b)において、前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの前記複数のクラスタを生成することは、前記距離マトリックスに基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの前記複数のクラスタを生成することを含む、前記〔46〕又は〔47〕に記載の方法。
〔49〕前記複数の細胞の前記発現プロファイル間の前記距離は、前記複数の細胞の前記発現プロファイル間のペア毎の相関距離である、前記〔45〕~〔48〕のいずれか一項に記載の方法。
〔50〕(i)において前記距離データ構造を特定する前、前記標的カウントデータ構造を対数変換済み標的カウントデータ構造に対数変換することを含み、
前記標的カウントデータ構造の要素の前記距離データ構造を特定することは、前記対数変換済み標的カウントデータ構造の前記距離データ構造を特定することを含み、
(b)において、前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの前記複数のクラスタを生成することは、前記対数変換済み標的カウントデータ構造及び前記距離データ構造に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、前記複数のクラスタを生成することを含む、前記〔45〕~〔49〕のいずれか一項に記載の方法。
〔51〕前記標的カウントデータ構造を前記対数変換済み標的カウントデータ構造に対数変換することは、前記標的カウントデータ構造の各要素の値を増分によって増大させることを含む、前記〔50〕に記載の方法。
〔52〕前記増分は1である、前記〔51〕に記載の方法。
〔53〕(b)において、前記複数の細胞の前記発現プロファイル間の距離に基づいて前記複数の細胞の前記発現プロファイルをクラスタリングすることは、
前記複数の細胞の各発現プロファイルを異なるリーフクラスタに割り当てることと、
第2のクラスタが第1のクラスタへの前記複数のクラスタの最近傍クラスタである場合、前記複数のクラスタの前記第1のクラスタ及び前記第2のクラスタを繰り返し結合して、前記第1のクラスタ及び前記第2のクラスタの親クラスタを生成することと、
を含む、前記〔36〕~〔52〕のいずれか一項に記載の方法。
〔54〕前記第1のクラスタと前記第2のクラスタとの間の前記距離は、前記第1のクラスタによって表される任意の発現プロファイルと、前記第2のクラスタによって表される任意の発現プロファイルとの間の最大距離である、前記〔53〕に記載の方法。
〔55〕前記第1のクラスタのクラスタ内相関及び前記第2のクラスタのクラスタ内相関の少なくとも一方は、前記第1のクラスタと前記第2のクラスタとのクラスタ間相関よりも高い、前記〔53〕又は〔54〕に記載の方法。
〔56〕前記第1のクラスタのクラスタ内相関及び前記第2のクラスタのクラスタ内相関の指示は、前記第1のクラスタと前記第2のクラスタとのクラスタ間相関よりも高い、前記〔15〕又は〔16〕に記載の方法。
〔57〕前記第1のクラスタのクラスタ内相関及び前記第2のクラスタのクラスタ内相関の指示は、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内最大相関、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内平均相関、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内メジアン相関、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔17〕又は〔18〕に記載の方法。
〔58〕前記第1のクラスタの前記クラスタ内相関は、
前記第1のクラスタのクラスタ内最大相関、
前記第1のクラスタのクラスタ内平均相関、
前記第1のクラスタのクラスタ内メジアン相関、
前記第1のクラスタのクラスタ内最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔17〕~〔19〕のいずれか一項に記載の方法。
〔59〕前記第2のクラスタの前記クラスタ内相関は、
前記第2のクラスタのクラスタ内最大相関、
前記第2のクラスタのクラスタ内平均相関、
前記第2のクラスタのクラスタ内メジアン相関、
前記第2のクラスタのクラスタ内最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔17〕~〔20〕のいずれか一項に記載の方法。
〔60〕前記第1のクラスタと前記第2のクラスタとの前記クラスタ間相関は、
前記第1のクラスタと前記第2のクラスタとのクラスタ間最大相関、
前記第1のクラスタと前記第2のクラスタとのクラスタ間平均相関、
前記第1のクラスタと前記第2のクラスタとのクラスタ間メジアン相関、
前記第1のクラスタと前記第2のクラスタとのクラスタ間最小相関、
それらの任意の組合せ
の少なくとも1つに基づく、前記〔17〕~〔21〕のいずれか一項に記載の方法。
〔61〕前記系統樹の前記複数のクラスタをトラバースする際、各クラスタにおいて、
前記関連性が有効である場合、前記クラスタから前記クラスタの前記左子クラスタ及び前記クラスタの前記右子クラスタに引き続きトラバースすることと、
前記関連性が無効である場合、前記クラスタから前記クラスタの前記左子クラスタ及び前記クラスタの前記右子クラスタへのトラバースを停止することと、
を含む、前記〔42〕~〔54〕のいずれか一項に記載の方法。
〔62〕前記クラスタの前記子クラスタとの前記クラスタの前記関連性が有効であるか、それとも無効であるかを判断することは、
前記左子クラスタと前記右子クラスタとの間の距離が関連性閾値を超える場合、前記関連性を有効と判断することと、
その他の場合、無効と判断することと、
を含む、前記〔42〕~〔61〕のいずれか一項に記載の方法。
〔63〕前記左子クラスタと前記右子クラスタとの間の距離は、前記左子クラスタ及び前記右子クラスタによって表される発現プロファイル間の前記複数の標的の各標的で実行される統計検定に基づいて特定される、前記〔62〕に記載の方法。
〔64〕前記統計検定はウェルチt検定を含む、前記〔63〕に記載の方法。
〔65〕前記左子クラスタと前記右子クラスタとの間の距離は、前記左子クラスタによって表される発現プロファイルと前記右子クラスタによって表される各発現プロファイルとの間の前記複数の標的の各標的に対して実行される前記統計検定の最大p値に基づいて特定される、前記〔63〕又は〔64〕に記載の方法。
〔66〕前記系統樹の前記複数のクラスタをトラバースする際、各クラスタにおいて、(3)前記クラスタが1つの細胞の発現プロファイルを表す場合、前記クラスタを前記統合クラスタセットに追加することを含む、前記〔42〕~〔65〕のいずれか一項に記載の方法。
〔67〕前記系統樹の前記複数のクラスタをトラバースする際、各クラスタにおいて、前記クラスタ標識を前記クラスタに割り当てることを含む、前記〔42〕~〔66〕のいずれか一項に記載の方法。
〔68〕前記クラスタが1つの細胞の発現プロファイルを表す場合、前記クラスタの前記クラスタ標識は、1つの細胞名称を含み、
その他の場合、前記クラスタが前記親クラスタの前記左子クラスタであるとき、前記クラスタの前記クラスタ標識は、前記親クラスタの前記クラスタ標識及び左名称を含み、
その他のとき、前記クラスタの前記クラスタ標識は、前記親クラスタの前記クラスタ標識及び右名称を含む、前記〔67〕に記載の方法。
〔69〕前記統合クラスタセット内の各クラスタについて、前記クラスタによって表される前記細胞の前記複数の標的の前記発現プロファイルに基づいて前記細胞タイプを区別する前記標的を識別することは、
前記細胞タイプを区別する前記標的に関連付けられた別個の配列を有する分子標識数を単位として、前記クラスタによって表される発現プロファイルと、前記統合クラスタセット内の別のクラスタによって表される発現プロファイルとの差が有意な閾値よりも大きいと判断すること
を含む、前記〔36〕~〔68〕のいずれか一項に記載の方法。
〔70〕(d)において前記第1のクラスタを前記第2のクラスタと統合して、前記統合クラスタを生成する前、
第3のクラスタと第4のクラスタとの間の距離がクラスタ距離閾値内にある場合、1つの細胞の発現プロファイルを表す前記統合クラスタセット内の前記第3のクラスタのそれぞれを前記統合クラスタセット内の前記第4のクラスタと統合すること
を含む、前記〔36〕~〔69〕のいずれか一項に記載の方法。
〔71〕前記細胞の発現プロファイルを表す前記統合クラスタセット内の前記クラスタに基づいて前記複数の細胞を分類することを含む、前記〔36〕~〔70〕のいずれか一項に記載の方法。
〔72〕識別された細胞タイプを区別する前記標的に基づいて全体トランスクリプトームアッセイを指定することを含む、前記〔36〕~〔71〕のいずれか一項に記載の方法。
〔73〕識別された細胞タイプを区別する前記標的に基づいて、標的とされるトランスクリプトームアッセイを指定することを含む、前記〔36〕~〔71〕のいずれか一項に記載の方法。
〔74〕標的の数を特定するコンピュータシステムであって、
ハードウェアプロセッサと、
命令が記憶された非一時的メモリであって、前記命令は、前記ハードウェアプロセッサによって実行されると、前記プロセッサに、前記〔1〕~〔73〕のいずれか一項に記載の方法を実行させる、非一時的メモリと、
を備える、コンピュータシステム。
〔75〕前記〔1〕~〔73〕のいずれか一項に記載の方法を実行する方法を実行するコードを含むコンピュータ可読媒体。
Claims (21)
- 細胞タイプを区別するための標的を同定する方法であって、
(a)複数の細胞の発現プロファイルを得ること、ここで前記発現プロファイルは、前記複数の細胞の各細胞についての複数の標的の各標的の数を含む、
(b)前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの複数のクラスタを生成すること、ここで各クラスタは、(1)親クラスタ及び(2)2つ以上の子クラスタのうちの一方又は両方との1つ又は複数の関連性を有し、前記親クラスタは、前記クラスタによって表される前記複数の細胞の1つ又は複数の細胞の発現プロファイルを表し、前記クラスタは、前記2つ以上の子クラスタによって表される発現プロファイルを表す、
(c)前記2つ以上の子クラスタを有する各クラスタについて、前記クラスタと前記2つ以上の子クラスタとの間の関連性が無効であると判断されると、前記クラスタを統合クラスタセットに追加すること、ここで、前記2つ以上の子クラスタの間の差が有意でないときに前記クラスタと前記2つ以上の子クラスタとの間の関連性が無効であると判断される、
(d)前記統合クラスタセット内の第1のクラスタのそれぞれについて、前記統合クラスタセット内の前記第1のクラスタと、前記第1のクラスタに最も近い前記統合クラスタセット内の第2のクラスタとの間の距離が、統合距離閾値内である場合、繰り返し、前記第1のクラスタ及び前記第2のクラスタを統合して、統合クラスタを生成すること、ここで前記統合クラスタは、前記第1のクラスタ及び前記第2のクラスタの発現プロファイルを含む、及び
(e)前記統合クラスタセット内の各クラスタについて、細胞タイプを区別するための標的を、前記クラスタによって表される細胞の前記複数の標的の発現プロファイルに基づいて同定すること、
を含む、方法。 - 前記複数の細胞の発現プロファイルを得ることは、標的カウントデータ構造を得ることを含み、
前記標的カウントデータ構造は、標的カウントマトリックスを含み、
前記標的カウントマトリックスの各行又は各列は、前記複数の細胞の異なる個々の細胞の発現プロファイルを含む、請求項1に記載の方法。 - 前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルを発現プロファイルの前記複数のクラスタにクラスタリングすることは、
前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルを階層的にクラスタリングして、前記複数の細胞の前記発現プロファイルを表す系統樹を生成することを含み、ここで前記系統樹は複数のクラスタを含み、前記複数のクラスタはルートクラスタ、複数のリーフクラスタ、及び複数の非ルート非リーフクラスタを含む、請求項1又は2に記載の方法。 - 前記複数のリーフクラスタ及び前記複数の非ルート非リーフクラスタのそれぞれは、親クラスタとの関連性を有し、
前記ルートクラスタ及び前記複数の非ルート非リーフクラスタのそれぞれは、左子クラスタ及び右子クラスタとの関連性を有し、前記クラスタの前記左子クラスタ及び前記右子クラスタによって表される発現プロファイルを表し、
前記ルートクラスタは、前記複数の細胞の前記発現プロファイルを表す、請求項3に記載の方法。 - 2つ以上の子クラスタを有する各クラスタについて、前記クラスタと前記2つ以上の子クラスタとの間の関連性が無効であると判断されると、前記クラスタを統合クラスタセットに追加することは、
前記系統樹の前記ルートクラスタから前記系統樹の各クラスタを通して前記系統樹の前記複数のリーフクラスタにトラバースする間、
(1)前記クラスタと前記クラスタの前記子クラスタとの関連性が無効であるかどうかを判断することと、
(2)前記クラスタを統合クラスタセットに追加することと、
を含む、請求項3又は4に記載の方法。 - 前記系統樹の前記複数のクラスタをトラバースする際、各クラスタにおいて、
前記関連性が有効である場合、前記クラスタから前記クラスタの前記左子クラスタ及び前記右子クラスタへのトラバースを継続することと、
前記関連性が無効である場合、前記クラスタから前記クラスタの前記左子クラスタ及び前記クラスタの前記右子クラスタへのトラバースを停止することと、
を含む、請求項5記載の方法。 - 前記クラスタの前記子クラスタとの前記クラスタの前記関連性が有効であるか、それとも無効であるかを判断することは、
前記左子クラスタと前記右子クラスタとの間の距離が関連性閾値を超える場合、前記関連性を有効と判断することと、
その他の場合、無効と判断することと、
を含む、請求項5又は6に記載の方法。 - 前記左子クラスタと前記右子クラスタとの間の距離は、
前記左子クラスタ及び前記右子クラスタによって表される発現プロファイル間の前記複数の標的の各標的に対して実行される統計検定に基づいて決定されるか、或いは
前記左子クラスタによって表される発現プロファイルと前記右子クラスタによって表される各発現プロファイルとの間の前記複数の標的の各標的に対して実行される前記統計検定の最大p値に基づいて決定される、
請求項7に記載の方法。 - 前記系統樹の前記複数のクラスタをトラバースする際、各クラスタにおいて、(3)前記クラスタが1つの細胞の発現プロファイルを表す場合、前記クラスタを前記統合クラスタセットに追加することを含む、請求項5~8のいずれか一項に記載の方法。
- 前記系統樹の前記複数のクラスタをトラバースする際、各クラスタにおいて、クラスタ標識を前記クラスタに割り当てることを含む、請求項5~9のいずれか一項に記載の方法。
- 前記クラスタが1つの細胞の発現プロファイルを表す場合、前記クラスタの前記クラスタ標識は、1つの細胞名称を含み、
その他の場合、前記クラスタが前記親クラスタの前記左子クラスタであるとき、前記クラスタの前記クラスタ標識は、前記親クラスタの前記クラスタ標識及び左名称を含み、
その他のとき、前記クラスタの前記クラスタ標識は、前記親クラスタの前記クラスタ標識及び右名称を含む、請求項10に記載の方法。 - 前記統合クラスタセット内の各クラスタについて、前記細胞タイプを区別するための前記標的を、前記クラスタによって表される前記細胞の前記複数の標的の前記発現プロファイルに基づいて同定することは、
前記細胞タイプを区別するための前記標的に関連付けられた別個の配列を有する分子標識数において、前記クラスタによって表される発現プロファイルと、前記統合クラスタセット内の別のクラスタによって表される発現プロファイルとの差が有意な閾値よりも大きいと判断すること
を含む、請求項1~11のいずれか一項に記載の方法。 - (b)において、前記複数の細胞の前記発現プロファイル間の距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの複数のクラスタを生成する前に、
(i)前記複数の細胞の前記発現プロファイルの距離データ構造を決定することを含み、ここで、前記距離データ構造は、前記複数の細胞の前記発現プロファイルの距離マトリックスを含み、
ここで、(b)において、前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの前記複数のクラスタを生成することは、前記距離マトリックスに基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの前記複数のクラスタを生成することを含む、
請求項1~12のいずれか一項に記載の方法。 - (i)において前記距離データ構造を決定する前に、前記標的カウントデータ構造を対数変換済み標的カウントデータ構造に対数変換することを含み、
前記標的カウントデータ構造の要素の前記距離データ構造を決定することは、前記対数変換済み標的カウントデータ構造の前記距離データ構造を決定することを含み、
(b)において、前記複数の細胞の前記発現プロファイル間の前記距離に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、発現プロファイルの前記複数のクラスタを生成することは、前記対数変換済み標的カウントデータ構造及び前記距離データ構造に基づいて、前記複数の細胞の前記発現プロファイルをクラスタリングして、前記複数のクラスタを生成することを含む、請求項13に記載の方法。 - (b)において、前記複数の細胞の前記発現プロファイル間の距離に基づいて前記複数の細胞の前記発現プロファイルをクラスタリングすることは、
前記複数の細胞の各発現プロファイルを前記複数のクラスタにおける異なるリーフクラスタに割り当てることと、
第2のクラスタが前記複数のクラスタ中で第1のクラスタに最も近いクラスタである場合、繰り返し、前記複数のクラスタの前記第1のクラスタ及び前記第2のクラスタを組み合わせて、前記第1のクラスタ及び前記第2のクラスタの親クラスタを生成することと、
を含む、請求項1~14のいずれか一項に記載の方法。 - 前記第1のクラスタと前記第2のクラスタとの間の前記距離は、前記第1のクラスタによって表される任意の発現プロファイルと、前記第2のクラスタによって表される任意の発現プロファイルとの間の最大距離である、請求項15に記載の方法。
- 前記第1のクラスタのクラスタ内相関及び前記第2のクラスタのクラスタ内相関は、前記第1のクラスタと前記第2のクラスタとのクラスタ間相関よりも高い、請求項15又は16に記載の方法。
- 前記第1のクラスタのクラスタ内相関及び前記第2のクラスタのクラスタ内相関の尺度は、前記第1のクラスタと前記第2のクラスタとのクラスタ間相関よりも高い、請求項15~17のいずれか一項に記載の方法。
- 前記第1のクラスタのクラスタ内相関及び前記第2のクラスタのクラスタ内相関の尺度は、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内最大相関、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内平均相関、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内メジアン相関、
前記第1のクラスタ及び前記第2のクラスタのクラスタ内最小相関、及び
それらの任意の組合せ
の少なくとも1つに基づいており、
前記第1のクラスタの前記クラスタ内相関は、
前記第1のクラスタのクラスタ内最大相関、
前記第1のクラスタのクラスタ内平均相関、
前記第1のクラスタのクラスタ内メジアン相関、
前記第1のクラスタのクラスタ内最小相関、及び
それらの任意の組合せ
の少なくとも1つに基づいており
前記第2のクラスタの前記クラスタ内相関は、
前記第2のクラスタのクラスタ内最大相関、
前記第2のクラスタのクラスタ内平均相関、
前記第2のクラスタのクラスタ内メジアン相関、
前記第2のクラスタのクラスタ内最小相関、及び
それらの任意の組合せ
の少なくとも1つに基づいており、且つ
前記第1のクラスタと前記第2のクラスタとの前記クラスタ間相関は、
前記第1のクラスタと前記第2のクラスタとのクラスタ間最大相関、
前記第1のクラスタと前記第2のクラスタとのクラスタ間平均相関、
前記第1のクラスタと前記第2のクラスタとのクラスタ間メジアン相関、
前記第1のクラスタと前記第2のクラスタとのクラスタ間最小相関、及び
それらの任意の組合せ
の少なくとも1つに基づいている、
請求項18に記載の方法。 - 標的の数を決定するためのコンピュータシステムであって、
ハードウェアプロセッサと、
命令が記憶された非一時的メモリであって、前記命令は、前記ハードウェアプロセッサによって実行されると、前記プロセッサに、請求項1~19のいずれか一項に記載の方法を実行させる、非一時的メモリと、
を備える、コンピュータシステム。 - 請求項1~19のいずれか一項に記載の方法を実行するためのコードを含むコンピュータ可読有形記憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023023174A JP7637169B2 (ja) | 2016-11-08 | 2023-02-17 | 発現プロファイル分類の方法 |
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201662419291P | 2016-11-08 | 2016-11-08 | |
| US62/419,291 | 2016-11-08 | ||
| US201762446227P | 2017-01-13 | 2017-01-13 | |
| US62/446,227 | 2017-01-13 | ||
| PCT/US2017/060451 WO2018089378A1 (en) | 2016-11-08 | 2017-11-07 | Methods for expression profile classification |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023023174A Division JP7637169B2 (ja) | 2016-11-08 | 2023-02-17 | 発現プロファイル分類の方法 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2020504357A JP2020504357A (ja) | 2020-02-06 |
| JP2020504357A5 JP2020504357A5 (ja) | 2020-12-17 |
| JP7232180B2 true JP7232180B2 (ja) | 2023-03-02 |
Family
ID=60484476
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019523873A Active JP7232180B2 (ja) | 2016-11-08 | 2017-11-07 | 発現プロファイル分類の方法 |
| JP2023023174A Active JP7637169B2 (ja) | 2016-11-08 | 2023-02-17 | 発現プロファイル分類の方法 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023023174A Active JP7637169B2 (ja) | 2016-11-08 | 2023-02-17 | 発現プロファイル分類の方法 |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US11164659B2 (ja) |
| EP (1) | EP3539035B1 (ja) |
| JP (2) | JP7232180B2 (ja) |
| KR (1) | KR102722820B1 (ja) |
| CN (2) | CN109952612B (ja) |
| AU (2) | AU2017359048B2 (ja) |
| ES (1) | ES2980967T3 (ja) |
| SG (1) | SG11201903139SA (ja) |
| WO (1) | WO2018089378A1 (ja) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109074430B (zh) | 2016-05-26 | 2022-03-29 | 贝克顿迪金森公司 | 分子标记计数调整方法 |
| JP7232180B2 (ja) | 2016-11-08 | 2023-03-02 | ベクトン・ディキンソン・アンド・カンパニー | 発現プロファイル分類の方法 |
| US11608497B2 (en) | 2016-11-08 | 2023-03-21 | Becton, Dickinson And Company | Methods for cell label classification |
| WO2019147295A1 (en) * | 2018-01-29 | 2019-08-01 | Ubiquicorp Limited | Proof of majority block consensus method for generating and uploading a block to a blockchain |
| WO2020006183A1 (en) | 2018-06-28 | 2020-01-02 | 10X Genomics, Inc. | Systems and methods for visualization of single-cell resolution characteristics |
| US20200255888A1 (en) | 2019-02-12 | 2020-08-13 | Becton, Dickinson And Company | Determining expressions of transcript variants and polyadenylation sites |
| CN111581394B (zh) * | 2020-04-30 | 2023-06-23 | 北京印刷学院 | 一种大规模知识地形图绘制方法 |
| US20220414521A1 (en) * | 2021-06-24 | 2022-12-29 | International Business Machines Corporation | Automated machine learning model transformation using artificial intelligence |
| KR102583916B1 (ko) * | 2021-10-26 | 2023-09-26 | 연세대학교 산학협력단 | 저전력 테스트를 위한 스캔 상관관계 기반 스캔 클러스터 리오더링 방법 및 장치 |
| US20240111883A1 (en) * | 2022-09-29 | 2024-04-04 | ForgeRock, Inc. | Improved coalescence of roles for role-based access control |
| KR102597328B1 (ko) * | 2023-01-25 | 2023-11-02 | 주식회사 마키나락스 | 반도체 소자의 배치를 평가하기 위해 2중 클러스터링을 수행하는 방법 |
| JP2024159251A (ja) | 2023-04-28 | 2024-11-08 | 住友金属鉱山株式会社 | 厚膜抵抗体 |
| CN117238378B (zh) * | 2023-09-15 | 2024-04-26 | 杭州普罗亭医学检验实验室有限公司 | 基于密度估计和二次型距离的自动圈门方法、装置、设备及存储介质 |
| CN119579799B (zh) * | 2025-02-06 | 2025-04-18 | 之江实验室 | 一种基于多孔结构的三维模型生成方法、装置及电子设备 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060211036A1 (en) | 2002-06-25 | 2006-09-21 | Yeh-Tze Chou | Metastasis-associated gene profiling for identification of tumor tissue, subtyping, and prediction of prognosis of patients |
| US20080010304A1 (en) | 2006-03-29 | 2008-01-10 | Santosh Vempala | Techniques for clustering a set of objects |
| US20090170075A1 (en) | 2004-05-07 | 2009-07-02 | Gyorgy Petrovics | Methods of diagnosing or treating prostate cancer using the erg gene, alone or in combination with other over or under expressed genes in prostate cancer |
| US20100145893A1 (en) | 2008-10-31 | 2010-06-10 | Abbott Laboratories | Genomic classification of non-small cell lung carcinoma based on patterns of gene copy number alterations |
| US20190218276A1 (en) | 2016-03-21 | 2019-07-18 | The Broad Institute, Inc. | Methods for determining spatial and temporal gene expression dynamics in single cells |
Family Cites Families (246)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4510244A (en) | 1980-04-17 | 1985-04-09 | The Board Of Trustees Of The Leland Stanford Jr. University | Cell labeling with antigen-coupled microspheres |
| US4725536A (en) | 1985-09-19 | 1988-02-16 | Genetics Institute, Inc. | Reagent polynucleotide complex with multiple target binding regions, and kit and methods |
| US6150517A (en) | 1986-11-24 | 2000-11-21 | Gen-Probe | Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms |
| IE72468B1 (en) | 1987-07-31 | 1997-04-09 | Univ Leland Stanford Junior | Selective amplification of target polynucleotide sequences |
| US5149625A (en) | 1987-08-11 | 1992-09-22 | President And Fellows Of Harvard College | Multiplex analysis of DNA |
| US5656731A (en) | 1987-10-15 | 1997-08-12 | Chiron Corporation | Nucleic acid-amplified immunoassay probes |
| US5124246A (en) | 1987-10-15 | 1992-06-23 | Chiron Corporation | Nucleic acid multimers and amplified nucleic acid hybridization assays using same |
| AU632760B2 (en) | 1988-07-26 | 1993-01-14 | Genelabs Technologies, Inc. | Rna and dna amplification techniques |
| US5424186A (en) | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
| US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
| US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
| US5925525A (en) | 1989-06-07 | 1999-07-20 | Affymetrix, Inc. | Method of identifying nucleotide differences |
| US6551784B2 (en) | 1989-06-07 | 2003-04-22 | Affymetrix Inc | Method of comparing nucleic acid sequences |
| US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
| US5871928A (en) | 1989-06-07 | 1999-02-16 | Fodor; Stephen P. A. | Methods for nucleic acid analysis |
| US6309822B1 (en) | 1989-06-07 | 2001-10-30 | Affymetrix, Inc. | Method for comparing copy number of nucleic acid sequences |
| US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
| US5200314A (en) | 1990-03-23 | 1993-04-06 | Chiron Corporation | Polynucleotide capture assay employing in vitro amplification |
| EP0834576B1 (en) | 1990-12-06 | 2002-01-16 | Affymetrix, Inc. (a Delaware Corporation) | Detection of nucleic acid sequences |
| US5981179A (en) | 1991-11-14 | 1999-11-09 | Digene Diagnostics, Inc. | Continuous amplification reaction |
| US5424413A (en) | 1992-01-22 | 1995-06-13 | Gen-Probe Incorporated | Branched nucleic acid probes |
| US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
| US5981176A (en) | 1992-06-17 | 1999-11-09 | City Of Hope | Method of detecting and discriminating between nucleic acid sequences |
| DE69431719T2 (de) | 1993-06-25 | 2003-09-18 | Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) | Hybridisierung und sequenzierung von nukleinsäuren |
| US5500356A (en) | 1993-08-10 | 1996-03-19 | Life Technologies, Inc. | Method of nucleic acid sequence selection |
| US6309823B1 (en) | 1993-10-26 | 2001-10-30 | Affymetrix, Inc. | Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same |
| US5681697A (en) | 1993-12-08 | 1997-10-28 | Chiron Corporation | Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor |
| US5714330A (en) | 1994-04-04 | 1998-02-03 | Lynx Therapeutics, Inc. | DNA sequencing by stepwise ligation and cleavage |
| US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
| US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
| US6013445A (en) | 1996-06-06 | 2000-01-11 | Lynx Therapeutics, Inc. | Massively parallel signature sequencing by ligation of encoded adaptors |
| US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
| WO1998053300A2 (en) | 1997-05-23 | 1998-11-26 | Lynx Therapeutics, Inc. | System and apparaus for sequential processing of analytes |
| US6600996B2 (en) | 1994-10-21 | 2003-07-29 | Affymetrix, Inc. | Computer-aided techniques for analyzing biological sequences |
| ATE340866T1 (de) | 1994-10-28 | 2006-10-15 | Gen Probe Inc | Zusammensetzungen und verfahren für die gleichzeitige detektion und quantifizierung von einer mehrheit spezifischer nuklein säure sequenzen |
| KR19990008052A (ko) | 1995-04-25 | 1999-01-25 | 마이클 피 노바 | 기억 장치를 갖는 원격적으로 프로그램 가능한 매트릭스 및 이의 용도 |
| US5648245A (en) | 1995-05-09 | 1997-07-15 | Carnegie Institution Of Washington | Method for constructing an oligonucleotide concatamer library by rolling circle replication |
| US5968740A (en) | 1995-07-24 | 1999-10-19 | Affymetrix, Inc. | Method of Identifying a Base in a Nucleic Acid |
| US5763175A (en) | 1995-11-17 | 1998-06-09 | Lynx Therapeutics, Inc. | Simultaneous sequencing of tagged polynucleotides |
| US5854033A (en) | 1995-11-21 | 1998-12-29 | Yale University | Rolling circle replication reporter systems |
| US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
| WO1998015644A2 (en) | 1996-09-27 | 1998-04-16 | The Chinese University Of Hong Kong | Parallel polynucleotide sequencing method |
| US6124092A (en) | 1996-10-04 | 2000-09-26 | The Perkin-Elmer Corporation | Multiplex polynucleotide capture methods and compositions |
| US6117631A (en) | 1996-10-29 | 2000-09-12 | Polyprobe, Inc. | Detection of antigens via oligonucleotide antibody conjugates |
| US6046005A (en) | 1997-01-15 | 2000-04-04 | Incyte Pharmaceuticals, Inc. | Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group |
| US6399334B1 (en) | 1997-09-24 | 2002-06-04 | Invitrogen Corporation | Normalized nucleic acid libraries and methods of production thereof |
| WO1999028505A1 (en) | 1997-12-03 | 1999-06-10 | Curagen Corporation | Methods and devices for measuring differential gene expression |
| WO2000014282A1 (en) | 1998-09-04 | 2000-03-16 | Lynx Therapeutics, Inc. | Method of screening for genetic polymorphism |
| US6629040B1 (en) | 1999-03-19 | 2003-09-30 | University Of Washington | Isotope distribution encoded tags for protein identification |
| CA2366459A1 (en) | 1999-03-26 | 2000-10-05 | Affymetrix, Inc. | Universal arrays |
| CA2644688C (en) | 1999-04-20 | 2012-11-13 | Kankyo Engineering Co., Ltd. | Method for determining a concentration of target nucleic acid molecules, nucleic acid probes for the method, and method for analysing data obtained by the method |
| US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
| US6326148B1 (en) | 1999-07-12 | 2001-12-04 | The Regents Of The University Of California | Detection of copy number changes in colon cancer |
| US6440706B1 (en) | 1999-08-02 | 2002-08-27 | Johns Hopkins University | Digital amplification |
| SE9903988D0 (sv) | 1999-11-03 | 1999-11-03 | Amersham Pharm Biotech Ab | Method of analysis |
| US6489114B2 (en) | 1999-12-17 | 2002-12-03 | Bio Merieux | Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby |
| ATE411397T1 (de) | 2000-02-07 | 2008-10-15 | Illumina Inc | Nukleinsäure-nachweisverfahren mit universellem priming |
| GB2364054B (en) | 2000-03-24 | 2002-05-29 | Smithkline Beecham Corp | Method of amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof |
| US20030207300A1 (en) | 2000-04-28 | 2003-11-06 | Matray Tracy J. | Multiplex analytical platform using molecular tags |
| US20030064366A1 (en) | 2000-07-07 | 2003-04-03 | Susan Hardin | Real-time sequence determination |
| ATE380883T1 (de) | 2000-10-24 | 2007-12-15 | Univ Leland Stanford Junior | Direkte multiplex charakterisierung von genomischer dna |
| US20020142345A1 (en) | 2000-12-22 | 2002-10-03 | Nelsen Anita J. | Methods for encoding and decoding complex mixtures in arrayed assays |
| US20030049616A1 (en) | 2001-01-08 | 2003-03-13 | Sydney Brenner | Enzymatic synthesis of oligonucleotide tags |
| WO2002070684A2 (en) | 2001-01-11 | 2002-09-12 | Lion Bioscience Ag | Gene library for screening methods |
| US7027932B2 (en) | 2001-03-21 | 2006-04-11 | Olympus Optical Co., Ltd. | Biochemical examination method |
| US6849404B2 (en) | 2001-05-07 | 2005-02-01 | Bioneer Corporation | Polymerase chain reaction of DNA of which base sequence is completely unidentified |
| JP3871904B2 (ja) * | 2001-06-07 | 2007-01-24 | 日立ソフトウエアエンジニアリング株式会社 | 樹状図表示方法 |
| US6905827B2 (en) | 2001-06-08 | 2005-06-14 | Expression Diagnostics, Inc. | Methods and compositions for diagnosing or monitoring auto immune and chronic inflammatory diseases |
| US6830931B2 (en) | 2001-07-12 | 2004-12-14 | Automated Cell, Inc. | Method and apparatus for monitoring of proteins and cells |
| JP2005512557A (ja) * | 2001-11-07 | 2005-05-12 | ザ ボード オブ トラスティーズ オブ ザ ユニヴァーシティー オブ アーカンソー | 遺伝子発現プロファイリングに基づく多発性骨髄腫の診断、予後、および治療標的候補の同定 |
| US20060141493A1 (en) * | 2001-11-09 | 2006-06-29 | Duke University Office Of Science And Technology | Atherosclerotic phenotype determinative genes and methods for using the same |
| EP1476569A2 (en) | 2002-01-29 | 2004-11-17 | Global Genomics AB | Methods and means for manipulating nucleic acid |
| JP2005516310A (ja) * | 2002-02-01 | 2005-06-02 | ロゼッタ インファーマティクス エルエルシー | 遺伝子を特定し、形質に関連する経路を明らかにするコンピュータ・システムおよび方法 |
| US20030186251A1 (en) | 2002-04-01 | 2003-10-02 | Brookhaven Science Associates, Llc | Genome sequence tags |
| US20040162679A1 (en) * | 2002-05-03 | 2004-08-19 | Linheng Li | Method for predicting gene potential and cell commitment |
| US20070178478A1 (en) | 2002-05-08 | 2007-08-02 | Dhallan Ravinder S | Methods for detection of genetic disorders |
| US20050019776A1 (en) | 2002-06-28 | 2005-01-27 | Callow Matthew James | Universal selective genome amplification and universal genotyping system |
| EP1546721B2 (en) | 2002-08-16 | 2017-05-17 | Avantra Biosciences Corporation | Substrates for isolating, reacting and microscopically analyzing materials |
| US7361821B2 (en) | 2002-09-20 | 2008-04-22 | Intel Corporation | Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading |
| US7822555B2 (en) | 2002-11-11 | 2010-10-26 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
| EP1578994A2 (en) | 2002-11-11 | 2005-09-28 | Affymetrix, Inc. | Methods for identifying dna copy number changes |
| US7704687B2 (en) | 2002-11-15 | 2010-04-27 | The Johns Hopkins University | Digital karyotyping |
| US7269518B2 (en) | 2003-04-30 | 2007-09-11 | Agilent Technologies, Inc. | Chemical array reading |
| US20060078941A1 (en) * | 2003-06-09 | 2006-04-13 | Santin Alessandro D | Gene expression profiling in primary ovarian serous papillary tumors and normal ovarian epithelium |
| US20040259118A1 (en) | 2003-06-23 | 2004-12-23 | Macevicz Stephen C. | Methods and compositions for nucleic acid sequence analysis |
| JP5183063B2 (ja) | 2003-07-05 | 2013-04-17 | ザ ジョンズ ホプキンス ユニバーシティ | 遺伝的変異の検出および列挙のための方法ならびに組成物 |
| US20050048498A1 (en) | 2003-08-29 | 2005-03-03 | Applera Corporation | Compositions, methods, and kits for assembling probes |
| US7824856B2 (en) | 2003-09-10 | 2010-11-02 | Althea Technologies, Inc. | Expression profiling using microarrays |
| EP1524319A1 (en) * | 2003-10-13 | 2005-04-20 | Nederlandse Organisatie voor toegepast-natuurwetenschappelijk Onderzoek TNO | Method of classifying chemical agents and identifying cellular targets thereof |
| US20080261204A1 (en) | 2004-01-23 | 2008-10-23 | Lingvitae As | Polynucleotide Ligation Reactions |
| DE602005018166D1 (de) | 2004-02-12 | 2010-01-21 | Population Genetics Technologi | Genetische analyse mittels sequenzspezifischem sortieren |
| US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
| US20050250147A1 (en) | 2004-05-10 | 2005-11-10 | Macevicz Stephen C | Digital profiling of polynucleotide populations |
| AU2005252242A1 (en) | 2004-06-07 | 2005-12-22 | Irm Llc | Dispensing systems, software, and related methods |
| US20060035258A1 (en) | 2004-08-06 | 2006-02-16 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
| US20060041385A1 (en) | 2004-08-18 | 2006-02-23 | Bauer Kenneth D | Method of quantitating proteins and genes in cells using a combination of immunohistochemistry and in situ hybridization |
| US20060073506A1 (en) | 2004-09-17 | 2006-04-06 | Affymetrix, Inc. | Methods for identifying biological samples |
| DK1836302T3 (da) | 2004-12-23 | 2010-08-02 | Ge Healthcare Bio Sciences | Ligeringsbaseret RNA-amplifikation |
| US8883487B2 (en) | 2004-12-23 | 2014-11-11 | Abbott Point Of Care Inc. | Molecular diagnostics system and methods |
| US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
| WO2006085616A1 (ja) | 2005-02-10 | 2006-08-17 | Riken | 核酸配列増幅方法 |
| US20060211030A1 (en) | 2005-03-16 | 2006-09-21 | Sydney Brenner | Methods and compositions for assay readouts on multiple analytical platforms |
| EP2371453A1 (en) | 2005-03-18 | 2011-10-05 | Fluidigm Corporation | Microfluidic device |
| US7695886B2 (en) | 2005-05-19 | 2010-04-13 | Fuji Xerox Co., Ltd. | Process for producing resin particle liquid dispersion for electrostatic image developing toner, electrostatic image developing toner and production process thereof |
| US20060263789A1 (en) | 2005-05-19 | 2006-11-23 | Robert Kincaid | Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using |
| US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
| US7375211B2 (en) | 2005-11-18 | 2008-05-20 | Kou Zhong C | Method for detection and quantification of T-cell receptor Vβ repertoire |
| US20080070303A1 (en) | 2005-11-21 | 2008-03-20 | West Michael D | Methods to accelerate the isolation of novel cell strains from pluripotent stem cells and cells obtained thereby |
| WO2007087310A2 (en) | 2006-01-23 | 2007-08-02 | Population Genetics Technologies Ltd. | Nucleic acid analysis using sequence tokens |
| WO2007087312A2 (en) | 2006-01-23 | 2007-08-02 | Population Genetics Technologies Ltd. | Molecular counting |
| WO2007114772A1 (en) | 2006-04-04 | 2007-10-11 | Sidec Technologies Ab | Extended electron tomography |
| US20080194414A1 (en) | 2006-04-24 | 2008-08-14 | Albert Thomas J | Enrichment and sequence analysis of genomic regions |
| WO2007136874A2 (en) | 2006-05-18 | 2007-11-29 | President And Fellows Of Harvard College | Genomic library construction |
| EP2082063B1 (en) | 2006-11-15 | 2014-05-07 | Biospherex LLC | Multitag sequencing and ecogenomics analysis |
| EP2639578B1 (en) | 2006-12-14 | 2016-09-14 | Life Technologies Corporation | Apparatus for measuring analytes using large scale fet arrays |
| WO2008087869A1 (ja) | 2007-01-16 | 2008-07-24 | Olympus Corporation | 蛍光信号解析装置および蛍光信号解析方法 |
| WO2008109207A2 (en) | 2007-01-30 | 2008-09-12 | The Regents Of The University Of California | Methods and devices for biomolecular arrays |
| US20080269068A1 (en) | 2007-02-06 | 2008-10-30 | President And Fellows Of Harvard College | Multiplex decoding of sequence tags in barcodes |
| WO2008096318A2 (en) | 2007-02-09 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Identification system |
| KR100882711B1 (ko) | 2007-03-12 | 2009-02-06 | 성균관대학교산학협력단 | 사이크로박터 스피시스 hj147 균주 유래의 우라실-dna글리코실라제 및 이의 용도 |
| US20080274458A1 (en) | 2007-05-01 | 2008-11-06 | Latham Gary J | Nucleic acid quantitation methods |
| US20090061513A1 (en) | 2007-05-15 | 2009-03-05 | Picovitro Ab | Cell sorting and cell cultivation methods |
| JP2010528608A (ja) | 2007-06-01 | 2010-08-26 | 454 ライフ サイエンシーズ コーポレイション | 複合的な混合物から個々の試料を特定するためのシステムおよび方法 |
| EP2395113A1 (en) | 2007-06-29 | 2011-12-14 | Population Genetics Technologies Ltd. | Methods and compositions for isolating nucleic acid sequence variants |
| EP2294408A4 (en) | 2008-02-21 | 2011-05-25 | Gentel Biosciences Inc | SUBSTRATES FOR MULTIPLEX TEST PROCEDURES AND USES THEREFOR |
| US20090298709A1 (en) | 2008-05-28 | 2009-12-03 | Affymetrix, Inc. | Assays for determining telomere length and repeated sequence copy number |
| DE102008025656B4 (de) | 2008-05-28 | 2016-07-28 | Genxpro Gmbh | Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung |
| WO2009148560A2 (en) | 2008-05-30 | 2009-12-10 | Board Of Regents, The Universtiy Of Texas System | Methods and compositions for nucleic acid sequencing |
| US20100069250A1 (en) | 2008-08-16 | 2010-03-18 | The Board Of Trustees Of The Leland Stanford Junior University | Digital PCR Calibration for High Throughput Sequencing |
| US8476013B2 (en) | 2008-09-16 | 2013-07-02 | Sequenom, Inc. | Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses |
| EP2207119A1 (en) * | 2009-01-06 | 2010-07-14 | Koninklijke Philips Electronics N.V. | Evolutionary clustering algorithm |
| US9329170B2 (en) | 2009-01-20 | 2016-05-03 | The Board Of Trustees Of The Leland Stanford Junior University | Single cell gene expression for diagnosis, prognosis and identification of drug targets |
| US20100323348A1 (en) | 2009-01-31 | 2010-12-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process |
| ES2617191T3 (es) | 2009-03-05 | 2017-06-15 | Daiichi Sankyo Company, Limited | Derivado de piridina como inhibidor de PPARY |
| ES2706227T3 (es) | 2009-03-30 | 2019-03-27 | Illumina Inc | Análisis de expresión génica en células individuales |
| EP2789694A1 (en) | 2009-04-02 | 2014-10-15 | Fluidigm Corporation | Microfluidic device with reaction product recovery system |
| WO2010127186A1 (en) | 2009-04-30 | 2010-11-04 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
| GB0909923D0 (en) | 2009-06-09 | 2009-07-22 | Oxford Gene Tech Ip Ltd | Picowell capture devices for analysing single cells or other particles |
| EP2789689B1 (en) | 2009-06-29 | 2016-04-27 | Luminex Corporation | Chimeric primers with hairpin conformations and methods of using same |
| US8330957B2 (en) | 2009-06-29 | 2012-12-11 | Hager Enviromental and Atmospheric Technologies, LLC | Device and method for quantification of gases in plumes by remote sensing |
| ES2562159T3 (es) | 2009-08-20 | 2016-03-02 | Population Genetics Technologies Ltd. | Composiciones y métodos para el reordenamiento de ácido nucleico molecular |
| US8936762B2 (en) | 2009-09-01 | 2015-01-20 | Trustees Of Boston University | High throughput multichannel reader and uses thereof |
| US9625454B2 (en) | 2009-09-04 | 2017-04-18 | The Research Foundation For The State University Of New York | Rapid and continuous analyte processing in droplet microfluidic devices |
| WO2011041308A1 (en) | 2009-09-30 | 2011-04-07 | Quest Diagnostics Investments Incorporated | Bcr-abl truncation mutations |
| US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
| US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
| AU2010343278B2 (en) | 2010-01-19 | 2015-05-21 | Verinata Health, Inc. | Simultaneous determination of aneuploidy and fetal fraction |
| CA2786564A1 (en) | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing |
| EP4435111A1 (en) | 2010-02-12 | 2024-09-25 | Bio-Rad Laboratories, Inc. | Digital analyte analysis |
| US8951940B2 (en) | 2010-04-01 | 2015-02-10 | Illumina, Inc. | Solid-phase clonal amplification and related methods |
| WO2011143659A2 (en) | 2010-05-14 | 2011-11-17 | Fluidigm Corporation | Nucleic acid isolation methods |
| US8828688B2 (en) | 2010-05-27 | 2014-09-09 | Affymetrix, Inc. | Multiplex amplification methods |
| WO2011153684A1 (en) * | 2010-06-08 | 2011-12-15 | Biomerieux | Method and kit for the prognosis of colorectal cancer |
| EP4242327A3 (en) | 2010-06-09 | 2023-11-29 | Keygene N.V. | Combinatorial sequence barcodes for high throughput screening |
| EP2407242A1 (en) | 2010-07-13 | 2012-01-18 | Dublin City University | Direct clone analysis and selection technology |
| US20120040843A1 (en) | 2010-08-12 | 2012-02-16 | Dublin City University | Centrifugal capture system |
| ES2523140T3 (es) | 2010-09-21 | 2014-11-21 | Population Genetics Technologies Ltd. | Aumento de la confianza en las identificaciones de alelos con el recuento molecular |
| WO2012042374A2 (en) | 2010-10-01 | 2012-04-05 | Anssi Jussi Nikolai Taipale | Method of determining number or concentration of molecules |
| WO2012048341A1 (en) | 2010-10-08 | 2012-04-12 | President And Fellows Of Harvard College | High-throughput single cell barcoding |
| US20120088691A1 (en) | 2010-10-08 | 2012-04-12 | Gao Chen | Highly multiplexed real-time pcr using encoded microbeads |
| AU2011336707A1 (en) | 2010-11-29 | 2013-07-04 | Dako Denmark A/S | Methods and systems for analyzing images of specimens processed by a programmable quantitative assay |
| US20140057799A1 (en) | 2010-12-16 | 2014-02-27 | Gigagen | System and Methods for Massively Parallel Analysis of Nucleic Acids in Single Cells |
| US10241075B2 (en) | 2010-12-30 | 2019-03-26 | Life Technologies Corporation | Methods, systems, and computer readable media for nucleic acid sequencing |
| US20120190021A1 (en) | 2011-01-25 | 2012-07-26 | Aria Diagnostics, Inc. | Detection of genetic abnormalities |
| US9365897B2 (en) | 2011-02-08 | 2016-06-14 | Illumina, Inc. | Selective enrichment of nucleic acids |
| EP2675819B1 (en) | 2011-02-18 | 2020-04-08 | Bio-Rad Laboratories, Inc. | Compositions and methods for molecular labeling |
| US9260753B2 (en) | 2011-03-24 | 2016-02-16 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
| KR20120110431A (ko) | 2011-03-29 | 2012-10-10 | 에스케이하이닉스 주식회사 | 반도체 메모리 장치 |
| GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
| PL3246416T3 (pl) | 2011-04-15 | 2024-09-30 | The Johns Hopkins University | Bezpieczny system sekwencjonowania |
| EP2702175B1 (en) | 2011-04-25 | 2018-08-08 | Bio-Rad Laboratories, Inc. | Methods and compositions for nucleic acid analysis |
| US9074204B2 (en) | 2011-05-20 | 2015-07-07 | Fluidigm Corporation | Nucleic acid encoding reactions |
| HRP20250981T1 (hr) | 2011-05-24 | 2025-10-24 | BioNTech SE | Individualizirana cjepiva protiv raka |
| US9518292B2 (en) | 2011-05-26 | 2016-12-13 | Brandeis University | Methods for suppression PCR |
| US8841071B2 (en) | 2011-06-02 | 2014-09-23 | Raindance Technologies, Inc. | Sample multiplexing |
| US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
| CN102194133B (zh) * | 2011-07-05 | 2013-07-31 | 北京航空航天大学 | 基于数据聚类的适应性图像sift特征匹配方法 |
| US9340826B2 (en) | 2011-08-01 | 2016-05-17 | Celemics, Inc. | Method of preparing nucleic acid molecules |
| KR101337094B1 (ko) | 2011-11-30 | 2013-12-05 | 삼성에스디에스 주식회사 | 염기 서열 정렬 장치 및 그 방법 |
| WO2013117595A2 (en) | 2012-02-07 | 2013-08-15 | Illumina Cambridge Limited | Targeted enrichment and amplification of nucleic acids on a support |
| EP2823303A4 (en) | 2012-02-10 | 2015-09-30 | Raindance Technologies Inc | MOLECULAR DIAGNOSTIC SCREENING TEST |
| US9176031B2 (en) | 2012-02-24 | 2015-11-03 | Raindance Technologies, Inc. | Labeling and sample preparation for sequencing |
| US11177020B2 (en) | 2012-02-27 | 2021-11-16 | The University Of North Carolina At Chapel Hill | Methods and uses for molecular tags |
| CA2865575C (en) | 2012-02-27 | 2024-01-16 | Cellular Research, Inc. | Compositions and kits for molecular counting |
| EP2850211B1 (en) | 2012-05-14 | 2021-09-08 | iRepertoire, Inc. | Method for increasing accuracy in quantitative detection of polynucleotides |
| JP2015519900A (ja) | 2012-05-21 | 2015-07-16 | フリューダイム・コーポレイション | 粒子集団の単粒子解析方法及び単粒子単離方法 |
| EP2856177B1 (en) | 2012-05-25 | 2020-11-18 | The University of North Carolina At Chapel Hill | Microfluidic devices, solid supports for reagents and related methods |
| WO2013188872A1 (en) | 2012-06-15 | 2013-12-19 | The Board Of Regents Of The University Of Texas System | High throughput sequencing of multiple transcripts of a single cell |
| CA2876209A1 (en) | 2012-06-15 | 2013-12-19 | Adaptive Biotechnologies Corporation | Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set |
| US9957549B2 (en) | 2012-06-18 | 2018-05-01 | Nugen Technologies, Inc. | Compositions and methods for negative selection of non-desired nucleic acid sequences |
| WO2014015084A2 (en) | 2012-07-17 | 2014-01-23 | Counsyl, Inc. | System and methods for detecting genetic variation |
| US9695416B2 (en) | 2012-07-18 | 2017-07-04 | Siemens Healthcare Diagnostics Inc. | Method of normalizing biological samples |
| JP2015523087A (ja) | 2012-07-24 | 2015-08-13 | シーケンタ インコーポレイテッド | 配列タグを用いる単一細胞分析 |
| US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US20150005199A1 (en) | 2012-08-14 | 2015-01-01 | 10X Technologies, Inc. | Compositions and methods for sample processing |
| US20150005200A1 (en) | 2012-08-14 | 2015-01-01 | 10X Technologies, Inc. | Compositions and methods for sample processing |
| US20140378349A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
| US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
| US20140378345A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
| KR102090851B1 (ko) | 2012-08-14 | 2020-03-19 | 10엑스 제노믹스, 인크. | 마이크로캡슐 조성물 및 방법 |
| US20140378322A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
| US10155942B2 (en) | 2012-11-05 | 2018-12-18 | Takara Bio Usa, Inc. | Barcoding nucleic acids |
| US9489627B2 (en) * | 2012-11-19 | 2016-11-08 | Bottomline Technologies (De), Inc. | Hybrid clustering for data analytics |
| CA2894694C (en) | 2012-12-14 | 2023-04-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| WO2014108850A2 (en) | 2013-01-09 | 2014-07-17 | Yeda Research And Development Co. Ltd. | High throughput transcriptome analysis |
| WO2014116729A2 (en) | 2013-01-22 | 2014-07-31 | The Board Of Trustees Of The Leland Stanford Junior University | Haplotying of hla loci with ultra-deep shotgun sequencing |
| WO2014121126A2 (en) | 2013-02-01 | 2014-08-07 | Becton, Dickinson And Company | Methods and systems for assessing sample behavior in a flow cytometer |
| DK2954065T3 (da) | 2013-02-08 | 2021-09-06 | 10X Genomics Inc | Opdeling og bearbejdning af analytter og andre arter |
| WO2014126937A1 (en) | 2013-02-14 | 2014-08-21 | The Board Of Trustees Of The Leland Stanford Junior University | Suspension arrays and multiplexed assays based thereon |
| US20140274811A1 (en) | 2013-03-14 | 2014-09-18 | Lyle J. Arnold | Methods for Amplifying a Complete Genome or Transcriptome |
| US9799041B2 (en) * | 2013-03-15 | 2017-10-24 | The Nielsen Company (Us), Llc | Method and apparatus for interactive evolutionary optimization of concepts |
| WO2014144495A1 (en) | 2013-03-15 | 2014-09-18 | Abvitro, Inc. | Single cell bar-coding for antibody discovery |
| US20140303005A1 (en) | 2013-04-05 | 2014-10-09 | Raindance Technologies, Inc. | Rare cell analysis after negative selection |
| EP2805769A1 (en) | 2013-05-24 | 2014-11-26 | European Molecular Biology Laboratory | Methods for nano-scale single cell analysis |
| US20160122753A1 (en) | 2013-06-12 | 2016-05-05 | Tarjei Mikkelsen | High-throughput rna-seq |
| CA2915499A1 (en) | 2013-06-27 | 2014-12-31 | 10X Genomics, Inc. | Compositions and methods for sample processing |
| US9708657B2 (en) | 2013-07-01 | 2017-07-18 | Adaptive Biotechnologies Corp. | Method for generating clonotype profiles using sequence tags |
| ES2857908T3 (es) | 2013-08-28 | 2021-09-29 | Becton Dickinson Co | Análisis masivamente paralelo de células individuales |
| US10395758B2 (en) | 2013-08-30 | 2019-08-27 | 10X Genomics, Inc. | Sequencing methods |
| WO2015035087A1 (en) | 2013-09-04 | 2015-03-12 | Fluidigm Corporation | Proximity assays for detecting nucleic acids and proteins in a single cell |
| GB201317301D0 (en) | 2013-09-30 | 2013-11-13 | Linnarsson Sten | Method for capturing and encoding nucleic acid from a plurality of single cells |
| US10633691B2 (en) | 2013-09-30 | 2020-04-28 | Di Wu | Methods to profile molecular complexes or single cells via proximity dependant barcoding |
| CN105745528A (zh) | 2013-10-07 | 2016-07-06 | 赛卢拉研究公司 | 用于以数字方式对阵列上的特征进行计数的方法和系统 |
| EP3378952B1 (en) | 2013-12-28 | 2020-02-05 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
| CN106460033B (zh) | 2013-12-30 | 2021-12-24 | 阿特雷卡公司 | 使用核酸条形码分析与单细胞缔合的核酸 |
| AU2015227054A1 (en) | 2014-03-05 | 2016-09-22 | Adaptive Biotechnologies Corporation | Methods using randomer-containing synthetic molecules |
| US20150298091A1 (en) | 2014-04-21 | 2015-10-22 | President And Fellows Of Harvard College | Systems and methods for barcoding nucleic acids |
| GB201409282D0 (en) | 2014-05-23 | 2014-07-09 | Univ Sydney Tech | Sequencing process |
| KR102531677B1 (ko) | 2014-06-26 | 2023-05-10 | 10엑스 제노믹스, 인크. | 개별 세포 또는 세포 개체군으로부터 핵산을 분석하는 방법 |
| MX2016016904A (es) | 2014-06-26 | 2017-03-27 | 10X Genomics Inc | Analisis de secuencias de acidos nucleicos. |
| EP3165612B1 (en) | 2014-07-02 | 2021-08-18 | DNA Chip Research Inc. | Method for counting number of nucleic acid molecules |
| ES2880335T3 (es) | 2014-09-09 | 2021-11-24 | Igenomx Int Genomics Corporation | Métodos y composiciones para la preparación rápida de bibliotecas de ácidos nucleicos |
| CN107407691B (zh) | 2015-01-22 | 2021-07-27 | 贝克顿迪金森公司 | 用于单细胞中核酸靶标的分子条码化的装置和系统 |
| WO2016134078A1 (en) | 2015-02-19 | 2016-08-25 | Becton, Dickinson And Company | High-throughput single-cell analysis combining proteomic and genomic information |
| WO2016138500A1 (en) | 2015-02-27 | 2016-09-01 | Cellular Research, Inc. | Methods and compositions for barcoding nucleic acids for sequencing |
| US20180073073A1 (en) | 2015-03-18 | 2018-03-15 | Cellular Research, Inc. | Methods and compositions for labeling targets and haplotype phasing |
| ES2934982T3 (es) | 2015-03-30 | 2023-02-28 | Becton Dickinson Co | Métodos para la codificación con códigos de barras combinatorios |
| EP4282977B1 (en) * | 2015-04-10 | 2024-06-05 | 10x Genomics Sweden AB | Spatially distinguished, multiplex nucleic acid analysis of biological specimens |
| US11390914B2 (en) | 2015-04-23 | 2022-07-19 | Becton, Dickinson And Company | Methods and compositions for whole transcriptome amplification |
| US9618871B2 (en) | 2015-04-28 | 2017-04-11 | Kyocera Document Solutions Inc. | Image forming apparatus |
| CN108026524A (zh) | 2015-09-11 | 2018-05-11 | 赛卢拉研究公司 | 用于核酸文库标准化的方法和组合物 |
| CN109074430B (zh) | 2016-05-26 | 2022-03-29 | 贝克顿迪金森公司 | 分子标记计数调整方法 |
| TWI600309B (zh) | 2016-05-28 | 2017-09-21 | Hon Hai Prec Ind Co Ltd | 角度調整機構 |
| JP7232180B2 (ja) | 2016-11-08 | 2023-03-02 | ベクトン・ディキンソン・アンド・カンパニー | 発現プロファイル分類の方法 |
| EP4159871B1 (en) | 2017-03-24 | 2025-02-19 | Becton, Dickinson and Company | Synthetic multiplets for multiplets determination |
| CN111247589B (zh) | 2017-09-25 | 2025-06-03 | 贝克顿迪金森公司 | 免疫受体条形码错误校正 |
-
2017
- 2017-11-07 JP JP2019523873A patent/JP7232180B2/ja active Active
- 2017-11-07 CN CN201780068294.3A patent/CN109952612B/zh active Active
- 2017-11-07 WO PCT/US2017/060451 patent/WO2018089378A1/en not_active Ceased
- 2017-11-07 US US15/806,223 patent/US11164659B2/en active Active
- 2017-11-07 KR KR1020197015857A patent/KR102722820B1/ko active Active
- 2017-11-07 ES ES17805344T patent/ES2980967T3/es active Active
- 2017-11-07 SG SG11201903139SA patent/SG11201903139SA/en unknown
- 2017-11-07 AU AU2017359048A patent/AU2017359048B2/en active Active
- 2017-11-07 EP EP17805344.3A patent/EP3539035B1/en active Active
- 2017-11-07 CN CN202311546539.2A patent/CN117594126A/zh active Pending
-
2022
- 2022-09-29 AU AU2022241532A patent/AU2022241532A1/en not_active Abandoned
-
2023
- 2023-02-17 JP JP2023023174A patent/JP7637169B2/ja active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060211036A1 (en) | 2002-06-25 | 2006-09-21 | Yeh-Tze Chou | Metastasis-associated gene profiling for identification of tumor tissue, subtyping, and prediction of prognosis of patients |
| US20090170075A1 (en) | 2004-05-07 | 2009-07-02 | Gyorgy Petrovics | Methods of diagnosing or treating prostate cancer using the erg gene, alone or in combination with other over or under expressed genes in prostate cancer |
| US20080010304A1 (en) | 2006-03-29 | 2008-01-10 | Santosh Vempala | Techniques for clustering a set of objects |
| US20100145893A1 (en) | 2008-10-31 | 2010-06-10 | Abbott Laboratories | Genomic classification of non-small cell lung carcinoma based on patterns of gene copy number alterations |
| US20190218276A1 (en) | 2016-03-21 | 2019-07-18 | The Broad Institute, Inc. | Methods for determining spatial and temporal gene expression dynamics in single cells |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3539035A1 (en) | 2019-09-18 |
| SG11201903139SA (en) | 2019-05-30 |
| WO2018089378A1 (en) | 2018-05-17 |
| US20180137242A1 (en) | 2018-05-17 |
| AU2017359048B2 (en) | 2022-07-21 |
| ES2980967T3 (es) | 2024-10-03 |
| AU2017359048A1 (en) | 2019-05-02 |
| CN117594126A (zh) | 2024-02-23 |
| CN109952612B (zh) | 2023-12-01 |
| EP3539035B1 (en) | 2024-04-17 |
| US11164659B2 (en) | 2021-11-02 |
| JP2023075114A (ja) | 2023-05-30 |
| JP2020504357A (ja) | 2020-02-06 |
| AU2022241532A1 (en) | 2022-10-27 |
| JP7637169B2 (ja) | 2025-02-27 |
| KR20190077062A (ko) | 2019-07-02 |
| KR102722820B1 (ko) | 2024-10-29 |
| CN109952612A (zh) | 2019-06-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7637169B2 (ja) | 発現プロファイル分類の方法 | |
| JP7615109B2 (ja) | マルチプレットを決定するための合成マルチプレット | |
| JP7706485B2 (ja) | 細胞標識分類の方法 | |
| US20230065324A1 (en) | Molecular label counting adjustment methods |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201109 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201109 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211215 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211215 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220315 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220513 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220711 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221011 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221118 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230118 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230217 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7232180 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |


