JP7129343B2 - 正確な分子バーコーディング - Google Patents

正確な分子バーコーディング Download PDF

Info

Publication number
JP7129343B2
JP7129343B2 JP2018557413A JP2018557413A JP7129343B2 JP 7129343 B2 JP7129343 B2 JP 7129343B2 JP 2018557413 A JP2018557413 A JP 2018557413A JP 2018557413 A JP2018557413 A JP 2018557413A JP 7129343 B2 JP7129343 B2 JP 7129343B2
Authority
JP
Japan
Prior art keywords
oligonucleotide species
less
unique oligonucleotide
barcode
unique
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018557413A
Other languages
English (en)
Other versions
JP2019520046A5 (ja
JP2019520046A (ja
Inventor
エリーン シャム,
グレン フー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Becton Dickinson and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Becton Dickinson and Co filed Critical Becton Dickinson and Co
Publication of JP2019520046A publication Critical patent/JP2019520046A/ja
Publication of JP2019520046A5 publication Critical patent/JP2019520046A5/ja
Priority to JP2022106377A priority Critical patent/JP2022153390A/ja
Application granted granted Critical
Publication of JP7129343B2 publication Critical patent/JP7129343B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Description

関連出願の参照
本出願は、2016年5月2日出願の米国仮特許出願第62/330,500号明細書(その全体が本出願をもって参照により組み込まれる)に基づく利益を主張する。
配列リストの参照
本出願は、電子形式の配列リストと共に出願されている。配列リストは、2017年4月18日に32,588バイトのサイズで作成され最後に修正されたSEQUENCEBDCRI019WO.TXTという名称のファイルとして提供される。配列リストの電子形式の情報は、その全体が参照により本明細書に組み込まれる。
本明細書の実施形態は、一般的には、分子(たとえば核酸分子)の正確なバーコーディングのための組成物および方法に関する。
いくつかの実施形態は、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物を提供することを含む。各ユニークオリゴヌクレオチド種は、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含みうるとともに、ユニークオリゴヌクレオチド種は、そのバーコード領域に異なる核酸配列を含み、かつ(a)組成物は各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または(b)組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードは全体として12.5%以下のG含有率を有するか、の少なくとも一方である。いくつかの実施形態では、バーコード領域は、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、バーコード領域の3’側に標的特異的領域をさらに含み、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む。いくつかの実施形態では、組成物は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも2つの空間分離されたプールに配設され、各プールは、ユニークオリゴヌクレオチド種の少なくとも100ユニークオリゴヌクレオチドを含み、同一のプールのユニークオリゴヌクレオチドは、同一のサンプルバーコード配列を含み、かつ同一のプールの異なるユニークオリゴヌクレオチドは、異なる分子バーコード配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種のサンプルバーコードは、50%以下のG含有率を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種のバーコード領域は、50%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、組成物は、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列を含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。いくつかの実施形態では、各オリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各オリゴヌクレオチド種は24~140ヌクレオチド長を有する。いくつかの実施形態では、組成物は少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、組成物は少なくとも65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、組成物は同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、組成物の2オリゴヌクレオチドは同一のユニークオリゴヌクレオチド種でない。いくつかの実施形態では、組成物は少なくとも48プールを含む。いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、各基材に固定されたオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように基材に固定される。いくつかの実施形態では、基材は、表面が2つ以上の基材を含みうるように表面の離散領域を含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、基材にユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域は、アダプターの3’側にある。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプター可変領域コード配列または免疫グロブリン可変領域コード配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、免疫細胞レセプター可変領域コード配列は、T細胞レセプター可変領域コード配列、B細胞レセプター可変領域コード配列、またはそれらの組合せである。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物を含むキットが提供される。キットは、標的特異的領域と共に可変領域を増幅するようにプライマーを構成すべく、可変領域の標的特異的領域がある側とは反対側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成されたプライマーをさらに含みうる。いくつかの実施形態では、プライマーおよび標的特異的領域は、可変領域を含む少なくとも1kbの核酸を増幅するように構成される。いくつかの実施形態では、キットのプライマーは、ユニークオリゴヌクレオチド種を含む組成物の一部分である。いくつかの実施形態では、キットのプライマーは、ユニークオリゴヌクレオチド種を含む組成物とは別の他の組成物の一部分である。
いくつかの実施形態は、2つ以上のサンプルからの複数の核酸に特異的にバーコードを付ける方法を提供することを含む。各サンプルは核酸を含みうる。本方法は、各サンプルが他のサンプルから空間分離した状態で接触される条件で、各サンプルと少なくとも100ユニークオリゴヌクレオチド種を含むプールとを接触させることを含みうる。各ユニークオリゴヌクレオチド種は、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含みうる。各プールのユニークポリヌクレオチド種は、同一のサンプルバーコードを含みうるともに異なる分子バーコードを含みうる。本方法では、少なくとも、(a)サンプルに接触させるユニークオリゴヌクレオチド種は各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になること、または(b)すべてのユニークオリゴヌクレオチド種の分子バーコードは全体として12.5%以下のG含有率を有すること、を適用しうる。本方法は、ユニークオリゴヌクレオチド種の少なくともいくつかのオリゴヌクレオチドの標的特異的領域をサンプルの核酸の少なくともいくつかにハイブリダイズさせることを含みうる。本方法は、ハイブリダイズされたオリゴヌクレオチドを伸長させることにより、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む鎖を生成することを含みうる。ただし、各サンプルでは、鎖は同一のサンプルバーコードと異なる分子バーコードとを含み、かつ異なるサンプルでは、分子バーコードは異なる。いくつかの実施形態では、バーコード領域は、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、バーコード領域の3’側に標的特異的領域をさらに含み、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む鎖の核酸配列を確認することをさらに含む。いくつかの実施形態では、各プールの少なくとも100ユニークオリゴヌクレオチド種は、所与の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを含むようにかつ基材に固定された異なるユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、基材に固定される。いくつかの実施形態では、各サンプルバーコードは、50%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、各プールは、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列を含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、少なくとも1プールは、同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、プールは、同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、少なくとも48ユニークサンプルは、それぞれ、ユニークプールと接触させる。いくつかの実施形態では、サンプルの少なくとも99%は、それぞれ、1細胞以下である。いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、複数の基材のそれぞれに固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように基材に固定される。いくつかの実施形態では、基材は、異なるプールの基材が空間分離された異なる表面領域を含むように空間分離された表面領域を含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、基材にユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域は、アダプターの3’側にある。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、可変領域は、T細胞レセプターもしくはB細胞レセプターのものまたはそれらの組合せである。いくつかの実施形態では、本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む伸長鎖と、可変領域の標的特異的領域がある側とは反対側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成されたプライマーと、を接触させることをさらに含む。このため、本方法は、T細胞レセプター、B細胞レセプター、または免疫グロブリンの可変領域をコードする配列を増幅することを含みうる。いくつかの実施形態では、本方法は、可変領域コード配列を含む少なくとも1kbの配列を増幅する。
いくつかの実施形態は、ユニークオリゴヌクレオチドを含む組成物の作製方法を提供することを含む。本方法は、それぞれ少なくとも3ヌクレオチドを含む複数の異なるサンプルバーコードを提供することを含みうる。本方法は、それぞれ少なくとも7ヌクレオチドを含む複数の異なる分子バーコードを提供することを含みうる。本方法は、複数のユニークオリゴヌクレオチド種を合成することを含みうる。ただし、各ユニークオリゴヌクレオチド種は、サンプルバーコードと分子バーコードとを含むバーコード領域を含み、(a)複数のユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または(b)複数のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有するか、の少なくとも一方である。本方法は、空間分離されたプールにユニークオリゴヌクレオチド種を配設することを含みうる。ただし、各プールは、同一のプールのユニークオリゴヌクレオチド種が同一のサンプルバーコード配列を含むようにかつ同一のプールの異なるユニークオリゴヌクレオチド種が異なる分子バーコード配列を含むように複数のユニークオリゴヌクレオチド種を含み、かつ各プールは、少なくとも1000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、バーコード領域の3’側に標的特異的領域をさらに含み、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、複数のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、各分子バーコードは、50%以下のG含有率を有する。いくつかの実施形態では、各サンプルバーコードは、50%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のサンプルバーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種は、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列を含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側のスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、少なくとも48プールが作製される。いくつかの実施形態では、本方法は、複数の基材のそれぞれに固定されたオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、各プールのユニークオリゴヌクレオチド種を基材に固定することをさらに含む。いくつかの実施形態では、基材は離散表面領域を含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成と同時に配設される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成の後に配設される。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、免疫細胞レセプター可変領域コード配列は、T細胞レセプター可変領域コード配列、B細胞レセプター可変領域コード配列、またはそれらの組合せである。いくつかの実施形態では、キットは、可変領域コード配列の標的特異的領域がある側とは反対側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成された、したがって、標的特異的領域と共に可変領域コード配列を増幅するように構成された、プライマーをさらに含む。
いくつかの実施形態は、アダプター領域の3’側にバーコード領域を含むオリゴヌクレオチドを含む。バーコード領域は、少なくとも7ヌクレオチドを含む分子バーコードを含みうるとともに、分子バーコードは、50%以下のG含有率を有する。いくつかの実施形態では、オリゴヌクレオチドは、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む。いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む標的特異的領域を含む。いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の5’側にアダプター領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、免疫細胞レセプター可変領域コード配列は、T細胞レセプター可変領域コード配列、B細胞レセプター可変領域コード配列、またはそれらの組合せである。いくつかの実施形態では、キットは、可変領域コード配列の標的特異的領域がある側とは反対側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成された、したがって、標的特異的領域と共に可変領域コード配列を増幅するように構成された、プライマーをさらに含む。
なお、本発明としては、以下の態様も好ましい。
〔1〕 少なくとも1000ユニークオリゴヌクレオチド種を含む組成物であって、各ユニークオリゴヌクレオチド種が、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含み、
前記ユニークオリゴヌクレオチド種がそのバーコード領域に異なる核酸配列を含み、かつ
(a)前記組成物がユニークオリゴヌクレオチド種から本質的になりその各分子バーコードが50%未満のG含有率を有するか、または
(b)前記組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有するか、
の少なくとも一方である、組成物。
〔2〕 前記バーコード領域が、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む、〔1〕に記載の組成物。
〔3〕 各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側にユニフォーム領域をさらに含む、〔1〕または〔2〕に記載の組成物。
〔4〕 前記ユニフォーム領域が前記バーコード領域の3’側に標的特異的領域をさらに含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含む、〔3〕に記載の組成物。
〔5〕 前記組成物がユニークオリゴヌクレオチド種から本質的になりその各分子バーコードが50%未満のG含有率を有する、〔1〕~〔4〕のいずれか一項に記載の組成物。
〔6〕 前記組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有する、〔1〕~〔5〕のいずれか一項に記載の組成物。
〔7〕 前記ユニークオリゴヌクレオチド種が少なくとも2つの空間分離されたプールに配設され、各プールが前記ユニークオリゴヌクレオチド種の少なくとも100ユニークオリゴヌクレオチドを含み、同一のプールのユニークオリゴヌクレオチドが同一のサンプルバーコード配列を含み、かつ同一のプールの異なるユニークオリゴヌクレオチドが異なる分子バーコード配列を含む、〔1〕~〔6〕のいずれか一項に記載の組成物。
〔8〕 各ユニークオリゴヌクレオチド種のサンプルバーコードが50%以下のG含有率を有する、〔2〕~〔7〕のいずれか一項に記載の組成物。
〔9〕 各ユニークオリゴヌクレオチド種のバーコード領域が50%以下のG含有率を有する、〔1〕~〔8〕のいずれか一項に記載の組成物。
〔10〕 前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%未満のG含有率を有する、〔1〕~〔9〕のいずれか一項に記載の組成物。
〔11〕 前記ユニークオリゴヌクレオチド種のバーコード領域が全体として12.5%以下のG含有率を有する、〔1〕~〔10〕のいずれか一項に記載の組成物。
〔12〕 前記ユニークオリゴヌクレオチド種の少なくとも95%は分子バーコードのいずれのGも他のGに隣接しない、〔1〕~〔11〕のいずれか一項に記載の組成物。
〔13〕 前記組成物がユニークオリゴヌクレオチド種から本質的になりその分子バーコードのいずれのGも他のGに隣接しない、〔1〕~〔12〕のいずれか一項に記載の組成物。
〔14〕 前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%がHとNとが交互に合計で少なくとも6個現れる配列を含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔1〕~〔13〕のいずれか一項に記載の組成物。
〔15〕 前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%が配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔1〕~〔14〕のいずれか一項に記載の組成物。
〔16〕 前記ユニークオリゴヌクレオチド種の各分子バーコードが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔1〕~〔15〕のいずれか一項に記載の組成物。
〔17〕 前記ユニークオリゴヌクレオチド種の各分子バーコードが配列HHHHHHHHを含み、かつ各「H」がA、C、またはTのいずれか1つである、〔1〕~〔16〕のいずれか一項に記載の組成物。
〔18〕 前記ユニークオリゴヌクレオチド種のそれぞれが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔1〕~〔17〕のいずれか一項に記載の組成物。
〔19〕 前記ユニークオリゴヌクレオチド種のそれぞれが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HHHHHHHHを含み、かつ各「H」がA、C、またはTのいずれか1つである、〔1〕~〔17〕のいずれか一項に記載の組成物。
〔20〕 前記標的特異的領域がオリゴdT配列を含む、〔4〕~〔19〕のいずれか一項に記載の組成物。
〔21〕 各ユニークオリゴヌクレオチド種の前記分子バーコードが前記サンプルバーコードの3’側にある、〔1〕~〔20〕のいずれか一項に記載の組成物。
〔22〕 各ユニークオリゴヌクレオチド種の前記サンプルバーコードが前記分子バーコードの3’側にある、〔1〕~〔20〕のいずれか一項に記載の組成物。
〔23〕 各オリゴヌクレオチド種が少なくとも24ヌクレオチド長を有する、〔1〕~〔22〕のいずれか一項に記載の組成物。
〔24〕 各オリゴヌクレオチド種が24~140ヌクレオチド長を有する、〔1〕~〔22〕のいずれか一項に記載の組成物。
〔25〕 前記組成物が少なくとも6,500ユニークオリゴヌクレオチド種を含む、〔1〕~〔24〕のいずれか一項に記載の組成物。
〔26〕 前記組成物が少なくとも65,000ユニークオリゴヌクレオチド種を含む、〔1〕~〔24〕のいずれか一項に記載の組成物。
〔27〕 前記組成物が同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む、〔1〕~〔26〕のいずれか一項に記載の組成物。
〔28〕 前記組成物のいずれの2オリゴヌクレオチドも同一のユニークオリゴヌクレオチド種ではない、〔1〕~〔27〕のいずれか一項に記載の組成物。
〔29〕 前記組成物が少なくとも48プールを含む、〔7〕~〔28〕のいずれか一項に記載の組成物。
〔30〕 各基材に固定されたオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように各プールのユニークオリゴヌクレオチド種が基材に固定される、〔7〕~〔29〕のいずれか一項に記載の組成物。
〔31〕 表面が2つ以上の基材を含みうるように前記基材が離散表面領域を含む、〔30〕に記載の組成物。
〔32〕 前記基材がビーズを含む、〔30〕に記載の組成物。
〔33〕 前記ユニークオリゴヌクレオチド種のそれぞれが、前記ユニークオリゴヌクレオチドを前記基材に固定するように構成されたアダプターをさらに含み、前記バーコード領域が前記アダプターの3’側にある、〔27〕~〔29〕のいずれか一項に記載の組成物。
〔34〕 各サンプルが核酸を含む2サンプル以上からの複数の核酸に特異的にバーコードを付ける方法であって、
各サンプルが他のサンプルから空間分離した状態で接触される条件で各サンプルと少なくとも100ユニークオリゴヌクレオチド種を含むプールとを接触させることであって、 各ユニークオリゴヌクレオチド種が、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含み、
各プールのユニークポリヌクレオチド種が同一のサンプルバーコードを含むとともに異なる分子バーコードを含み、かつ
(a)前記サンプルに接触させる前記ユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または
(b)すべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有するか、
の少なくとも一方である、接触させることと、
前記ユニークオリゴヌクレオチド種の少なくともいくつかのオリゴヌクレオチドの標的特異的領域を前記サンプルの核酸の少なくともいくつかにハイブリダイズさせることと、 ハイブリダイズされた前記オリゴヌクレオチドを伸長させることにより、前記ユニークオリゴヌクレオチド種のオリゴヌクレオチドと前記標的に相補的な配列とを含む鎖を生成することであって、各サンプルでは前記鎖が同一のサンプルバーコードと異なる分子バーコードとを含み、かつ異なるサンプルでは分子バーコードが異なる、生成することと、
を含む方法。
〔35〕
前記バーコード領域が、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む、〔34〕に記載の方法。
〔36〕 各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側にユニフォーム領域をさらに含む、〔34〕または〔35〕に記載の方法。
〔37〕 前記ユニフォーム領域が前記バーコード領域の3’側に標的特異的領域をさらに含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含む、〔36〕に記載の方法。
〔38〕 前記サンプルに接触させる前記ユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる、〔34〕~〔37〕のいずれか一項に記載の方法。
〔39〕 すべての前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有する、〔34〕~〔38〕のいずれか一項に記載の方法。
〔40〕 前記ユニークオリゴヌクレオチド種のオリゴヌクレオチドと前記標的に相補的な配列とを含む鎖の核酸配列を確認することをさらに含む、〔34〕~〔39〕のいずれか一項に記載の方法。
〔41〕 所与の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを含むようにかつ前記基材に固定された異なるユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、各プールの少なくとも100ユニークオリゴヌクレオチド種が基材に固定される、〔34〕~〔40〕のいずれか一項に記載の方法。
〔42〕 各サンプルバーコードが50%以下のG含有率を有する、〔34〕~〔41〕のいずれか一項に記載の方法。
〔43〕 前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%未満のG含有率を有する、〔34〕~〔42〕のいずれか一項に記載の方法。
〔44〕 前記ユニークオリゴヌクレオチド種のバーコード領域が全体として12.5%以下のG含有率を有する、〔34〕~〔43〕のいずれか一項に記載の方法。
〔45〕 前記ユニークオリゴヌクレオチド種の少なくとも95%は前記分子バーコードのいずれのGも他のGに隣接しない、〔34〕~〔44〕のいずれか一項に記載の方法。
〔46〕 前記各プールが、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる、〔34〕~〔44〕のいずれか一項に記載の方法。
〔47〕 前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%がHとNとが交互に合計で少なくとも6個現れる配列を含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである、〔34〕~〔46〕のいずれか一項に記載の方法。
〔48〕 前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%が配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔34〕~〔47〕のいずれか一項に記載の方法。
〔49〕 前記ユニークオリゴヌクレオチド種の各分子バーコードが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔34〕~〔47〕のいずれか一項に記載の方法。
〔50〕 前記ユニークオリゴヌクレオチドの各分子バーコードが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、〔34〕~〔49〕のいずれか一項に記載の方法。
〔51〕 各ユニークオリゴヌクレオチドが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つであるむ、〔34〕~〔50〕のいずれか一項に記載の方法。
〔52〕 各ユニークオリゴヌクレオチドが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、〔34〕~〔50〕のいずれか一項に記載の方法。
〔53〕 少なくとも1プールが同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む、〔34〕~〔52〕のいずれか一項に記載の方法。
〔54〕 いずれのプールも同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない、〔34〕~〔52〕のいずれか一項に記載の方法。
〔55〕 前記標的特異的領域がオリゴdT配列を含む、〔34〕~〔54〕のいずれか一項に記載の方法。
〔56〕 各ユニークオリゴヌクレオチド種では前記分子バーコードが前記サンプルバーコードの3’側にある、〔34〕~〔55〕のいずれか一項に記載の方法。
〔57〕 各ユニークオリゴヌクレオチド種では前記サンプルバーコードが前記分子バーコードの3’側にある、〔34〕~〔55〕のいずれか一項に記載の方法。
〔58〕 各ユニークオリゴヌクレオチド種が少なくとも24ヌクレオチド長を有する、〔34〕~〔57〕のいずれか一項に記載の方法。
〔59〕 各ユニークオリゴヌクレオチド種が24~140ヌクレオチド長を有する、〔34〕~〔58〕のいずれか一項に記載の方法。
〔60〕 各プールが少なくとも6,500ユニークオリゴヌクレオチド種を含む、〔34〕~〔59〕のいずれか一項に記載の方法。
〔61〕 各プールが少なくとも65,000ユニークオリゴヌクレオチド種を含む、〔34〕~〔59〕のいずれか一項に記載の方法。
〔62〕 少なくとも48ユニークサンプルがそれぞれユニークプールに接触される、〔34〕~〔61〕のいずれか一項に記載の方法。
〔63〕 前記サンプルの少なくとも99%がそれぞれ1細胞以下である、〔34〕~〔62〕のいずれか一項に記載の方法。
〔64〕 複数の基材のそれぞれに固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、各プールのユニークオリゴヌクレオチド種が基材に固定される、〔34〕~〔63〕のいずれか一項に記載の方法。
〔65〕 異なるプールの基材が空間分離された異なる表面領域を含むように、前記基材が空間分離された表面領域を含む、〔64〕に記載の方法。
〔66〕 前記基材がビーズを含む、〔64〕に記載の方法。
〔67〕 前記ユニークオリゴヌクレオチド種のそれぞれが、前記基材に前記ユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域が前記アダプターの3’側にある、〔64〕~〔66〕のいずれか一項に記載の方法。
〔68〕 ユニークオリゴヌクレオチドを含む組成物を作製する方法であって、
それぞれ少なくとも3ヌクレオチドを含む複数の異なるサンプルバーコードを提供することと、
それぞれ少なくとも7ヌクレオチドを含む複数の異なる分子バーコードを提供することと、
各ユニークオリゴヌクレオチド種が、サンプルバーコードと分子バーコードとを含むバーコード領域を含む、複数のユニークオリゴヌクレオチド種を合成することであって、
(a)前記複数のユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または
(b)前記複数のユニークオリゴヌクレオチド種すべての分子バーコードが全体として12.5%以下のG含有率を有するか、
の少なくとも一方である、合成することと、
空間分離されたプールに前記ユニークオリゴヌクレオチド種を配設することであって、同一のプールのユニークオリゴヌクレオチド種が同一のサンプルバーコード配列を含むようにかつ同一のプールの異なるユニークオリゴヌクレオチド種が異なる分子バーコード配列を含むように各プールが複数のユニークオリゴヌクレオチド種を含み、
各プールが少なくとも1000ユニークオリゴヌクレオチド種を含む、配設することと、
を含む方法。
〔69〕 各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側にユニフォーム領域をさらに含む、〔68〕に記載の方法。
〔70〕 前記ユニフォーム領域が前記バーコード領域の3’側に標的特異的領域をさらに含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含む、〔69〕に記載の方法。
〔71〕 前記複数のユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる、〔68〕~〔70〕のいずれか一項に記載の方法。
〔72〕 前記複数のユニークオリゴヌクレオチド種すべての分子バーコードが全体として12.5%以下のG含有率を有する、〔68〕または〔69〕に記載の方法。
〔73〕 各分子バーコードが50%以下のG含有率を有する、〔68〕に記載の方法。
〔74〕 各サンプルバーコードが50%以下のG含有率を有する、〔68〕~〔69〕のいずれか一項に記載の方法。
〔75〕 前記ユニークオリゴヌクレオチド種のサンプルバーコードが全体として12.5%以下のG含有率を有する、〔68〕~〔72〕のいずれか一項に記載の方法。
〔76〕 前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%未満のG含有率を有する、〔68〕~〔72〕のいずれか一項に記載の方法。
〔77〕 前記ユニークオリゴヌクレオチド種のバーコード領域が全体として12.5%以下のG含有率を有する、〔68〕~〔76〕のいずれか一項に記載の方法。
〔78〕 前記ユニークオリゴヌクレオチド種の少なくとも95%は前記分子バーコードのいずれのGも他のGに隣接しない、〔68〕~〔77〕のいずれか一項に記載の方法。
〔79〕 前記複数のユニークオリゴヌクレオチド種が、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる、〔68〕~〔77〕のいずれか一項に記載の方法。
〔80〕 前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%がHとNとが交互に合計で少なくとも6個現れる配列を含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔68〕~〔79〕のいずれか一項に記載の方法。
〔81〕 前記ユニークオリゴヌクレオチドの分子バーコードの少なくとも95%が配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔68〕~〔80〕のいずれか一項に記載の方法。
〔82〕 前記ユニークオリゴヌクレオチドの各分子バーコードが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔68〕~〔81〕のいずれか一項に記載の方法。
〔83〕 前記ユニークオリゴヌクレオチドの各分子バーコードが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、〔68〕~〔82〕のいずれか一項に記載の方法。
〔84〕 各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、〔68〕~〔83〕のいずれか一項に記載の方法。
〔85〕 各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、〔68〕~〔84〕のいずれか一項に記載の方法。
〔86〕 前記標的特異的領域がオリゴdT配列を含む、〔70〕~〔85〕のいずれか一項に記載の方法。
〔87〕 各ユニークオリゴヌクレオチド種の前記分子バーコードが前記サンプルバーコードの3’側にある、〔68〕~〔86〕のいずれか一項に記載の方法。
〔88〕 各ユニークオリゴヌクレオチド種の前記サンプルバーコードが前記分子バーコードの3’側にある、〔68〕~〔86〕のいずれか一項に記載の方法。
〔89〕 各ユニークオリゴヌクレオチド種が少なくとも24ヌクレオチド長を有する、〔68〕~〔88〕のいずれか一項に記載の方法。
〔90〕 各ユニークオリゴヌクレオチド種が24~140ヌクレオチド長を有する、〔68〕~〔89〕のいずれか一項に記載の方法。
〔91〕 各プールが少なくとも6,500ユニークオリゴヌクレオチド種を含む、〔68〕~〔90〕のいずれか一項に記載の方法。
〔92〕 各プールが少なくとも65,000ユニークオリゴヌクレオチド種を含む、〔68〕~〔91〕のいずれか一項に記載の方法。
〔93〕 少なくとも48プールが作製される、〔68〕~〔92〕のいずれか一項に記載の方法。
〔94〕 前記複数の基材のそれぞれに固定され前記たオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、基材に各プールのユニークオリゴヌクレオチド種を固定することをさらに含む、〔68〕~〔93〕のいずれか一項に記載の方法。
〔95〕 前記基材が離散表面領域を含む、〔94〕に記載の方法。
〔96〕 前記基材がビーズを含む、〔94〕に記載の方法。
〔97〕 前記ユニークオリゴヌクレオチド種が空間分離されたプールに前記合成と同時に配設される、〔68〕~〔96〕のいずれか一項に記載の方法。
〔98〕 前記ユニークオリゴヌクレオチド種が空間分離されたプールに前記合成の後に配設される、〔68〕~〔96〕のいずれか一項に記載の方法。
〔99〕 アダプター領域の3’側にバーコード領域を含むオリゴヌクレオチドであって、前記バーコード領域が、少なくとも7ヌクレオチドを含む分子バーコードを含み、前記分子バーコードが50%以下のG含有率を有する、オリゴヌクレオチド。
〔100〕 少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む、〔99〕に記載のオリゴヌクレオチド。
〔101〕 前記バーコード領域の3’側にユニフォーム領域をさらに含む、〔99〕または〔100〕に記載のオリゴヌクレオチド。
〔102〕 前記ユニフォーム領域が、標的核酸に相補的な少なくとも10ヌクレオチドを含む標的特異的領域を含む、〔101〕に記載のオリゴヌクレオチド。
〔103〕 前記バーコード領域の5’側にアダプター領域をさらに含む、〔99〕~〔102〕のいずれか一項に記載のオリゴヌクレオチド。
〔104〕 前記ユニフォーム領域が、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む、〔3〕~〔19〕または〔21〕~〔33〕のいずれか一項に記載の組成物。
〔105〕 前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、〔104〕に記載の組成物。
〔106〕 〔104〕または〔105〕に記載の組成物を含むキットであって、前記標的特異的領域に対向して前記可変領域の反対側にハイブリダイズするようにかつ前記標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成された、それにより、前記標的特異的領域と共に前記可変領域を増幅するように構成されたプライマーをさらに含むキット。
〔107〕 前記プライマーおよび標的特異的領域が、前記可変領域を含む少なくとも1kbの核酸を増幅するように構成される、〔106〕に記載のキット。
〔108〕 前記ユニフォーム領域が、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む、〔36〕~〔54〕、〔56〕~〔67〕、〔69〕~〔85〕、または〔87〕~〔98〕のいずれか一項に記載の方法。
〔109〕 前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、〔108〕に記載の方法。
〔110〕 前記ユニフォーム領域が、免疫細胞レセプターまたは免疫グロブリンの可変領域にフランキングする配列を含む標的特異的領域を含む、〔101〕~〔103〕のいずれか一項に記載のオリゴヌクレオチド。
〔111〕 前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、〔110〕に記載のオリゴヌクレオチド。
図1Aは、本明細書のいくつかの実施形態に従ってユニフォーム領域の5’側にバーコード領域を含むオリゴヌクレオチド種を例示する模式図である。図1Bは、本明細書のいくつかの実施形態に従ってオリゴdT配列の5’側にバーコード領域を含むオリゴヌクレオチド種を例示する模式図である。図1Cは、本明細書のいくつかの実施形態に従って遺伝子特異的領域の5’側にバーコード領域を含むオリゴヌクレオチド種を例示する模式図である。
図2Aは、サンプルバーコードの5’側に分子バーコードを含むバーコード領域を例示する模式図であり、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種のバーコード領域を構成しうる。図2Bは、分子バーコードの5’側にサンプルバーコードを含むバーコード領域を例示する模式図であり、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種のバーコード領域を構成しうる。
図3A~3Hは、本明細書のいくつかの実施形態に従ってオリゴヌクレオチド種のさまざまな構成を例示する図である。図3Aは、ベースラインオリゴヌクレオチドを例示する。図3Bは、バーコード領域の3’側に塩基スペーサーを有するオリゴヌクレオチドを例示する。図3Cは、バーコード領域の3’側に5塩基スペーサーを有するオリゴヌクレオチドを例示する。図3Dは、分子バーコードがサンプルバーコードの5’側になるようにバーコード領域内の分子バーコード(「NNNNNNNN」で表される)およびサンプルバーコードの位置が図3Aと比較して入れ替えられたオリゴヌクレオチドを例示する。図3Eは、分子バーコードがサンプルバーコードの5’側になるようにバーコード領域内の分子バーコード(「NNNNNNNN」で表される)およびサンプルバーコードの位置が図3Aと比較して入れ替えられるとともに3塩基スペーサーを含むオリゴヌクレオチドを例示する。図3Fは、分子バーコードがサンプルバーコードの5’側になるようにバーコード領域内の分子バーコード(「NNNNNNNN」で表される)およびサンプルバーコードの位置が入れ替えられるとともに5塩基スペーサーを含むオリゴヌクレオチドを例示する。図3Gは、分子バーコードが配列HHHHHHHH(ただし、各Hは、A、C、またはTであり、かつ各Hは、いずれかの他のHと同一であっても異なっていてもよい)を含むオリゴヌクレオチドを例示する。図3Hは、分子バーコードが配列HNHNHNHN(ただし、各Hは、A、C、またはTであり、かつ各Hは、いずれかの他のHと同一であっても異なっていてもよい)を含むオリゴヌクレオチドを例示する。
同上。
図4Aは、従来のユニークオリゴヌクレオチド種のサンプリングにおけるヌクレオチド使用頻度を例示する図である。
図4Bは、従来のユニークオリゴヌクレオチド種のサンプリングにおけるヌクレオチド使用頻度を例示する図である。
図4Cは、従来のユニークオリゴヌクレオチド種のサンプリングにおけるヌクレオチド使用頻度を例示する図である。
図5Aは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。図5A~5Dの最も右側の列に指定された配列番号は、示されるように「アンカー」と「第1のbc」と「第2のbc」と「スペーサー」(もしあれば)と「5→3’認識配列」とを含むポリヌクレオチド配列を意味する。図5A~5D中の各「アンカー」は、配列番号97のポリヌクレオチド配列を有する。
図5Bは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。
図5Cは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。
図5Dは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。
図6は、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種を用いた分析での個別によるエラー訂正のグラフである。
図7は、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種を用いた分析での個別およびフィルターMIクロスオーバーによるエラー訂正のグラフである。
図8は、なんら理論により制限されるものではないが、高いG含有率を有するオリゴヌクレオチドから生じる可能性のある増幅エラーを模式的に例示する図である。
本明細書のいくつかの実施形態に従って核酸の正確なバーコーディングおよび分析のための方法および組成物を記載する。いくつかの実施形態では、増幅およびシーケンス解析によりサンプルの個別核酸を定量できるように、サンプルの個別核酸をユニークバーコード(たとえば「分子バーコード」)に関連付けることが可能である。なんら理論により制限されるものではないが、ある特定の種類のバーコード配列の提示、増幅、または性質に有利または不利なバイアスは、サンプルの個別核酸の定量および分析を妨害する可能性があることが企図される(いくつかの増幅イベントにおける可能性のあるバイアス源を図8に模式的に例示する)。本明細書のいくつかの実施形態には、バーコードを含むユニークオリゴヌクレオチド種の構成および特徴が記載されている。ただし、ユニークオリゴヌクレオチド種は、バーコード関連バイアスを最小限に抑えるようにかつ核酸の正確な分析をもたらすように構成される。なんら理論により制限されるものではないが、グアノシン(G)含有率が50%未満であることおよび/またはバーコード領域に2個の連続した「G」が存在しないことなどの特徴を含むバーコード領域は、さもなければサンプルの核酸の定量および/または分析を混乱させる可能性のあるバイアスを最小限に抑えることが可能であることが企図される。任意選択的に、所与のサンプルの個別核酸分子はまた、たとえば次世代シーケンシングによる2つ以上のサンプルからの核酸の効率的バッチ分析のためにバーコード関連核酸を後でプールできるように、「サンプルバーコード」に関連付けることも可能である。
核酸
本明細書のいくつかの実施形態に従って種々の核酸が記載されている。たとえば、オリゴヌクレオチド種、サンプル、および/または標的は、核酸を含みうる。
本明細書で用いられる場合、「核酸」とは、ポリヌクレオチド配列またはその断片を意味する。核酸はヌクレオチドを含みうる。核酸は細胞に対して外因性または内因性でありうる。核酸は細胞フリー環境中に存在しうる。核酸は遺伝子またはその断片を含むか、またはからなるかまたはそれらから本質的になる。核酸はDNAを含むか、またはからなるかまたはそれらから本質的になる。核酸はRNAを含むか、またはからなるかまたはそれらから本質的になる。核酸は1つ以上のアナログ(たとえば、修飾された骨格、糖または核酸塩基)を含みうる。アナログのいくつかの例としては、限定されるものではないが、5-ブロモウラシル、ペプチド核酸、ゼノ核酸、モルホリノ体、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(たとえば、糖に結合されたローダミンまたはフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基アナログ、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。「核酸」、「ポリヌクレオチド」、「標的ポリヌクレオチド」、および「標的核酸」は、同義的に用いうる。
本明細書で用いられる場合、「上流」(およびこのルート語の変化形)とは、核酸上の相対的に5’側(たとえば、参照位置と比較して5’側)の位置を意味する。本明細書で用いられる場合、「下流」(およびこのルート語の変化形)とは、核酸上の相対的に3’側(たとえば、参照位置と比較して3’側)の位置を意味する。たとえば、図2Aに示されるように、「サンプルバーコード」が「分子バーコード」の3’側にあるということは、分子「バーコード」の下流にあるものと理解される。たとえば、図2Bに示されるように、「サンプルバーコード」が「分子バーコード」の5’側にあるということは、分子「バーコード」の上流にあるものと理解される。
核酸は、新しいまたは向上した特徴(たとえば、向上した安定性)を有する核酸を提供するために1つ以上の修飾(たとえば、塩基修飾、骨格修飾)を含みうる。核酸は核酸アフィニティータグを含みうる。ヌクレオシドは塩基-糖の組合せを含むか、またはからなるかまたはそれらから本質的になる。ヌクレオシドの塩基部分はヘテロ環塩基でありうる。かかるヘテロ環塩基の2つの最も一般的なクラスはプリンおよびピリミジンである。ヌクレオチドは、ヌクレオシドの糖部分に共有結合されたリン酸基をさらに含むヌクレオシドを含むか、またはからなるかまたはそれらから本質的になる。ペントフラノシル糖を含むヌクレオシドでは、リン酸基は、糖の2’、3’、または5’ヒドロキシル部分に結合可能である。核酸を形成する際、リン酸基は、隣接ヌクレオシドを互いに共有結合して線状高分子化合物を形成可能である。ひいては、この線状高分子化合物のそれぞれの末端をさらに連結して環状化合物を形成可能である。しかしながら、線状化合物が一般に好適である。そのほかに、線状化合物は、内部ヌクレオチド塩基相補性を有しうるので、完全二本鎖または部分二本鎖の化合物を生成するようにフォールディングしうる。核酸内では、リン酸基は、通常、核酸のヌクレオシド間骨格を形成するものとして参照可能である。核酸の結合または骨格は、3’→5’ホスホジエステル結合でありうる。
核酸は、修飾骨格および/または修飾ヌクレオシド間結合を含みうる。修飾骨格は、骨格中にリン原子を保持するものおよび骨格中にリン原子を有していないものを含みうる。リン原子を中に含有する好適な修飾核酸骨格は、たとえば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、3’-アルキレンホスホネートや5’-アルキレンホスホネートなどのメチルや他のアルキルのホスホネート、キラルホスホネート、ホスフィネート、3’-アミノホスホルアミデートやアミノアルキルホスホルアミデートなどのホスホルアミデート、ホスホロジアミデート、チオノホスホルアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノホスフェート、および通常3’-5’結合、2’-5’結合アナログを有するボラノホスフェート、ならびに1つ以上のヌクレオチド間結合が3’→3’、5’→5’、または2’→2’結合である逆極性を有するものを含みうる。
核酸は、短鎖アルキルもしくはシクロアルキルのヌクレオシド間結合、混合ヘテロ原子およびアルキルもしくはシクロアルキルのヌクレオシド間結合、または1つ以上の短鎖ヘテロ原子もしくはヘテロ環のヌクレオシド間結合により形成されるポリヌクレオチド骨格を含みうる。これらは、モルホリノ結合(ヌクレオシドの糖部分から部分的に形成される)、シロキサン骨格、スルフィド、スルホキシド、およびスルホン骨格、ホルムアセチルおよびチオホルムアセチル骨格、メチレンホルムアセチルおよびチオホルムアセチル骨格、リボアセチル骨格、アルケン含有骨格、スルファメート骨格、メチレンイミノおよびメチレンヒドラジノ骨格、スルホネートおよびスルホンアミド骨格、アミド骨格を有するもの、ならびに混合N、O、S、およびCH構成部分を有する他のものを含みうる。
核酸は核酸ミメティックを含みうる。「ミメティック」という用語は、たとえば、フラノース環のみまたはフラノース環とヌクレオチド間結合の両方が非フラノース基で置き換えられているポリヌクレオチドを含み、フラノース環のみの置換えは、糖サロゲートであるとして参照可能である。ヘテロ環塩基部分または修飾ヘテロ環塩基部分は、適切な標的核酸とのハイブリダイゼーションのために保持可能である。かかる核酸の1つはペプチド核酸(PNA)でありうる。PNAでは、ポリヌクレオチドの糖骨格は、アミド含有骨格とくにアミノエチルグリシン骨格で置換え可能である。ヌクレオチドは保持可能であり、かつ骨格のアミド部分のアザ窒素原子に直接的または間接的に結合される。PNA化合物中の骨格は、PNAにアミド含有骨格を与える2つ以上の結合されたアミノエチルグリシン単位を含みうる。ヘテロ環塩基部分は、骨格のアミド部分のアザ窒素原子に直接的または間接的に結合可能である。
核酸はモルホリノ骨格構造を含みうる。たとえば、核酸は、リボース環の代わりに6員モルホリノ環を含みうる。これらの実施形態のいくつかでは、ホスホロジアミデートまたは他の非ホスホジエステルのヌクレオシド間結合によりホスホジエステル結合を置換え可能である。
核酸は、モルホリノ環に結合されたヘテロ環塩基を有する結合されたモルホリノ単位(すなわちモルホリノ核酸)を含みうる。結合基は、モルホリノ核酸中のモルホリノモノマー単位を結合可能である。非イオン性モルホリノ系オリゴマー化合物は、細胞タンパク質とのより少ない望ましくない相互作用を有しうる。モルホリノ系ポリヌクレオチドは、核酸の非イオン性ミミックでありうる。モルホリノクラス内のさまざまな化合物は、異なる結合基を用いて連結可能である。ポリヌクレオチドミメティックのさらなるクラスは、シクロヘキセニル核酸(CeNA)として参照可能である。核酸分子中に通常存在するフラノース環は、シクロヘキセニル環で置換え可能である。CeNA DMT保護ホスホロアミダイトモノマーは、ホスホロアミダイト化学を用いたオリゴマー化合物合成のために調製および使用が可能である。核酸鎖中へのCeNAモノマーの取込みは、DNA/RNAハイブリッドの安定性を増加可能である。CeNAオリゴアデニレートは、天然複合体に類似した安定性を有する核酸相補体との複合体を形成可能である。さらなる修飾は、2’-ヒドロキシル基が糖環の4’炭素原子に結合されて2’-C,4’-C-オキシメチレン結合を形成することにより二環式糖部分を形成するロックド核酸(LNA)を含みうる。結合は、2’酸素原子と4’炭素原子とを架橋するメチレン(-CH2-),基(式中、nは1または2である)を含むか、またはからなるかまたはそれらから本質的になる。LNAおよびLNAアナログは、相補的核酸との非常に高い二本鎖熱安定性(Tm=+3~+10℃)、3’-エキソヌクレアーゼ分解に対する安定性、および良好な溶解性を示しうる。
核酸はまた、いくつかの実施形態では、核酸塩基(単に「塩基」ということが多い)の修飾または置換を含みうる。本明細書で用いられる場合、「非修飾」または「天然」の核酸塩基は、プリン塩基(たとえば、アデニン(A)およびグアニン(G))ならびにピリミジン塩基(たとえば、チミン(T)、シトシン(C)、およびウラシル(U))を含みうる。修飾核酸塩基は、他の合成および天然の核酸塩基、たとえば、5-メチルシトシン(5-me-C)、5-ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2-アミノアデニン、アデニンおよびグアニンの6-メチルおよび他のアルキル誘導体、アデニンおよびグアニンの2-プロピルおよび他のアルキル誘導体、2-チオウラシル、2-チオチミン、および2-チオシトシン、5-ハロウラシルおよびシトシン、5-プロピニル(-C=C-CH3)ウラシルおよびシトシン、ならびにピリミジン塩基の他のアルキニル誘導体、6-アゾウラシル、シトシン、およびチミン、5-ウラシル(プソイドウラシル)、4-チオウラシル、8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシル、および他の8-置換アデニンおよびグアニン、5-ハロとくに5-ブロモ、5-トリフルオロメチルおよび他の5-置換ウラシルおよびシトシン、7-メチルグアニンおよび7-メチルアデニン、2-F-アデニン、2-アミノアデニン、8-アザグアニンおよび8-アザアデニン、7-デアザグアニンおよび7-デアザアデニン、ならびに3-デアザグアニンおよび3-デアアデニンを含みうる。修飾核酸塩基は、三環式ピリミジン、たとえば、フェノキサジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾオキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾチアジン-2(3H)-オン)、置換フェノキサジンシチジン(たとえば、9-(2-アミノエトキシ)-H-ピリミド(5,4-(b)(1,4)ベンゾオキサジン-2(3H)-オン)などのG-クランプ、カルバゾールシチジン(2H-ピリミド(4,5-b)インドール-2-オン)、ピリドインドールシチジン(Hピリド(3’,’:4,5)ピロロ[2,3-d]ピリミジン-2-オン)を含みうる。
本明細書で用いられる場合、「サンプル」という用語は、標的を含む組成物を意味する。本開示の方法、デバイス、およびシステムによる分析に好適なサンプルとしては、細胞、単一細胞、組織、器官、または生物が含まれるがこれらに限定されない。いくつかの実施形態では、サンプルは、生サンプルまたは未処理サンプル、たとえば、全細胞、全細胞集団、または全組織を含む。いくつかの実施形態では、サンプルは、単離された細胞もしくは細胞抽出物またはそれらの核酸含有画分たとえば単離された核酸、あるいは富化または単離された核酸を含む組成物を含む。いくつかの実施形態では、サンプルは、固定された組織、細胞、またはそれらの核酸含有画分を含む。いくつかの実施形態では、サンプルは、凍結された組織、細胞、またはそれらの核酸含有画分を含む。いくつかの実施形態では、サンプルは、核酸を含む溶液を含む。いくつかの実施形態では、サンプルは、核酸を含む溶液を含む。いくつかの実施形態では、サンプルは、固体形態の核酸、たとえば、凍結乾燥された核酸などを含む。
ユニークオリゴヌクレオチド種
本明細書のいくつかの実施形態に係る組成物、方法、およびオリゴヌクレオチドで用いられる場合、「ユニークオリゴヌクレオチド種」とは、他のユニークオリゴヌクレオチド種と少なくとも1塩基異なる配列を有するオリゴヌクレオチド(たとえば、DNA、RNA)を意味する。本明細書のいくつかの実施形態に係る組成物のユニークオリゴヌクレオチド種は、ある特定の構造上の特徴または形態を共有しうるが、互いに異なる核酸配列を有しうる。ユニークオリゴヌクレオチド種は、一本鎖または二本鎖でありうる。組成物は、2ユニークオリゴヌクレオチド種以上、たとえば、さまざまな100、1000、6500、または65,000ユニークオリゴヌクレオチド種を含みうる。任意選択的に、ユニークオリゴヌクレオチド種を含む組成物はまた、同一のユニークオリゴヌクレオチド種を2オリゴヌクレオチド以上含みうる。例として、組成物は、2ユニークオリゴヌクレオチド種:ACTT-XおよびTCTT-Xを含みうる。ただし、「X」は、両方のユニークオリゴヌクレオチド種で同一の配列である。組成物は、配列ACTT-Xを有するオリゴヌクレオチド2コピーと配列TCTT-Xを有するオリゴヌクレオチド1コピーとを含む可能性がありうる。
本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドのオリゴヌクレオチド種は、本明細書に記載されるようにバーコード領域とユニフォーム領域とを含みうる。バーコード領域は、ユニークオリゴヌクレオチド種集団の多様性を提供するためにユニークオリゴヌクレオチド種間で異なりうるのに対し、ユニフォーム領域は同じままである。バーコード領域は、本明細書に記載されるように分子インデックスを含みうる。分子インデックスは、たとえば、ユニークオリゴヌクレオチド種集団中のユニークオリゴヌクレオチド種が50%超のG含有率の分子インデックスを持たないようにおよび/または配列「GG」が分子インデックス中に現われないように(たとえば、2個の連続したGが存在しないように)G含有率を最小限に抑えることにより、バイアスを最小限に抑えるように構成可能である。任意選択的に、バーコード領域はサンプルインデックスを含む。サンプルインデックスは、所与のプールのユニークオリゴヌクレオチドのサンプルインデックスは同一でありうるが分子インデックスは異なりうるように構成可能である。このため、複数のサンプルを分析する場合、サンプルインデックスは、各オリゴヌクレオチドがどのサンプルに対応するかを表すことが可能である。このため、ユニークオリゴヌクレオチド種が標的に結合した後、ユニークオリゴヌクレオチド種をプール可能であるとともに配列を分析可能である。いくつかの実施形態では、サンプルインデックスは分子インデックスの5’側にある。いくつかの実施形態では、分子インデックスはサンプルインデックスの5’側にある。任意選択的に、ユニークオリゴヌクレオチド種はアダプターを含む。アダプターは、バーコード領域の5’側に位置決め可能である。いくつかの実施形態では、アダプターは、ユニークオリゴヌクレオチド種を基材に固定するように構成される。
なんら理論により制限されるものではないが、本明細書のいくつかの実施形態に従って構成されたユニークオリゴヌクレオチド種は、たとえば、分子バーコードまたはバーコード領域のG含有率を最小限に抑えることによりおよび/またはユニフォーム領域の近傍のG含有率を最小限に抑えることにより、正確な分析および低減バイアス、最小バイアス、または無バイアスのシーケンシング結果をもたらしうることが企図される。例として、バイアスの低減は、サンプル中の標的核酸の個別分子の数を検出する際のノイズの低減および/または感度の増加により確認可能である(たとえば、図6~7を参照されたい)。いくつかの実施形態では、バイアスの低減は、ノイズの減少として(図6参照)、たとえば、サンプル中に検出される標的核酸分子の数のより小さい標準誤差として、確認可能である。いくつかの実施形態では、バイアスの低減は、感度の増加として(図7参照)、たとえば、サンプル中の標的核酸の個別分子のより多くの数の検出(たとえば、より少ない標的核酸分子の見落とし)として、確認可能である。このため、いくつかの実施形態では、組成物および方法は、低ノイズで、たとえば、30%未満の相対標準誤差で、たとえば、列挙された値の任意の2つの間の範囲を含めて30%未満、25%未満、20%未満、15%未満、10%未満、5%未満、4%未満、3%未満、2%未満、1%未満、または.01%未満の相対標準誤差で、サンプル中の標的核酸分子の定量をもたらす。いくつかの実施形態では、組成物および方法は、高感度で、たとえば、(検出されるサンプル中の個別標的核酸の実際の数に対するパーセントとして測定される)感度で、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも70%、75%、80%、85%、90%、85%、96%、97%、98%、99%、99.9%の感度で、サンプル中の標的核酸分子の定量をもたらす。いくつかの実施形態では、本明細書に記載の方法または組成物は、図3Aに一致するユニークオリゴヌクレオチド種を含む組成物または方法と比べて感度を増加させるか、相対標準誤差を減少させるか、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
図3Aは、従来のオリゴヌクレオチド設計を例示する。分子インデックス配列NNNNNNNN(ただし、各Nは、A、G、C、またはTであり、かつNの任意の2つは、互いに同一であっても異なっていてもよい)は、2個以上の連続したGを含みうることおよび/または50%超のG含有率を有しうることに留意されたい。たとえば、図3Aに一致するユニークオリゴヌクレオチド種の集団のサブセットは、Gリッチでありうる。なんら理論により制限されるものではないが、図3Aの構成に基づく集団中の少なくともいくつかのユニークオリゴヌクレオチド種は、優先してバイアスをもたらしうることが企図される。バイアスを受ける可能性のある「ベースライン」分子インデックスの他の例は、配列「BBBBBBV」(ただし、Bは、C、G、またはTであり、かつVは、A、C、またはGである)である。本明細書のいくつかの実施形態に係るユニークオリゴヌクレオチド種の構成例は、図3B~3Hに例示される。図3B~Cに示されるように、本明細書のいくつかの実施形態に従って分子インデックスの後にTTTまたはTTTTTのいずれかを付加することにより、その領域に沿ったGリッチ度を低減することが可能である(非Gスペーサーの長さは可変でありうるとともに任意の1つまたは複数の非Gヌクレオチドを含みうる)。図3Dでは、サンプルインデックスおよび分子の位置は、ユニークオリゴヌクレオチド種の少なくともサブセット中の高Gリッチの可能性のあるMIが潜在的にGリッチな遺伝子特異的標的領域に隣接しないように、(分子インデックスがサンプルインデックスの5’側になるように)入れ替えられる。図3E~Fでは、図3Dに例示される構成にTTTまたはTTTTTのいずれかを付加することにより、潜在的Gリッチ領域をさらに最小限に抑えることが可能である。なんら理論により制限されるものではないが、サンプルバーコードは(たとえば「非Gリッチ」になるように)しばしば低G含有率を有しうることに留意されたい。非Gスペーサーの長さは可変でありうるとともに任意の非Gヌクレオチドでありうることにさらに留意されたい)。図3G~Hの構成では、分子バーコードは、「HHHHHHHH」または「HNHNHNHN」(ただし、Hは、A、C、またはTであり、かつ任意の2つのHは、互いに同一であっても異なっていてもよく、かつ任意の2つのNは、互いに同一であっても異なっていてもよい)を含む。
いくつかの実施形態では、組成物または方法における複数のユニークオリゴヌクレオチド種のそれぞれ(たとえば、ユニークオリゴヌクレオチド種のそれぞれ)は、少なくとも24ヌクレオチド長、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135または140ヌクレオチド長、たとえば、24~140、24~135、24~130、24~125、24~120、24~115、24~110、24~105、24~100、24~95、24~90、24~85、24~80、24~75、24~70、24~65、24~60、24~55、24~50、24~45、24~40、25~140、25~135、25~130、25~125、25~120、25~115、25~110、25~105、25~100、25~95、25~90、25~85、25~80、25~75、25~70、25~65、25~60、25~55、25~50、25~45、25~40、27~140、27~135、27~130、27~125、27~120、27~115、27~110、27~105、27~100、27~95、27~90、27~85、27~80、27~75、27~70、27~65、27~60、27~55、27~50、27~45、27~40、30~140、30~135、30~130、30~125、30~120、30~115、30~110、30~105、30~100、30~95、30~90、30~85、30~80、30~75、30~70、30~65、30~60、30~55、30~50、30~45、30~40、35~140、35~135、35~130、35~125、35~120、35~115、35~110、35~105、35~100、35~95、35~90、35~85、35~80、35~75、35~70、35~65、35~60、35~55、35~50、35~45、35~40、40~140、40~135、40~130、40~125、40~120、40~115、40~110、40~105、40~100、40~95、40~90、40~85、40~80、40~75、40~70、40~65、40~60、40~55、40~50、または40~45ヌクレオチド長を有する。任意選択的に、組成物または方法における異なるユニークオリゴヌクレオチド種は、互いに異なる長さを有する。任意選択的に、組成物または方法におけるユニークオリゴヌクレオチド種はすべて、互いに同一の長さを有する。任意選択的に、組成物または方法におけるいくつかのユニークオリゴヌクレオチド種は、互いに同一の長さであり、一方、いくつかのユニークオリゴヌクレオチド種は、互いに異なる長さである。
いくつかの実施形態では、ユニフォーム領域は、標的核酸または標的核酸クラスに対する5’→3’増幅用配列を含むか、それらからなるか、またはそれらから本質的になる(この増幅用配列は、「標的特異的」領域としても参照しうる)。たとえば、標的核酸がmRNAを含む場合、ユニフォーム領域はオリゴdTを含みうる。たとえば、標的核酸がT細胞レセプターの可変領域を含む場合、ユニフォーム領域は、T細胞レセプターmRNAの可変領域にフランキングする配列を含みうる。いくつかの実施形態では、ユニフォーム領域は、標的核酸に相補的な少なくとも10ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて標的に相補的な少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド、たとえば、10~30、10~29、10~28、10~27、10~26、10~25、10~24、10~23、10~22、10~21、10~20、11~30、11~29、11~28、11~27、11~26、11~25、11~24、11~23、11~22、11~21、11~20、12~30、12~29、12~28、12~27、12~26、12~25、12~24、12~23、12~22、12~21、12~20、15~30、15~29、15~28、15~27、15~26、15~25、15~24、15~23、15~22、15~21、15~20、20~30、20~29、20~28、20~27、20~26、20~25、20~24、20~23、20~22、または20~21ヌクレオチドを含む。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターの可変領域、たとえば、T細胞レセプター、B細胞レセプター、または免疫グロブリンの可変領域をコードする配列にフランキングする配列にハイブリダイズする標的特異的領域たとえば抗体を含む。B細胞レセプターは膜結合免疫グロブリンを含むので、免疫グロブリン可変領域コード配列に特異的な標的特異的領域は、典型的には、B細胞レセプターさらには分泌免疫グロブリン(たとえば抗体)の増幅に好適であることに留意されたい。両選択肢は、本明細書では、膜結合免疫グロブリン(B細胞レセプター)さらには分泌免疫グロブリン(抗体)の増幅が企図されることを明確化するものであることに留意されたい。本明細書で用いられる場合、プライマーまたはユニフォーム領域が、免疫細胞レセプターおよび/または免疫グロブリンの可変領域の「フランキング配列」(およびこのルート語の変化形、たとえば「フランキングする配列」)を含む標的特異的領域を含む場合、標的特異的領域が、(i)可変領域をコードする配列の下流(3’側)にハイブリダイズするとともにとくにコード配列の鎖にハイブリダイズする配列、したがって、5’→3’方向の伸長時に可変領域コード配列の逆相補体を含む鎖を生成するよう構成された配列、または(ii)可変領域をコードする配列の上流(5’側)にハイブリダイズするとともにとくにコード配列の鎖に相補的な鎖にハイブリダイズする配列、したがって、5’→3’方向の伸長時に可変領域コード配列を含む鎖を生成するように構成された配列、の少なくとも一方を含むものと理解されることは、理解されよう。そのため、フランキング配列は、好適なプライミングパートナー(たとえば、可変領域の他方の側のフランキング配列)と共に可変領域コード配列の増幅を行うように構成可能である。コード配列が開始または終了する位置でフランキング配列が必ずしも正確に終了または開始する必要がないことは、理解されよう。そのため、フランキング配列のハイブリダイゼーション部位と可変領域コード配列自体との間に介在配列を存在させうる。フランキング配列は、一般的には、広範にわたる可能な可変領域コード配列を増幅するために可変領域コード配列の外側の配列にハイブリダイズするが、いくつかの実施形態では、たとえば、可能な可変領域のサブセットが対象である場合、可変領域「フランキング配列」が可変領域自体のいくらかの配列をさらに含むことは、理解されよう。しかしながら、本明細書で用いられる「フランキング配列」は、可変領域の両側にフランキングする単一の配列を必要とするものではない。より正確には、フランキング配列が本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドとの関連で記載される場合、可変領域コード配列を増幅するのに好適なプライマー対を含む5’および3’配列が明示的に企図されることは、理解されよう。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、本明細書に記載されるようにバーコード領域を含むとともに、免疫細胞レセプターおよび/または免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含むユニフォーム領域を含む。ユニフォーム領域の標的特異的領域と共に可変領域配列を増幅するために、可変領域コード配列の他方の側に第2のオリゴヌクレオチドプライマーも提供可能である。いくつかの実施形態では、ユニフォーム領域は、免疫グロブリン可変領域にフランキングする(したがって、B細胞レセプター可変領域さらには対応する抗体可変領域にフランキングする)配列、たとえば、免疫グロブリン重鎖遺伝子座の可変領域にフランキングする配列、免疫グロブリン(軽鎖)κ遺伝子座の可変領域にフランキングする配列、または免疫グロブリン(軽鎖)λ遺伝子座の可変領域にフランキングする配列を含む、バーコード領域の3’側に位置決めされた標的特異的領域を含む。いくつかの実施形態では、ユニフォーム領域は、T細胞レセプターα鎖の可変領域、T細胞レセプターβ鎖の可変領域、T細胞レセプターγ鎖の可変領域、またはT細胞レセプターδ鎖の少なくともの1つにフランキングする配列を含む、バーコード領域の3’側に位置決めされた標的特異的領域を含む。
いくつかの実施形態では、キットは、本明細書に記載されるようにユニークオリゴヌクレオチド種を含む組成物を含み、ユニークオリゴヌクレオチド種は、それぞれ、本明細書に記載されるように免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングするユニフォーム配列を含む。いくつかの実施形態では、キットは、ユニフォーム領域と比較して可変領域コード配列の他方の側の対向鎖にハイブリダイズするように構成された、したがって、ユニフォーム領域の標的特異的領域と共に可変領域配列を増幅するように構成された、オリゴヌクレオチドプライマーをさらに含む。いくつかの実施形態では、増幅された配列は、少なくとも1kbであり、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも1kb、2kb、3kb、4kb、または5kbの可変コード配列を含む。
いくつかの免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする核酸は、1kb超の長さでありうることに留意されたい。たとえば、T細胞レセプター可変領域配列は、CDR1コード配列が開始される位置から1kb超離れて終了するCDR3コード配列を含みうる。理論により限定されるものではないが、いくつかの従来および次世代のシーケンシング法、たとえば、合成シーケンシングは、典型的には1kbよりもかなり短いショートリードに限定されることに留意されたい。したがって、本明細書のいくつかの実施形態に係る方法および組成物およびキットは、他の手段では1kb未満のシングルリードシーケンシングに適合しないと思われる免疫細胞レセプターおよび/または免疫グロブリンの可変領域をコードする核酸にバーコードを付けて分析するのに有用でありうることが企図される。したがって、いくつかの実施形態では、ユニークオリゴヌクレオチド種は、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含み、可変領域コード配列を含む少なくとも1kbの配列、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも1kb、2kb、3kb、4kb、または5kbの配列を増幅するように構成される。
バーコード領域
本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドによれば、バーコード領域は、核酸、たとえば、サンプルからの標的核酸またはサンプルの単一の標的核酸に由来するアンプリコンもしくは逆転写物を同定するのに有用な核酸配列を含む。たとえば、サンプルからの2種のmRNA転写物は、第1のmRNAに対応する核酸が第1のバーコードを含むようにかつ第2のmRNAに対応する核酸が第2のバーコードを含むように、逆転写およびバーコード付けが行われる。シーケンシング(または他の分析)の際、サンプル中の個別mRNAに関する情報、たとえば、コピー数は、増幅後でさえも確認可能である。しかしながら、mRNAの大集団が確率的に標識されていくつかのバーコードがより有利に提示されると(たとえば、安定性、増幅効率などに起因して)、バイアスを生じてサンプルの核酸を定量する能力が歪められる可能性がある。このため、本明細書のいくつかの実施形態によれば、集団中の各ユニークオリゴヌクレオチド種は、ユニークバーコード領域を含みうる。バーコードの多様性が大きいほど、ユニークオリゴヌクレオチド種の多様性は大きくなり、特定のバーコード配列がサンプルの標的核酸1つのみに関連付けられる可能性は高くなる。バーコード領域は、たとえば、オリゴヌクレオチド種のユニフォーム領域の5’側に位置決めしうる。いくつかの実施形態では、バーコード領域は、本明細書に記載されるように分子バーコードを含む。任意選択的に、バーコード領域は、本明細書に記載されるように分子バーコードとサンプルバーコードとを含む。任意選択的に、バーコード領域は、サンプルバーコードの5’側に分子バーコードを含む。いくつかの実施形態では、本明細書に記載されるように分子バーコードを含むユニークオリゴヌクレオチド種を含む方法または組成物は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。本明細書で用いられる場合、「分子バーコード(molecule barcode)」は、「分子バーコード(molecular barcode)」、「分子インデックス(MI)」、またはユニーク分子識別子(UMI)としても参照可能である。本明細書で用いられる場合、「サンプルバーコード」は、「サンプルインデックス」(SI)としても参照可能である。
バーコード領域は分子バーコードを含みうる。分子バーコードはユニーク配列を含みうるので、複数のサンプル核酸(互いに同一であってもおよび/または異なっていてもよい)が分子バーコードに1対1に関連付けられたとき、異なるサンプル核酸を分子バーコードにより互いに区別可能である。このため、サンプルがたとえ同一の配列を有する2つの核酸を含んでいたとしても、これらの2つの核酸のそれぞれを異なる分子バーコードで標識可能であるので、増幅後でさえも集団中の核酸を定量可能である。分子バーコードは、少なくとも5ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド、たとえば、5~50、5~45、5~40、5~35、5~30、5~25、5~20、5~15、5~14、5~13、5~12、5~11、5~10、5~9、5~8、5~7、5~6、6~50、6~45、6~40、6~35、6~30、6~25、6~20、6~15、6~14、6~13、6~12、6~11、6~10、6~9、6~8、6~7、7~50、7~45、7~40、7~35、7~30、7~25、7~20、7~15、7~14、7~13、7~12、7~11、7~10、7~9、7~8、8~50、8~45、8~40、8~35、8~30、8~25、8~20、8~15、8~14、8~13、8~12、8~11、8~10、8~9、9~50、9~45、9~40、9~35、9~30、9~25、9~20、9~15、9~14、9~13、9~12、9~11、9~10、10~50、10~45、10~40、10~35、10~30、10~25、10~20、10~15、10~14、10~13、10~12、または10~11ヌクレオチドの核酸配列を含みうる。いくつかの実施形態では、分子バーコードの核酸配列は、たとえば、組成物中の各ユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、ユニーク配列を含む。いくつかの実施形態では、2ユニークオリゴヌクレオチド種以上は、同一の分子バーコードを含みうるが、依然として互いに異なる。たとえば、ユニークオリゴヌクレオチド種がサンプルバーコードを含む場合、特定のサンプルバーコードを有する各ユニークオリゴヌクレオチド種は、異なる分子バーコードを含みうる。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物は、少なくとも1000種の異なる分子バーコードの分子バーコード多様性、したがって、少なくとも1000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物は、少なくとも6,500種の異なる分子バーコードの分子バーコード多様性、したがって、少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物は、少なくとも65,000種の異なる分子バーコードの分子バーコード多様性、したがって、少なくとも65,000ユニークオリゴヌクレオチド種を含む。
なんら理論により制限されるものではないが、低G含有率(たとえば、50%G以下、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満)の分子バーコードは、核酸集団にバーコードを付けるためにユニークオリゴヌクレオチド種の組成物またはプールを使用する場合、バイアスを最小限に抑えることが企図される(たとえば、より高いG含有率のバーコードを優先的に増幅する可能性のあるバイアスを最小限に抑える)。従来のバーコーディング法は、典型的には、より高いG含有率に有利なバイアスを呈することに留意されたい。たとえば、図4A、4B、および4Cは、ES32、TRAC(図4A)、ES32 TRBC(図4B)、およびES32 オリゴdT(図4C)に対する多数のユニーク分子バーコードを含む組成物の従来の分子バーコードのヌクレオチド使用頻度のサンプルを例示する。すなわち、どちらかといえば、本明細書に提供されるある特定の指針を考慮せずに設計された従来の分子バーコードおよびバーコード領域は、ランダムチャンスで予想されるより高いG含有率を含みうる。いくつかの実施形態では、本明細書に記載されるように分子バーコードを含むユニークオリゴヌクレオチド種を含む方法または組成物は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む本明細書に記載の方法に使用される組成物または組成物の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%GのG含有率を有する。「ユニークオリゴヌクレオチド種の組成物の分子バーコードがすべて、全体として…のG含有率を有する」とは、全組成物中の分子バーコードのすべてにわたる全G含有率を計算した場合(たとえば、少なくとも10、50、100、200、500、1000、2000、5000、6500、10,000、20,000、30,000、40,000、50,000、60,000、または65,000ユニークオリゴヌクレオチド種の集団)、バーコード全体のこの全G含有率が、挙げられた値未満または挙げられた範囲内でありうることを意味する。それでもなお個別ユニークオリゴヌクレオチド種が指示値超または指示範囲外のG含有率の分子バーコードを有する可能性がありうるが、組成物のユニークオリゴヌクレオチド種の総ヌクレオチド含有率は、指示値未満または指示範囲内でありうる。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物中の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物中の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物中の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、本明細書に記載の組成物のバーコード領域はすべて、本明細書に記載されるように全体として50%未満のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物(または方法に使用されるかかる組成物)では、組成物は、それぞれ50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの分子バーコードG含有率のユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。「組成物が、それぞれ…未満の分子バーコードG含有率を有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる」とは、組成物中、集団中、またはプール中のユニークオリゴヌクレオチド種のそれぞれまたは本質的にそれぞれが指示値未満または指示範囲外の分子バーコードG含有率を有することを意味する。すなわち、それぞれ指示G含有率を有するユニークオリゴヌクレオチド種「から本質的になる」組成物、集団、またはプールでは、組成物中のユニークオリゴヌクレオチドの解析的に有意でない部分は、指示値超または挙げられた範囲外のG含有率の分子バーコードを有する可能性がありうる。たとえば、ユニークオリゴヌクレオチドの解析的に有意でない部分は、組成物中のユニークオリゴヌクレオチドの5%、4%、3%、2%、1%、0.5%、0.4%、0.3%、0.2%、0.1%でありうるかまたはそれらを超えないかもしくはそれら未満でありうる。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、50%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、50%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、50%超のG含有率を有する。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、25%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドの組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、25%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドの組成物中、集団中、またはプール中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、25%超のG含有率を有する。任意選択的に、組成物のユニークオリゴヌクレオチド種の分子バーコードはいずれも、全体として50%G超のG含有率を有していない。たとえば、ユニークオリゴヌクレオチド種の分子バーコードはすべて、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。
いくつかの実施形態では、本明細書に記載の組成物(または方法に使用されるかかる組成物)は、本明細書に記載されるようにそれぞれ50%未満のバーコード領域G含有率を含むユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物では、組成物は、それぞれ50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gのバーコード領域G含有率を含むユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。「組成物が、それぞれ…未満のバーコード領域G含有率を有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる」とは、組成物中、集団中、またはプール中のユニークオリゴヌクレオチド種のそれぞれまたは本質的にそれぞれが指示値未満または指示範囲外の分子バーコードG含有率を有することを意味する。すなわち、それぞれ指示G含有率を有するユニークオリゴヌクレオチド種「から本質的になる」組成物、集団、またはプールでは、組成物中のユニークオリゴヌクレオチドの解析的に有意でない部分は、指示値超または挙げられた範囲外のG含有率のバーコード領域を有する可能性がありうる。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて50%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて50%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて50%超のG含有率を有する。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて25%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて25%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて25%超のG含有率を有する。任意選択的に、組成物のユニークオリゴヌクレオチド種のバーコード領域はいずれも、全体として50%G超のG含有率を有していない。たとえば、ユニークオリゴヌクレオチド種のバーコード領域はすべて、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。
いくつかの実施形態では、組成物(または方法に使用されるかかる組成物)は、それぞれダブレット「HN」(ただし、各「H」は、A、C、またはTのいずれかであり、かつ「N」は、A、G、C、またはTのいずれかである)の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートの配列を含む分子バーコードを有するユニークオリゴヌクレオチド種からなるかまたはそれらから本質的になる。ダブレット「HN」の複数のリピートの例としては、HN、HNHN、HNHNHN、およびHNHNHNHNが挙げられる。式「HN」は塩基含有率に対する制約を記述するが、すべてのHまたはすべてのNが同一である必要も異なる必要もあるわけではないことに留意されたい。たとえば、組成物中のユニークオリゴヌクレオチド種の分子バーコードがHNHNHNを含む場合、ある分子バーコードは配列ACTGCAを含みうるのに対して、他の分子バーコードは配列TAACTAを含みうるとともに、他の分子バーコードは配列AGACACを含みうる。任意のリピート数のダブレット「HN」は50%以下のG含有率を有しうることに留意されたい。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも95%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも95%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも95%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、組成物は、それぞれ配列HNHNHNを含む分子バーコードを有する少なくとも1000、6500、または65,000ユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、組成物は、それぞれ配列HNHNHNHNを含む分子バーコードを有する少なくとも1000、6500、または65,000ユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、本明細書に記載の組成物のバーコード領域の少なくとも95%、99%、または99.9%は、本明細書に記載されるようにダブレット「HN」の少なくとも3リピートを含む。なんら理論により制限されるものではないが、分子バーコードの利用可能なヌクレオチド配列の数を相対的に大きくすることは、たとえば、オリゴヌクレオチド種のサイズを最小限に抑えつつ、各標的核酸がユニークに標識される可能性と共に所与の配列長内のバーコードの多様性を増加させるために、サンプルからの標的核酸の集団にバーコードを付ける際に役立ちうることに留意されたい。分子バーコードおよび/またはバーコード領域のG含有率を限定することは、バーコードを構築できる利用可能なヌクレオチドの数(および核酸の長さ当たりの利用可能な異なる配列の数)を減少させることになるので、こうしたバーコードおよびバーコード領域の多様性を限定する可能性があることに留意されたい。このため、本明細書の種々の実施形態に係る分子バーコードまたはバーコード領域にいくつかのGを有することは、多様性を増加させるのに役立ちうるとともに、一方、G含有率を限定することは、バイアスを最小限に抑えるのに役立ちうる。「HN」ダブレットの繰返しを含む配列は、バイアスを最小限に抑えたまま比較的短い配列で比較的高い多様性が得られるように、バイアスを低減することと比較的多くの利用可能なヌクレオチド配列を維持することとの間の折合いをつけつつ、低いバイアスをもたらしうることが観測されており、このことに留意されたい(実施例2および図6~7を参照されたい)。いくつかの実施形態では、本明細書に記載されるように「HN」ダブレットの繰返しを含む分子バーコードを含むユニークオリゴヌクレオチド種を含む方法または組成物は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
いくつかの実施形態では、組成物(または方法に使用されるかかる組成物)は、少なくとも6個の連続した「H」(ただし、各「H」は、A、C、またはTのいずれかである)、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードをそれぞれ含むユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になる。式「H」は塩基含有率に対する制約を記述するが、すべてのHが同一である必要も異なる必要もあるわけではないことに留意されたい。たとえば、集団中のユニークオリゴヌクレオチド種の分子バーコードがそれぞれ配列HHHHを含んでいた場合、ユニークオリゴヌクレオチド種の分子バーコードの1つはACTAを含みうるとともに、他のユニークオリゴヌクレオチド種の分子バーコードの1つはTTACを含みうるし、他のユニークオリゴヌクレオチド種の分子バーコードの1つはACATを含みうる。いくつかの実施形態では、組成物は、少なくとも1000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも95%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも1000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも1000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも6500ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも95%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも6500ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも6500ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも65,000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも95%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも65,000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも65,000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列、たとえば、列挙された値の任意の2つの間の範囲を含めてHとNとが交互に少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個現れる配列を含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。
いくつかの実施形態では、本明細書に記載の組成物(または方法に使用されるかかる組成物)のユニークオリゴヌクレオチド種の少なくとも95%(たとえば、95%、96%、97%、98%、99%、またはそれ以上)は、少なくとも6個の連続したH、たとえば、本明細書に記載される列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含むバーコード領域を含む。いくつかの実施形態では、本明細書に記載の組成物のユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、本明細書に記載される列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含むバーコード領域を含む。いくつかの実施形態では、本明細書に記載の組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、本明細書に記載される列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含むバーコード領域を含む。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種のサンプルバーコードは、50%以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%以下、40%以下、25%以下、20%以下、12.5%以下、10%以下、または5%以下のG含有率を有する。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種のバーコード領域は、50%以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%以下、40%以下、25%以下、20%以下、12.5%以下、10%以下、または5%以下のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満、たとえば、列挙された値の任意の2つの間の範囲を含めて12.5%未満、10%未満、7.5%未満、5%未満、2.5%未満、または1%未満のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%未満、たとえば、列挙された値の任意の2つの間の範囲を含めて12.5%未満、10%未満、7.5%未満、5%未満、2.5%未満、または1%未満のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも99%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、ユニークオリゴヌクレオチド種のすべてまたは実質的にすべてで、分子バーコードのいずれのGも他のGに隣接しない。
各バーコード領域は、サンプルバーコードを任意選択的に含みうる。本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドによれば、プール中の各ユニークオリゴヌクレオチド種は、同一のサンプルバーコードを含みうるが、異なるサンプルバーコードにそれぞれ関連付けられるプールが2つ以上存在しうる。このため、プール#1中のユニークオリゴヌクレオチド種はすべてまたは本質的にすべて、サンプルバーコード#1を含みうるとともに、プール#2中のユニークオリゴヌクレオチド種はすべてまたは本質的にすべて、サンプルバーコード#2を含みうる。たとえば、ハイブリダイゼーションおよび増幅により、第1のサンプルからの核酸は、プール#1中のユニークオリゴヌクレオチド種に関連付け可能であり、かつ第2のサンプルからの核酸は、プール#2中のユニークオリゴヌクレオチド種に関連付け可能である。このため、第1のサンプルに対応する増幅核酸はすべてまたは本質的にすべて、サンプルバーコード#1を含むであろう(ただし、異なる分子バーコードを含みうる)。そして第2のサンプルに対応する増幅核酸はすべて、サンプルバーコード#2を含むであろう。いくつかの実施形態では、少なくとも24、48、96、または192プールが存在する。
サンプルバーコードは、少なくとも3ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50ヌクレオチド、たとえば、3~50、3~45、3~40、3~35、3~30、3~25、3~20、3~15、3~14、3~13、3~12、3~11、3~10、3~9、3~8、3~7、3~6、3~5、3~4、4~50、4~45、4~40、4~35、4~30、4~25、4~20、4~15、4~14、4~13、4~12、4~11、4~10、4~9、4~8、4~7、4~6、4~5、5~50、5~45、5~40、5~35、5~30、5~25、5~20、5~15、5~14、5~13、5~12、5~11、5~10、5~9、5~8、5~7、5~6、6~50、6~45、6~40、6~35、6~30、6~25、6~20、6~15、6~14、6~13、6~12、6~11、6~10、6~9、6~8、6~7、7~50、7~45、7~40、7~35、7~30、7~25、7~20、7~15、7~14、7~13、7~12、7~11、7~10、7~9、7~8、8~50、8~40、8~35、8~30、8~25、8~20、8~15、8~14、8~13、8~12、8~11、8~10、8~9、9~50、9~45、9~40、9~35、9~30、9~25、9~20、9~15、9~14、9~13、9~12、9~11、9~10、10~50、10~45、10~40、10~35、10~25、10~20、10~15、10~14、10~13、10~12、または10~11ヌクレオチドの核酸配列を含みうる。いくつかの実施形態では、サンプルバーコードの核酸配列は、たとえば、集団中の各ユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、ユニーク配列を含む。
なんら理論により制限されるものではないが、比較的Gリッチなサンプルバーコードをユニフォーム領域から分離させることによりバイアスを最小限に抑えるべく、低G含有率(たとえば、50%G未満、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満)のサンプルバーコードは、比較的高いG含有率のサンプルバーコードの3’側かつユニフォーム領域(たとえば、標的特異的配列またはオリゴdT配列)の5’側に位置決め可能であることが企図される。いくつかの実施形態では、バーコード領域は、50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの含有率のサンプルバーコードを含む。
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物(または方法に使用されるかかる組成物)では、組成物のユニークオリゴヌクレオチドのサンプルバーコードの少なくとも95%は、それぞれ、50%G未満、たとえば、列挙された値の任意の2つの間の範囲を含めて45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物(または方法に使用されるかかる組成物)では、組成物のユニークオリゴヌクレオチドのサンプルバーコードの少なくとも99%は、それぞれ、50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの含有率を有する。すなわち、ユニークオリゴヌクレオチド集団内では、サンプルバーコードの1%未満は、50%超のG含有率を有する。いくつかの実施形態では、組成物のユニークオリゴヌクレオチド種は、本明細書に記載されるように、それぞれ50%未満のG含有率のサンプルバーコードを有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。
いくつかの実施形態では、バーコード領域は、バーコード領域とユニフォーム領域との間に介在配列をなんら含むことなくユニフォーム領域の5’側に位置決めされる。いくつかの実施形態では、バーコード領域は、スペーサーがバーコード領域とユニフォーム領域との間になるように、ユニフォーム領域の5’側に位置決めされたスペーサーの5’側に位置決めされる。任意選択的に、スペーサーは、低G含有率(たとえば、50%G以下、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満)を有する。スペーサーは、少なくとも1ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50ヌクレオチド、1~50、1~45、1~35、1~30、1~25、1~20、1~15、1~10、1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、2~50、2~45、2~35、2~30、2~25、2~20、2~15、2~10、2~9、2~8、2~7、2~6、2~5、2~4、2~3、3~50、3~45、3~35、3~30、3~25、3~20、3~15、3~10、3~9、3~8、3~7、3~6、3~5、3~4、4~50、4~45、4~35、4~30、4~25、4~20、4~15、4~10、4~9、4~8、4~7、4~6、4~5、5~50、5~45、5~35、5~30、5~25、5~20、5~15、5~10、5~9、5~8、5~7、5~6、6~50、6~45、6~35、6~30、6~25、6~20、6~15、6~10、6~9、6~8、6~7、7~50、7~45、7~35、7~30、7~25、7~20、7~15、7~10、7~9、7~8、8~50、8~45、8~35、8~30、8~25、8~20、8~15、8~10、8~9、9~50、9~45、9~35、9~30、9~25、9~20、9~15、9~10、10~50、10~45、10~35、10~30、10~25、10~20、または10~15ヌクレオチドの長さを有しうる。いくつかの実施形態では、スペーサーは、少なくとも2個の連続した非Gヌクレオチド(「H」(ただし、「H」は、A、C、またはTである)で表される)、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したH、たとえば、2~20、2~15、2~10、2~9、2~8、2~7、2~6、2~5、2~4、2~3、3~20、3~15、3~10、3~9、3~8、3~7、3~6、3~5、3~4、4~20、4~15、4~10、4~9、4~8、4~7、4~6、4~5、5~20、5~15、5~10、5~9、5~8、5~7、5~6、6~20、6~15、6~10、6~9、6~8、または6~7個を含みうる。いくつかの実施形態では、スペーサーのヌクレオチドはTである。たとえば、スペースは、TT、TTT、TTTT、TTTTT、TTTTTT、TTTTTTTT、TTTTTTTTTTなどのポリT配列を含みうる。スペーサーは必ずしも多様性を提供するわけではないので、本明細書に記載のユニークオリゴヌクレオチド種を含む組成物では、ユニークオリゴヌクレオチド種の一部または全部は同一のスペーサー配列を有しうることに留意されたい。任意選択的に、組成物のユニークオリゴヌクレオチド種はすべて、同一のスペーサー配列を含む。
プールおよびプーリング
本明細書のいくつかの実施形態の組成物および方法に従って記載されるユニークオリゴヌクレオチド種を含む組成物は、たとえば、1サンプル/プールで複数のサンプルを分析できるように、空間分離されたプールに配設可能である。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに配設され、各プールは、同一のプールのユニークオリゴヌクレオチドが同一のサンプルバーコード配列を含むように、かつ同一のプールの異なるユニークオリゴヌクレオチドが異なる分子バーコード配列を含むように、ユニークオリゴヌクレオチド種の複数のユニークオリゴヌクレオチドを含む。本明細書で用いられる場合、「空間分離」(およびこのルート語の変化形)とは、他のプールと実質的に交差反応することなくかつプールのユニークオリゴヌクレオチド種が他のサンプルの標的核酸に実質的にハイブリダイズすることなく、サンプルの標的核酸がプールのユニークオリゴヌクレオチド種にハイブリダイズ可能であることを意味する。このため、サンプルバーコードは、所与のユニークオリゴヌクレオチド種がどのプールに由来したかを同定可能である。さらに、ユニークオリゴヌクレオチド種で標的核酸配列にバーコードを付けることにより、サンプルバーコードは、バーコード付き標的核酸配列(またはその逆転写物またはアンプリコン)がどのプールに由来したかを同定可能である。
いくつかの実施形態では、基材は、互い空間分離されるようにプールを構築する。たとえば、マルチウェルプレートは、各プールが個別ウェルに存在するように空間分離されたプールを構築可能である。たとえば、各プールは、異なるビーズに固定可能である。任意選択的に、マルチウェルプレートの各ウェルは、ユニークオリゴヌクレオチド種の異なるプールがマルチウェルプレートの各ウェルに位置決めされるように、ユニークオリゴヌクレオチド種のプールが固定される単一のビーズを含有しうる。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも2プール、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも2、3、4、4、5、6、7、8、9、10、11、12、13、14の15、16、17、18、19、20、21の22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、72、96、99、100、110、120、144、168、または192プールに配設される。任意選択的に、少なくとも100ユニークオリゴヌクレオチド/プールが存在しうる。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも2プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも24プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも48プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも96プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
基材
本明細書のいくつかの実施形態の組成物および方法に係るユニークオリゴヌクレオチド種は、ビーズ、マルチウェルプレートのウェル、アレイなどの基材に固定可能である。たとえば、同一のサンプルバーコードただし異なる分子バーコードを有するユニークオリゴヌクレオチド種はすべて、単一ビーズやマルチウェルプレートの単一ウェルなどの基材に固定可能である。このため、特定の基材に固定されたユニークオリゴヌクレオチド種と単一細胞などの特定のサンプルとを接触させた場合、その基材に固定されたユニークオリゴヌクレオチド種は、同一のサンプルの標的核酸に関連付けられるであろう。同一の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを有し、一方、他の基材上のものが異なるサンプルバーコードを有する場合、各標的核酸に関連付けられたサンプルは容易に同定可能である(たとえば、基材#1上のユニークオリゴヌクレオチド種はすべて、サンプルバーコード#1を有し、基材#2上のユニークオリゴヌクレオチド種はすべて、サンプルバーコード#2を有する)。
いくつかの実施形態では、ユニークオリゴヌクレオチド種を基材に固定するかかる構成は、効率およびスループットの向上に役立ちうる。たとえば、単一細胞は、1個以下の単一細胞が各ウェルに存在するようにマルチウェルプレートのウェルに添加可能である。所与のウェル内(たとえば、ウェル上またはビーズ上)に固定されたユニークオリゴヌクレオチド種がユニークサンプルバーコードを含む場合、単一細胞に対応するバーコード付き標的核酸ならびにその逆転写物およびアンプリコンは、複数のサンプルからのバーコード付き逆転写物またはアンプリコンをプールしたとしても、同定および定量が可能である。
基材はあるタイプの固体担体を含みうる。基材は、本開示の方法を行いうる連続した固体または半固体の表面を意味しうる。基材は、たとえば、アレイ、カートリッジ、チップ、デバイス、およびスライドを意味しうる。このため、「固体担体」および「基材」は同義的に用いうる。
本明細書のいくつかの実施形態に係る基材または固体担体は、核酸を(たとえば共有結合または非共有結合で)固定しうるプラスチック、セラミック、金属、または高分子材料(たとえばヒドロゲル)で構成された任意のタイプの中実、多孔性、または中空のスフェア、ボール、ベアリング、シリンダー、または他の類似の構成体を包含しうる。基材または固体担体は、球状(たとえばマイクロスフェア)でありうるまたは非球状もしくは不規則形状、たとえば、立方体形、直方体形、角錐形、円柱形、円錐形、扁球形、ディスク形などを有しうる離散粒子を含みうる。アレイ状に離間して配置された複数の固体担体は、基材を含まないこともありうる。固体担体は、「ビーズ」という用語と同義的に用いうる。
いくつかの実施形態では、複数の基材を提供して、ユニーク基材がユニークサンプルバーコードを含みうるように複数の基材にサンプルバーコードの多様性を提示可能である。
バーコーディング法
本明細書のいくつかの実施形態によれば、2サンプル以上からの核酸に特異的にバーコードを付ける方法が記載される。各サンプルは核酸を含みうる。本方法は、本明細書に記載されるように、各サンプルと複数のユニークオリゴヌクレオチド種を含むプールとを接触させることを含みうる。各サンプルは、他のサンプルから空間分離した状態で接触可能である。各プールのユニークポリヌクレオチド種は、同一のサンプルバーコードを含みうるとともに、異なる分子バーコードを含みうる。本方法は、ユニークオリゴヌクレオチド種の少なくともいくつかのオリゴヌクレオチドの標的特異的領域をサンプルの核酸の少なくともいくつかにハイブリダイズさせることを含みうる。本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的領域に相補的な配列とを含む鎖を生成するように、ハイブリダイズされたオリゴヌクレオチドを伸長させることを含みうる。そのため、各サンプルでは、生成された鎖は、同一のサンプルバーコードと異なる分子バーコードとを含みうる。異なるサンプルでは、サンプルバーコードが異なりうる。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。任意選択的に、各プールは、少なくとも100ユニークオリゴヌクレオチド種、たとえば、少なくとも100、500、100、500、1000、2000、6500、または65,000ユニークオリゴヌクレオチド種を含む。本明細書のいくつかの実施形態に係るかかる方法は、単一細胞の核酸の分析および定量が可能になるように、2つ以上の異なるサンプルたとえば単一細胞サンプルの核酸にバーコードを付けることが可能である。
任意選択的に、各サンプルは、他のプールおよびサンプルから空間分離した状態でユニークオリゴヌクレオチド種の単一プールに接触させる。いくつかの実施形態では、プールは、ユニーク閉込め空間、たとえば、マルチウェルプレートの異なるウェル、異なる試験管、異なるマイクロ流体チャネルなど、に置くことにより空間分離される。いくつかの実施形態では、プールは、異なる表面領域、たとえば、アレイ上の反応ドット、に置くことにより空間分離される。
オリゴヌクレオチドは、標準的ハイブリダイゼーション条件下で(たとえば、標準的緩衝液中で、かつ標的核酸に相補的なユニフォーム領域の部分のTm未満の温度で)サンプルの標的核酸に接触させうる。任意選択的に、たとえば、標的核酸がRNAを含む場合、サンプルの標的核酸は、DNA(たとえばcDNA)を生成するためにユニークオリゴヌクレオチド種へのハイブリダイゼーション後に逆転写される。任意選択的に、ハイブリダイゼーションまたは逆転写反応の産物は、DNAのライブラリーを生成するために増幅される。増幅は、標準的条件下でPCRにより、または他の好適な方法、たとえば、等温増幅、ローリングサークル増幅などにより、行いうる。任意選択的に、増幅は、5’→3’活性を有するポリメラーゼを用いて逆転写物またはハイブリダイズされた核酸を増幅することを含みうる。任意選択的に、増幅産物は、たとえばシーケンスによりさらに分析可能である。任意選択的に、異なるプールからの逆転写物またはアンプリコンは、異なるサンプルバーコードがそれぞれの個別バーコード付き核酸の対応するプール(およびサンプル)を表すので、シーケンシングのためのプール可能である。Gリッチな分子バーコードまたはユニークオリゴヌクレオチド種に有利なバイアスが存在しうることおよび本明細書のいくつかの実施形態に係る方法がかかるバイアスを最小限に抑えうるかまたは排除しうることに留意されたい。例として、単一核酸レベルでサンプルの核酸を定量する場合、いくつかの核酸の提示に有利で、サンプルの代表的な標的核酸ではなくある特定の種類のバーコードに有利になるように定量結果を歪める可能性のある、かかるバイアスを最小限に抑えるかまたは排除するのに有用でありうる。いくつかの実施形態では、本明細書に記載のユニークオリゴヌクレオチド種を含む方法は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
任意選択的に、本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む鎖の核酸配列を確認することをさらに含みうる。たとえば、ユニークオリゴヌクレオチドプローブのハイブリダイゼーションおよび伸長から生成された逆転写物ライブラリー、アンプリコンライブラリー、および/またはcDNAライブラリーはシーケンス可能である。当技術分野で公知の任意の好適なシーケンシング法、好ましくは高スループット法を使用可能である。たとえば、Roche454、Illumina Solexa、ABI-SOLiD、ION Torrent、Complete Genomics、Pacific Bioscience、Helicos、Polonatorプラットフォームなどのプラットフォームを用いたサイクリックアレイシーケンシングを利用することも可能である。シーケンシングは、MiSeqシーケンシングを含みうる。シーケンシングは、HiSeqシーケンシングを含みうる。適用可能であれば、ユニークオリゴヌクレオチド種は、高スループットシーケンシングを媒介するアダプターたとえばユニバーサルプライミング部位を含みうる。任意選択的に、2つ以上の異なるサンプルに対応する(たとえば、2つ以上の異なるプールからの)バーコード付き核酸は、シーケンシングのためにプーリングまたは組合せが可能である。任意選択的に、プールはすべて、シーケンシングのために組合せまたはプーリングが可能である。なんら理論により制限されるものではないが、サンプルバーコードは、組み合わされたバーコード付き核酸の対応するサンプル(またはプール)を同定しうること、核酸の組合せまたはプーリングは、シーケンシングのスループットおよび/または資源利用を向上させうること、ならびに本明細書のいくつかの実施形態に係る正確なバーコーディングは、多数の異なる核酸を分析する場合でさえもバイアスを最小限に抑えまたは排除しうること、に留意されたい。
いくつかの実施形態では、各プールのバーコード領域は、本明細書に記載されるように少なくとも3ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドを含むサンプルバーコードを含む。任意選択的に、サンプルバーコードは分子バーコードの3’側に位置決めされる。任意選択的に、分子バーコードはサンプルバーコードの3’側に位置決めされる。任意選択的に、ユニークオリゴヌクレオチド種は、他のプールのユニークオリゴヌクレオチド種とは異なるサンプルバーコードでありうる同一のサンプルバーコードを含む。任意選択的に、サンプルバーコードは、本明細書に記載されるように低G含有率、たとえば、50%G未満、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満を有する。任意選択的に、サンプルバーコードの少なくとも95%、99%、または99.9%、本明細書に記載されるように低G含有率を有する。任意選択的に、各ユニークオリゴヌクレオチドは、本明細書に記載されるように分子バーコードの3’側かつユニフォーム領域の5’側にスペーサーを含む。
いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種は、各分子バーコードが本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種の少なくとも95%の分子バーコードは、本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する分子バーコードを含む。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種の少なくとも99%の分子バーコードは、本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する分子バーコードを含む。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種の分子バーコードはすべて、本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G、35%G、30%G、25%G、20%G、15%G、12.5%G、10%G、7.5%G、5%G、もしくは2.5%Gの含有率、または0%Gの含有率を有する分子バーコードを含む。
いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として50%G未満、たとえば、列挙された値の任意の2つの間の範囲を含めて45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。任意選択的に、ユニフォーム領域は、標的核酸配列に相補的な少なくとも10ヌクレオチド(たとえば、列挙された値の任意の2つの間の範囲を含めて標的に相補的な少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド)を含み、かつかかるヌクレオチドは、標的核酸配列の5’→3’増幅用として構成される。任意選択的に、ユニフォーム領域はオリゴdT配列を含む。
いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、所与の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを含むようにかつ基材に固定された異なるユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、基材に固定される。例として、基材は、マルチウェルプレート(たとえば、24、48、および96ウェルプレート)のウェル、アレイ上のスポット、ビーズなどを含みうる。いくつかの実施形態では、少なくとも100ユニークオリゴヌクレオチドが各基材に固定される。任意選択的に、所与の基材(ひいては同一のプール)に固定されたユニークオリゴヌクレオチド種はすべて、同一のサンプルバーコードを含む。いくつかの実施形態では、各サンプルバーコードは、50%以下、たとえば、50%以下、40%以下、25%以下、20%以下、12.5%以下、10%以下、または5%以下のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満、たとえば、12.5%未満、10%未満、7.5%未満、5%未満、2.5%未満、または1%未満のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下、たとえば、12.5%以下、10%以下、7.5%以下、5%以下、2.5%以下、または1%以下のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。たとえば、ユニークオリゴヌクレオチド種の少なくとも95%、96%、97%、98%、99%、99.5%、99.9%、または99.99%は、分子バーコードのいずれのGも他のGに隣接できない。
いくつかの実施形態では、各プールは、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列、たとえば、列挙された値の任意の2つの間の範囲を含めてHとNとが交互に少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個現れる配列を含む。例として、HとNとが交互に6個現れるものは、HNHNHNとして表しうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HNHNHNHNを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも99%は、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。
いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含む。任意選択的に、スペーサーは配列HNHを含みうる。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。任意選択的に、スペーサーは配列HHHを含みうる。任意選択的に、スペーサーは配列HNHNHNHNを含みうる。任意選択的に、スペーサーは配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。
いくつかの実施形態では、少なくとも1プールは、同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、プールは、同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない。
いくつかの実施形態では、標的特異的領域は、標的核酸の5’→3’増幅用の配列を含みうる。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、標的特異的領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする配列にフランキングする配列を含む。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。
いくつかの実施形態では、各プールは少なくとも1000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。
いくつかの実施形態では、少なくとも48ユニークサンプルは、それぞれ、ユニークオリゴヌクレオチド種の異なるプールに接触させる。たとえば、少なくとも48、72、96、120、144、168、または192サンプルは、それぞれ、異なるプールに接触させうる。たとえば、各サンプルは、マルチウェルプレートのウェルのユニークオリゴヌクレオチド種の異なるプールに接触させうる。
いくつかの実施形態では、サンプルの少なくとも99%は、それぞれ、1細胞以下である。たとえば、サンプルの少なくとも99%、99.5%、99.9%、または99.99%は、1細胞以下でありうる。例として、複数の細胞を含む溶液は、各サンプルが1細胞以下になる可能性が好適に高くなるように、適切な濃度に希釈可能である。
いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、各基材に固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように基材に固定される。このため、各プールは、特定のサンプルバーコードにより同定可能である。異なる基材(ひいては異なるプール)は異なるサンプルバーコードに関連付け可能であることに留意されたい。いくつかの実施形態では、基材は、異なるプールの基材が空間分離された異なる表面領域を含むように空間分離された表面領域を含む。いくつかの実施形態では、基材は、マルチウェルプレートのウェルを含む。いくつかの実施形態では、基材はビーズを含む。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、基材にユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域は、アダプターの3’側にある。任意選択的に、各アダプターは、たとえば、シーケンシングに使用するために、ユニバーサルプライミング部位を含みうる。
ユニークオリゴヌクレオチド種を含む組成物の作製方法
本明細書のいくつかの実施形態によれば、ユニークオリゴヌクレオチドを含む組成物の作製方法が記載される。本方法は、本明細書に記載されるように複数の異なるサンプルバーコードを提供することを含みうる。本方法は、本明細書に記載されるように複数の異なる分子バーコードを提供することを含みうる。本方法は、本明細書に記載されるように複数のユニークオリゴヌクレオチド種を合成することを含みうる。ただし、各ユニークオリゴヌクレオチド種は、本明細書に記載されるようにサンプルバーコードと分子バーコードとを含むバーコード領域を含む。本方法は、空間分離されたプールに複数のユニークオリゴヌクレオチド種を配設することを含みうる。各プールは、同一のプールのユニークオリゴヌクレオチド種が同一のサンプルバーコード配列を含むように、かつ同一のプールの異なるユニークオリゴヌクレオチド種が異なる分子バーコード配列を含むように、複数のユニークオリゴヌクレオチド種を含みうる。任意選択的に、ユニークオリゴヌクレオチド種は、空間分離されたプールに合成と同時に配設される。任意選択的に、ユニークオリゴヌクレオチド種は、空間分離されたプールに合成の後に配設される。任意選択的に、組成物は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。任意選択的に、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。任意選択的に、組成物は、各分子バーコードが50未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になり、かつすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、それぞれ空間分離されたプールは、少なくとも100ユニークオリゴヌクレオチド種、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、5000、6500、または65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、それぞれ空間分離されたプールは、少なくとも1000ユニークオリゴヌクレオチド種を含む。
ユニークオリゴヌクレオチドは、いくつかの好適な方法のいずれかを用いて合成可能である。いくつかの実施形態では、サンプルバーコード配列および分子バーコード配列は、in silicoで生成され、そしてサンプルバーコード配列と分子バーコード配列とを共に含むユニークオリゴヌクレオチド種は、たとえば、化学オリゴヌクレオチド合成を用いて合成される。いくつかの実施形態では、同一のサンプルバーコード配列を含む複数のオリゴヌクレオチドは、空間分離した状態でプールされ、そして、たとえば、ハイブリダイゼーションおよび伸長によりまたはライゲーションにより、分子バーコードを含む複数のオリゴヌクレオチドに連結される。かかる方法は、複数のユニークオリゴヌクレオチド種を得るために、並行的または逐次的に複数の空間分離された環境で行うことが可能である。
任意選択的に、各ユニークオリゴヌクレオチド種は、本明細書に記載されるようにバーコード領域の3’側にユニフォーム領域をさらに含む。任意選択的に、ユニフォーム領域は標的特異的領域を含む。いくつかの実施形態では、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチド(たとえば、列挙された値の任意の2つの間の範囲を含めて標的に相補的な少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド)を含み、かつ標的核酸配列の5’→3’増幅用として構成される。任意選択的に、ユニフォーム領域はオリゴdT配列を含む。
いくつかの実施形態では、複数の分子バーコード(ひいては複数のユニークオリゴヌクレオチド種)は、各分子バーコードが本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%の分子バーコードは、本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも99%の分子バーコードは、本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードはすべて、本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する分子バーコードを有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種の各分子バーコードは、50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。
いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種の分子バーコード、全体として12.5%以下のG含有率を有する。
いくつかの実施形態では、各サンプルバーコードは、本明細書に記載されるように50%以下のG含有率、たとえば、50%未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。
いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種のサンプルバーコードは、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G、または0%GのG含有率を有する。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種のサンプルバーコード、全体として12.5%以下のG含有率を有する。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%(たとえば、少なくとも95%、96%、97%、98%、99%、99.5%、99.9%、または99.99%)は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種は、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HNHNHNHNを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも99%は、配列HHHHHHHHを含む分子バーコードを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含む。任意選択的に、スペーサーは配列HNHを含みうる。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。任意選択的に、スペーサーは配列HHHを含みうる。任意選択的に、スペーサーは配列HNHNHNHNを含みうる。任意選択的に、スペーサーは配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側のスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。
いくつかの実施形態では、少なくとも1プールは、同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、プールは、同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない。
いくつかの実施形態では、標的特異的領域は、標的核酸の5’→3’増幅用の配列を含みうる。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、標的特異的領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする配列にフランキングする配列を含む。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。
いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。
いくつかの実施形態では、本方法は、各基材に固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、それぞれ空間識別可能なプールのユニークオリゴヌクレオチド種を基材に固定することをさらに含む。このため、各プールは、特定のサンプルバーコードにより同定可能である。異なる基材(ひいては異なるプール)は異なるサンプルバーコードに関連付け可能であることに留意されたい。いくつかの実施形態では、基材は、異なるプールの基材が異なる離散表面領域を含むように離散表面領域を含む。いくつかの実施形態では、基材は、マルチウェルプレートのウェルを含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、共有結合により基材に固定される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、磁力または電磁力により基材に固定される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、基材に固定するために基材に埋め込まれる。
いくつかの実施形態では、空間識別可能な少なくとも48プール、たとえば、空間識別可能な少なくとも48、72、96、120、144、168、または192プールが作製される。
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成と同時に配設される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成の後に配設される。
オリゴヌクレオチド
いくつかの実施形態では、アダプター領域の3’側にバーコード領域を含むオリゴヌクレオチドが記載される。バーコード領域は、本明細書に記載されるように分子バーコードを含みうるとともに、分子バーコードは、50%以下のG含有率を有する。分子バーコードは少なくとも7ヌクレオチドを含みうる。
いくつかの実施形態では、オリゴヌクレオチドは、本明細書に記載されるようにサンプルバーコードをさらに含む。サンプルバーコードは、少なくとも3ヌクレオチドを含みうる。
いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、本明細書に記載されるように標的核酸に相補的な少なくとも10ヌクレオチドを含む標的特異的領域を含む。いくつかの実施形態では、ユニフォーム領域はオリゴdT配列を含む。いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の5’側にアダプター領域をさらに含む。いくつかの実施形態では、オリゴヌクレオチドは、本明細書に記載されるようにバーコード領域の3’側かつユニフォーム領域の5’側にスペーサーをさらに含む。
代替実施形態
いくつかの実施形態では、核酸転写物の正確で偏りのないバーコーディングの設計が提供される。このプライマー設計は、遺伝子特異的方法を介して特異的核酸(DNA/RNA)転写物を標的としうるまたは(たとえば、メッセンジャーRNAのポリAテールもしくは他のコンセンサス配列を介して)一群の多くの核酸転写物を標的としうる核酸配列(DNA、RNA、またはLNA)で構成される(図1A~C)。標的配列と共に、こうしたプライマーは、2つのカテゴリーの核酸バーコード、すなわち、1)「分子バーコード(molecular barcodes)」、分子インデックス(MI)、またはユニーク分子識別子(UMI)とも呼ばれる分子バーコード(molecule barcodes)と、2)サンプルインデックス(SI)とも呼ばれるサンプルバーコードと、を含む(図1A~C)。MIおよびSIバーコードは、次世代シーケンシング法または他のシーケンスリードアウト法およびバーコードリードアウト法のためのライブラリー調製の後、MIおよびそのサンプル源(SI)を介してその元の標的転写物を同定すべくユニークに標識するために使用される。いくつかの実施形態では、正確な遺伝子発現プロファイリングのために標的転写物にバーコードを偏りなくランダムに標識することを保証するプライマー内のMIおよびSIの異なる配置が詳述される(たとえば、図3A~3Hを参照されたい)(Fu et al.2011 PNAS 108:9026-9032(ランダム標識化の考察に関してその全体が本出願をもって参照により組み込まれる))を見る)。
いくつかの実施形態では、他のバーコード組成と比較して高Gヌクレオチド含有率のバーコードがより高頻度で使用される先行技術において観測される現象である「バーコードバイアス」を低減可能なユニークプライマー設計を設計する(図4)。遺伝子特異的配列を用いてmRNA転写物を標的として標識するために従来のプライマーを使用するある特定の場合には、高い%のG含有率と複数のGとを有するMIが好ましくは観測される(図4)。さらに、なんら理論により制限されるものではないが、従来の設計の範囲内で、標的遺伝子に関連付けられないSIを用いると、サンプルマルチプレックスPCR時にこうしたプライマーがクロス反応するため、少量のPCRエラーが観測される(図4~5)。こうしたクロスオーバーイベントは、おそらくGリッチオリゴヌクレオチドの「G四重鎖」と呼ばれるユニーク二次構造が原因で、多くの場合、高い%のG含有率と複数のGとを有するプライマーで起こる。こうしたGリッチMI/SIプライマーは互いに分子間および分子内複合体を形成する可能性があるので、プライマーを除去する従来のDNAクリーンアップ工程(たとえば、Ampure XPビーズ)は十分でないこともありうる。こうしたイベントが起こるのを最小限に抑えるために、本発明では、プライマーのG含有率を低減して「バーコードバイアス」およびプライマークロスオーバーを最小限に抑えるいくつかの設計を提供することが必要とされる(図3A~3H)。
図3A~3Hは、先行技術のバーコードレイアウトの設計(図3A)と、記載の通りバイアスを最小限に抑える新規な設計(図3B~H)と、を示す。図3Aでは、従来の設計は、「BBBBBBV」または「NNNNNNNN」(Bは、C、G、またはTであり、Vは、A、C、またはGであり、Nは、A、T、G、またはCである)のMI組成のいずれかを可能にする。従来設計のMIバーコードのサブセットはGリッチでありうる。パネル3B~Cでは、MIの後にTTTまたはTTTTTのいずれかを付加することにより領域に沿ってGリッチ度を低減する(非Gスペーサーの長さは可変でありうるとともに、任意の非Gヌクレオチドでありうる)。図3Dでは、高GリッチなMIが潜在的にGリッチな遺伝子特異的標的領域に隣接しないようにSI位置とMI位置とを入れ替える。図3E~Fでは、図3Dの設計にTTTまたはTTTTTのいずれかを付加することによりGリッチ領域をさらに低減する(SIはGリッチではなく、しかも非Gスペーサーの長さは可変でありうるとともに、任意の非Gヌクレオチドでありうることに留意されたい)。図3G~Hの設計では、MIは、「HHHHHHHH」または「HNHNHNHN」(ただし、Hは、A、C、またはTである)を用いてGリッチにならないように設計される。
従来の設計のGリッチの欠点は、遺伝子特異的ターゲッティング法が使用されるときに最も多く観測される。いくつかの実施形態は、T細胞レセプター(TCR)などの遺伝子特異的標的パネルで新しいプライマー設計を使用することを含み、TCRの場合、プライマーは、TCR特異的配列を標的とするために使用される。本明細書のいくつかの実施形態に係る設計では、SIバーコードクロスオーバーを軽減可能であるので、TCR分子バーコーディングアッセイの「ノイズ」が低減される。
実施例1:ユニークオリゴヌクレオチド種を用いたサンプル標的核酸の正確な分析
96フォーマットのユニークオリゴヌクレオチド種を設計した。それらの配列は図5A~5E(配列番号1~96)にまとめられている。ユニークオリゴヌクレオチド種のフォーマットA01~A12(配列番号1~12)は、分子バーコード(「第2のbc」)がNNNNNNNNである対照として提供した。このため、これらの対照ユニークオリゴヌクレオチド種の分子バーコードは、G含有率に関する制約や限定をなんら有していなかった。ユニークオリゴヌクレオチド種のフォーマットB01~B12(配列番号13~24)は、分子バーコード(「第2のbc」)の3’側かつユニフォーム領域(「5’→3’認識配列」)の5’側に配列TTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットC01~C12(配列番号25~36)は、分子バーコード(「第2のbc」)の3’側かつユニフォーム領域(「5’→3’認識配列」」)の5’側に配列TTTTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットD01~D12(配列番号37~48)は、サンプルバーコード(「第2のbc」)の5’側に分子バーコード(「第1のbc」)を含んでいた。ユニークオリゴヌクレオチド種のフォーマットE01~E12(配列番号49~60)は、サンプルバーコード(「第2のbc」)の5’側に分子バーコード(「第1のbc」)およびバーコード領域の3’側かつユニフォーム領域の4’側に配列TTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットF01~F12(配列番号61~72)は、サンプルバーコード(「第2のbc」)の5’側に分子バーコード(「第1のbc」)およびバーコード領域の3’側かつユニフォーム領域の4’側に配列TTTTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットG01~G12(配列番号73~84)は、それぞれ配列HHHHHHHH(ただし、各「H」は、A、C、またはTであり、かつ任意の2つの「H」ヌクレオチドは、同一であっても異なっていてもよい)を含む分子バーコード(「第2のbc」)を含んでいた。ユニークオリゴヌクレオチド種のフォーマットH01~H12(配列番号85~96)は、それぞれ配列HNHNHNHN(ただし、各「H」は、A、C、またはTであり、かつ任意の2つの「H」ヌクレオチドは、同一であっても異なっていてもよく、かつ各「N」は、A、G、C、またはTでありうるとともに、任意の2つの「N」ヌクレオチドは、同一であっても異なっていてもよい)を含む分子バーコード(「第2のbc」)を含んでいた。
標的T細胞レセプターの核酸配列の増幅および分析は、次のように行った。すなわち、Precise(商標)TCRエンコーディングプレート(BD Cellular Research Inc.)を室温で解凍し、そして短時間遠心して各ウェルに5μLの試薬を捕集した。プレートを96ウェルラックに配置し、ウェル内の試薬の擾乱を回避しつつ非常に注意深く氷上でシールを除去した。細胞を選別してまたは直接に96ウェルエンコーディングプレートに添加した(1細胞/ウェル)。プレートをシールし、そして短時間撹拌(5~10s)して混合し、次いで短時間遠心(約1000rpm×10s)した。選別サンプルプレートは、Precise(商標)プロトコルの開始の準備ができるまで任意選択的に-80℃で貯蔵可能である。逆転写のために、プレートを65℃で3分間インキュベートし、4℃に冷却し、次いで氷上に5分間配置した。反応マスターミックスは、次の通りであった。
Figure 0007129343000001
5μLのRT MMを各ウェルにピペッティングした。各プレートをシールし、逆転写酵素プログラムを次のように実施した。42℃30分間、80C5分間、4C休止。
cDNA精製は次のプロトコルを用いて行った。プレートを遠心する(1000rpm×10s)。すべての反応を組み合わせて単一2mL管に入れる。8μLのPrecise DBPミックスをプールcDNA管に添加する。穏やかに撹拌して緩衝液を溶液状態にする。プールRT反応産物(1×体積のプールPCR産物)の入った単一チューブに等価体積のAMPure XPビーズを添加する。上下にピペッティングしてサンプルとビーズとを混合する。ビーズミックスを室温で5分間インキュベートする。キャップを開けてビーズの擾乱がないことを確認する。管を磁石の上に置いて液体とビーズとが分離するまで待つ。液体は除去前に完全に透明になっていなければならない。これには5分間かかる。管を磁石の上に保持しながら液体のみを注意深く除去し廃棄する。管をマグネットスタンドの上に保持しながら2mLの70%EtOH/30%HOを用いてビーズを穏やかに1回濯ぐ。蒸発を回避するために新鮮なEtOH溶液を毎日調製する。注意を払って濯ぎ工程時にビーズの擾乱や再懸濁が起こらないようにしうる。ピペットを用いてすべての残留EtOH溶液をただちに除去する。管を磁石の上に置いた状態でタッピングし、できる限り多くのEtOHを管の底部で捕集する。ビーズから産物を溶出させるために管を磁石から離す。ビーズの入った管に68μLの溶出緩衝液を導入する。管を傾けることにより溶出緩衝液でビーズを湿潤させる。十分に撹拌して混合し1分間待つ。管を磁石に戻す。溶液が透明になるまで典型的には<5分間待つ。溶液を注意深くピペッティングしてビーズから取り出すことにより精製PCR産物溶液を回収する。透明液体産物(68μL)を新しい1.5mL管に導入する。
PCR N1増幅(標的増幅)は、次のプロトコルを用いて行った。表2に従ってプレ増幅領域でPCRミックス(200μL)を調製する。
Figure 0007129343000002
この200μLの反応ミックスを4つのPCR管に分配する。次のPCR条件、すなわち、60Cで3分間のアニーリング時間、68Cで1分間の伸長時間の20サイクル行う(約2時間)。すべてのPCR産物を組み合わせて1つのサンプル管に入れる。160μLのAmpureビーズ(0.8×)を添加し、ピペッティングして十分に混合し、そして室温で5分間インキュベートする。管を磁石の上に置いて液体とビーズとが分離するまで待つ。液体は除去前に完全に透明になっていなければならない。これには5分間かかる。液体のみ除去して廃棄する。マグネットスタンドの上にある状態で1mLの70%EtOH/30%HOを用いて管を穏やかに1回濯ぐ。濯ぎ工程時にビーズを再懸濁させない。ピペットを用いてすべての残留EtOHをただちに除去する。管を磁石の上に置いた状態でタッピングし、できる限り多くのEtOHを管の底部で捕集する。50μLの溶出緩衝液にPCR産物を溶出させる。
PCR N1増幅(アダプターおよびインデクシングPCR)は、次のプロトコルを用いて行った。表3に従ってPCRミックス(50μL)を調製する。
Figure 0007129343000003
次のPCR条件、すなわち、60Cで3分間のアニーリング時間、68Cで1分間の伸長時間の25サイクル行う。0.8×Ampureで2回精製し、30μLの溶出緩衝液に溶出させる。
図6は、シーケンス結果の平均に対するエラー訂正を示す(個別TCRa CDR3による)。図6では、Y軸は、TCRaに対して検出された異なる分子バーコードの数をプロットする。
結果は、50pgの標的RNAとの反応(図6では「50」、たとえば、A50、B50、C50、D50、E50、F50、G50で表される)および0pgの標的RNAを取り込んだ陰性対照(図6では「0」、たとえば、A0、B0、C0、D0、E0、F0、G0で表される)に対して示されている。このため、0pgは、陰性対照および50pgサンプルから漏れたアッセイノイズのディテクターとして機能する。標的RNAを取り込んだ反応では、本明細書のいくつかの実施形態に係るユニークオリゴヌクレオチド設計B01~B12(「B50」)、C01~C12(「C50」)、D01~D12(「D50」)、E01~E12(「E50」)、F01~F12(「F50」)、G01~G12(「G50」)、およびH01~H12(「H50」)は、従来のフォーマットA01~A12(「A50」)よりも低いエラー率を有していた。とくに、この実験のTRACでは、フォーマット「H」は、低ノイズで最も高い感度を有し、元のバーコード付きプライマー(A)よりも良好な挙動を示した。
そのため、本明細書に記載されるようにバーコード領域と比較的低いG含有率を有する分子バーコードとを含むユニークオリゴヌクレオチド種および/または分子バーコードの3’側かつユニフォーム領域の5’側にスペーサーを含むユニークオリゴヌクレオチドを含む組成物は、かかる特徴を含まない一般的ポリヌクレオチド種を含む組成物よりも低いエラー率ひいては高い確度で増幅をもたらした。
種々の態様および実施形態を本明細書に開示してきたが、他の態様および実施形態は当業者には自明であろう。本明細書に開示される種々の態様および実施形態は、例示を目的としたものであり、限定を意図したものではなく、真の範囲および趣旨は、以下の特許請求の範囲により示される。
本明細書に開示されるこうしたおよび他のプロセスおよび方法では、プロセスおよび方法で発揮される機能を異なる順序で実現可能であることは、当業者であれば分かるであろう。さらに、概説された工程および操作は、単に例として提供されており、工程および操作の一部は、任意選択的でありうるとともに、本開示の実施形態の本質を損なうことなく、組み合わせてより少ない工程および操作にし、拡張して追加の工程および操作を追加しうる。
本明細書に記載の実質的に任意の複数形および/または単数形の用語の使用に関連して、文脈上および/または適用上適切であれば、当業者は複数形から単数形へおよび/または単数形から複数形への変換が可能である。明確にするために種々の単数形/複数形の入替えを本明細書に明示的に記述しうる。
一般的には、本明細書とくに添付の特許請求の範囲(たとえば添付の特許請求の範囲の本文)で用いられる用語は「オープン」用語であることが一般に意図されることは当業者であれば理解されよう(たとえば、「including(~を含む)」という用語は「~を含むがこれらに限定されるものではない」と解釈すべきであり、「having(~を有する)」という用語は「少なくとも~を有する」と解釈すべきであり、「includes(~を含む)」という用語は「~を含むがこれらに限定されるものではない」と解釈すべきであるなど)。さらに、導入クレームレシテーションの特定数が意図される場合、かかる意図は請求項で明示的にリサイトされ、かかるレシテーションの不在下ではかかる意図は存在しないことは当業者であれば理解されようたとえば、理解の一助として、以下の添付の特許請求の範囲は、クレームレシテーションを導入するために導入語句「at least one(少なくとも1つ)」および「one or more(1つ以上)」の使用を含みうる。しかしながら、かかる語句が用いられたとしても、不定冠詞「a」または「an」によるクレームレシテーションの導入が、かかる導入クレームレシテーションを含む任意の特定の請求項を、一方のかかるレシテーションを含む実施形態のみに限定することを意味するものと解釈すべきでない。たとえ同一の請求項が導入語句「one or more(1つ以上)」または「at least one(少なくとも1つ)」と不定冠詞たとえば「a」または「an」とを含む場合でさえも、そのように解釈すべきでない(たとえば、「a」および/または「an」は「at least one(少なくとも1つ)」または「one or more(1つ以上)」を意味するものと解釈すべきである)。定冠詞を用いてクレームレシテーションを導入する場合にも、同じことが当てはまる。そのほかに、たとえ特定数の導入クレームレシテーションが明示的にリサイトされたとしても、かかるレシテーションは少なくともリサイトされた数を意味すると解釈すべきであることは当業者であれば分かるであろう(たとえば、「2つのレシテーション」という他の修飾語を含まないベアのレシテーションは、少なくとも2つのレシテーションまたは2つ以上レシテーションを意味する)。さらに、「A、B、およびCの少なくとも1つ」に類似した条件が用いられる場合、一般的には、かかる構成は当業者がその条件を理解する意味であることが意図される(たとえば、「A、B、およびCの少なくとも1つを有する系」は、限定されるものではないが、A単独、B単独、C単独、AとBの両方、AとCの両方、BとCの両方、および/またはAとBとCの全部などを有する系を含であろう)。「A、B、またはCの少なくとも1つなど」に類似した条件が用いられる場合、一般的には、かかる構成は当業者がその条件を理解する意味であることが意図される(たとえば、「A、B、またはCの少なくとも1つを有する系」は、限定されるものではないが、A単独、B単独、C単独、AとBの両方、AとCの両方、BとCの両方、および/またはAとBとCの全部などを有する系を含であろう)。さらに、2つ以上の代替用語を表す実質上任意の選言的な語および/または語句は、明細書、請求項、または図面にかかわらず、用語の1つ、用語のいずれか、または用語の両方を含む可能性が企図されると理解すべきであることは当業者であれば理解されよう。たとえば、「AまたはB」という語句は「A」または「B」または「AおよびB」の可能性を含むものと理解されよう。
そのほかに、本開示の特徴または態様がマーカッシュグループにより記述される場合、それにより、本開示は、マーカッシュグループの任意の個別のメンバーまたはメンバーのサブグループにより記述されることは当業者であれば分かるであろう。
当業者であれば理解されるであろうが、あらゆる目的で、たとえば、明細書の提供に関して、本明細書に開示された範囲はすべて、あらゆる可能なサブ範囲およびそのサブ範囲の組合せをも包含する。いずれの列挙された範囲も、十分に記述されたものとしてかつその範囲が少なくとも2等分、3等分、4等分、5等分、10等分などされうるものとして容易に認識可能である。たとえば、限定されるものではないが、本明細書で考察した各範囲は、下3分の1、中3分の1、上3分の1に容易に分解可能である。同様に、当業者であれば理解されるであろうが、「~まで」、「少なくとも~」などの表現はすべて、リサイトされた数を含み、以上で考察したように後続的にサブ範囲に分解可能な範囲を意味する。最終的に、当業者であれば理解されるであろうが、範囲は各個別のメンバーを含む。したがって、たとえば、1~3個の細胞を有するグループは、1、2、または3個の細胞を有するグループを意味する。同様に、1~5個の細胞を有するグループは、1、2、3、4、または5個の細胞を有するグループを意味し、他も同様である。
以上のことから、例示を目的として本開示の種々の実施形態を本明細書に記載してきたことおよび本開示の範囲および趣旨から逸脱することなく種々の変更を行いうることは分かるであろう。したがって、本明細書に開示される各種実施形態は、限定を意図したものではなく、真の範囲および趣旨は、以下の特許請求の範囲により示される。

Claims (25)

  1. 少なくとも1000ユニークオリゴヌクレオチド種を含む組成物であって、各ユニークオリゴヌクレオチド種が、バーコード領域及びユニフォーム領域を含み、前記バーコード領域が、少なくとも7ヌクレオチドを含む分子バーコード含み、ここで、
    前記ユニフォーム領域が、前記バーコード領域の3’側にあり且つ標的特異的領域を含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含み、
    前記ユニークオリゴヌクレオチド種がそのバーコード領域に異なる核酸配列を含み、ここで、
    (a)前記ユニークオリゴヌクレオチド種の1%未満の分子バーコードが50%以上のG含有率を有し、および/または
    (b)前記組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有し、かつ
    前記バーコード領域が少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む、
    前記組成物。
  2. 前記ユニフォーム領域が、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む、請求項に記載の組成物。
  3. 前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、請求項に記載の組成物。
  4. 前記標的特異的領域がオリゴdT配列を含む、請求項に記載の組成物。
  5. 前記ユニークオリゴヌクレオチド種の1%未満の分子バーコードが50%以上のG含有率を有する、請求項1~のいずれか一項に記載の組成物。
  6. 前記組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有する、請求項1~のいずれか一項に記載の組成物。
  7. 前記ユニークオリゴヌクレオチド種が少なくとも2つの空間分離されたプール内に配設され、各プールが前記ユニークオリゴヌクレオチド種の少なくとも100ユニークオリゴヌクレオチドを含み、
    同一のプール内のユニークオリゴヌクレオチドが同一のサンプルバーコード配列を含み、かつ
    同一のプールの異なるユニークオリゴヌクレオチドが異なる分子バーコード配列を含む、
    請求項1~のいずれか一項に記載の組成物。
  8. 各プールのユニークオリゴヌクレオチド種が基材に固定されており、各基材に固定されたオリゴヌクレオチド種について分子バーコードではなくサンプルバーコードが同一である、請求項に記載の組成物。
  9. 前記ユニークオリゴヌクレオチド種の少なくとも95%は分子バーコード内のいずれのGも他のGに隣接しない、請求項1~のいずれか一項に記載の組成物。
  10. 前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%が配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、請求項1~のいずれか一項に記載の組成物。
  11. 前記ユニークオリゴヌクレオチド種の各分子バーコードが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、請求項1~10のいずれか一項に記載の組成物。
  12. 各オリゴヌクレオチド種が24~140ヌクレオチド長を有する、請求項1~11のいずれか一項に記載の組成物。
  13. 前記組成物が少なくとも6,500ユニークオリゴヌクレオチド種を含む、請求項1~12のいずれか一項に記載の組成物。
  14. 前記組成物が同一のユニークオリゴヌクレオチド種を2オリゴヌクレオチド以上含む、請求項1~13のいずれか一項に記載の組成物。
  15. 2以上のサンプル由来の複数の核酸に特異的にバーコードを付ける方法であって、
    各サンプルが核酸を含み、
    下記の工程を含む、前記方法:
    各サンプルと少なくとも100ユニークオリゴヌクレオチド種を含むプールとを接触させる工程、ここで、
    各サンプルは他のサンプルから空間分離した状態で接触され、
    各ユニークオリゴヌクレオチド種が、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含み、
    各プールのユニークポリヌクレオチド種が同一のサンプルバーコードを含むとともに異なる分子バーコードを含み、ここで、
    (a)前記サンプルと接触するユニークオリゴヌクレオチド種の1%未満の分子バーコードが50%以上のG含有率を有し、および/または
    (b)すべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有し、かつ
    前記バーコード領域が少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む;
    前記ユニークオリゴヌクレオチド種の複数のオリゴヌクレオチドの標的特異的領域を前記サンプルの複数の核酸にハイブリダイズさせる工程;並びに
    ハイブリダイズされた前記オリゴヌクレオチドを伸長させることにより、前記ユニークオリゴヌクレオチド種のオリゴヌクレオチドと前記標的に相補的な配列とを含む鎖を生成する工程、ここで、
    各サンプルでは、前記鎖が同一のサンプルバーコードと異なる分子バーコードとを含み、かつ異なるサンプルでは、サンプルバーコードが異なっている。
  16. 各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側にユニフォーム領域をさらに含前記ユニフォーム領域が前記バーコード領域の3’側に標的特異的領域をさらに含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含む、請求項15に記載の方法。
  17. すべての前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有する、請求項15または16に記載の方法。
  18. 前記ユニークオリゴヌクレオチド種のオリゴヌクレオチドと前記標的に相補的な配列とを含む鎖の核酸配列を確認する工程をさらに含む、請求項1517のいずれか一項に記載の方法。
  19. 各プールの少なくとも100ユニークオリゴヌクレオチド種が基材に固定されており、所与の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを含みかつ前記基材に固定された異なるユニークオリゴヌクレオチド種が異なる分子バーコードを含む、請求項1518のいずれか一項に記載の方法。
  20. 前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%未満のG含有率を有する、請求項1519のいずれか一項に記載の方法。
  21. 下記工程を含む、ユニークオリゴヌクレオチドを含む組成物を作製する方法:
    それぞれ少なくとも3ヌクレオチドを含む複数の異なるサンプルバーコードを用意する工程;
    それぞれ少なくとも7ヌクレオチドを含む複数の異なる分子バーコードを用意する工程;
    複数のユニークオリゴヌクレオチド種を合成する工程、ここで
    各ユニークオリゴヌクレオチド種は、
    サンプルバーコードと分子バーコードとを含むバーコード領域と、
    前記バーコード領域の3’側にあり且つ標的特異的領域を含む、ユニフォーム領域と、
    を含み、ここで、前記標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含み、
    (a)前記ユニークオリゴヌクレオチド種の1%未満の分子バーコードが50%以上のG含有率を有し、および/または
    (b)前記複数のユニークオリゴヌクレオチド種すべての分子バーコードが全体として12.5%以下のG含有率を有する;並びに
    空間分離されたプール内に前記ユニークオリゴヌクレオチド種を配設する工程、ここで、
    各プールが複数のユニークオリゴヌクレオチド種を含み、同一のプールのユニークオリゴヌクレオチド種が同一のサンプルバーコード配列を含み、かつ同一のプールの異なるユニークオリゴヌクレオチド種が異なる分子バーコード配列を含み、
    各プールが少なくとも1000ユニークオリゴヌクレオチド種を含む。
  22. 基材上に各プールのユニークオリゴヌクレオチド種を固定することをさらに含み、各基材に固定された前記オリゴヌクレオチド種について分子バーコードではなくサンプルバーコードが同一である、請求項21に記載の方法。
  23. 請求項2又は3に記載の組成物を含むキットであって、前記標的特異的領域によってハイブリダイズされる鎖に対して相補的な鎖にハイブリダイズするように構成されたプライマーをさらに含み、前記標的特異的領域によってハイブリダイズされる鎖は、前記可変領域コード配列を含み、且つ前記プライマーは、前記標的特異的領域を含むユニークオリゴヌクレオチド種と共に前記可変領域コード配列を増幅するように構成されている、前記キット。
  24. 請求項2又は3に記載の組成物を含むキットであって、前記標的特異的領域を含むユニークオリゴヌクレオチド種と共に前記可変領域コード配列を増幅するように構成されているプライマーをさらに含む、前記キット。
  25. 前記プライマーと、前記標的特異的領域を含むユニークオリゴヌクレオチド種とが、前記可変領域コード配列を含む少なくとも1kbの核酸を増幅するように構成されている、請求項23又は24に記載のキット。
JP2018557413A 2016-05-02 2017-04-28 正確な分子バーコーディング Active JP7129343B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022106377A JP2022153390A (ja) 2016-05-02 2022-06-30 正確な分子バーコーディング

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662330500P 2016-05-02 2016-05-02
US62/330,500 2016-05-02
PCT/US2017/030097 WO2017192387A1 (en) 2016-05-02 2017-04-28 Accurate molecular barcoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022106377A Division JP2022153390A (ja) 2016-05-02 2022-06-30 正確な分子バーコーディング

Publications (3)

Publication Number Publication Date
JP2019520046A JP2019520046A (ja) 2019-07-18
JP2019520046A5 JP2019520046A5 (ja) 2021-12-09
JP7129343B2 true JP7129343B2 (ja) 2022-09-01

Family

ID=59285319

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018557413A Active JP7129343B2 (ja) 2016-05-02 2017-04-28 正確な分子バーコーディング
JP2022106377A Pending JP2022153390A (ja) 2016-05-02 2022-06-30 正確な分子バーコーディング

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022106377A Pending JP2022153390A (ja) 2016-05-02 2022-06-30 正確な分子バーコーディング

Country Status (8)

Country Link
US (1) US10822643B2 (ja)
EP (2) EP3452614B1 (ja)
JP (2) JP7129343B2 (ja)
CN (1) CN109072288A (ja)
AU (2) AU2017261189B2 (ja)
CA (1) CA3019589A1 (ja)
ES (1) ES2956757T3 (ja)
WO (1) WO2017192387A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
ES2663234T3 (es) 2012-02-27 2018-04-11 Cellular Research, Inc Composiciones y kits para recuento molecular
EP3039158B1 (en) 2013-08-28 2018-11-14 Cellular Research, Inc. Massively parallel single cell analysis
JP2017504307A (ja) 2013-10-07 2017-02-09 セルラー リサーチ, インコーポレイテッド アレイ上のフィーチャーをデジタルカウントするための方法およびシステム
US10697010B2 (en) 2015-02-19 2020-06-30 Becton, Dickinson And Company High-throughput single-cell analysis combining proteomic and genomic information
WO2016138496A1 (en) 2015-02-27 2016-09-01 Cellular Research, Inc. Spatially addressable molecular barcoding
WO2016160844A2 (en) 2015-03-30 2016-10-06 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
WO2016172373A1 (en) 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US11124823B2 (en) 2015-06-01 2021-09-21 Becton, Dickinson And Company Methods for RNA quantification
ES2745694T3 (es) 2015-09-11 2020-03-03 Cellular Res Inc Métodos y composiciones para normalización de biblioteca de ácido nucleico
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US11397882B2 (en) 2016-05-26 2022-07-26 Becton, Dickinson And Company Molecular label counting adjustment methods
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
KR102363716B1 (ko) 2016-09-26 2022-02-18 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
EP3568234B1 (en) 2017-01-13 2023-09-06 Cellular Research, Inc. Hydrophilic coating of fluidic channels
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
JP2020522262A (ja) 2017-06-05 2020-07-30 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company 単一細胞用のサンプルインデックス付加
EP3728636A1 (en) 2017-12-19 2020-10-28 Becton, Dickinson and Company Particles associated with oligonucleotides
CN112243461A (zh) 2018-05-03 2021-01-19 贝克顿迪金森公司 在相对的转录物末端进行分子条形码化
EP4234717A3 (en) 2018-05-03 2023-11-01 Becton, Dickinson and Company High throughput multiomics sample analysis
CN112805389A (zh) 2018-10-01 2021-05-14 贝克顿迪金森公司 确定5’转录物序列
WO2020097315A1 (en) 2018-11-08 2020-05-14 Cellular Research, Inc. Whole transcriptome analysis of single cells using random priming
US11492660B2 (en) 2018-12-13 2022-11-08 Becton, Dickinson And Company Selective extension in single cell whole transcriptome analysis
US11371076B2 (en) 2019-01-16 2022-06-28 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
EP3914728B1 (en) 2019-01-23 2023-04-05 Becton, Dickinson and Company Oligonucleotides associated with antibodies
JP7194311B2 (ja) * 2019-07-10 2022-12-21 ウルティマ ジェノミクス, インコーポレイテッド Rnaシークエンシング法
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
US10927409B1 (en) 2019-10-14 2021-02-23 Pioneer Hi-Bred International, Inc. Detection of sequences uniquely associated with a dna target region
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
KR102482668B1 (ko) * 2020-03-10 2022-12-29 사회복지법인 삼성생명공익재단 고유 분자 식별자의 표지 정확도를 증진하는 방법
WO2021195277A1 (en) * 2020-03-24 2021-09-30 President And Fellows Of Harvard College Multiplexed methods for detecting target rnas
CN115605614A (zh) 2020-05-14 2023-01-13 贝克顿迪金森公司(Us) 用于免疫组库谱分析的引物
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
EP4247967A1 (en) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profiling of highly expressed and lowly expressed proteins

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004526433A (ja) 2001-01-25 2004-09-02 ティーエム バイオサイエンス コーポレイション 標識および標識補体として使用するためのポリヌクレオチド、製品、ならびにその使用方法
JP2008538505A (ja) 2005-04-21 2008-10-30 アイシス ファーマシューティカルズ インコーポレイティッド 細菌の同定に用いる組成物
WO2015031691A1 (en) 2013-08-28 2015-03-05 Cellular Research, Inc. Massively parallel single cell analysis

Family Cites Families (268)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4510244A (en) 1980-04-17 1985-04-09 The Board Of Trustees Of The Leland Stanford Jr. University Cell labeling with antigen-coupled microspheres
US4725536A (en) 1985-09-19 1988-02-16 Genetics Institute, Inc. Reagent polynucleotide complex with multiple target binding regions, and kit and methods
US6150517A (en) 1986-11-24 2000-11-21 Gen-Probe Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms
WO1989001050A1 (en) 1987-07-31 1989-02-09 The Board Of Trustees Of The Leland Stanford Junior University Selective amplification of target polynucleotide sequences
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
US5124246A (en) 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
US5656731A (en) 1987-10-15 1997-08-12 Chiron Corporation Nucleic acid-amplified immunoassay probes
WO1990001065A1 (en) 1988-07-26 1990-02-08 Genelabs Incorporated Rna and dna amplification techniques
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US6551784B2 (en) 1989-06-07 2003-04-22 Affymetrix Inc Method of comparing nucleic acid sequences
US6309822B1 (en) 1989-06-07 2001-10-30 Affymetrix, Inc. Method for comparing copy number of nucleic acid sequences
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5925525A (en) 1989-06-07 1999-07-20 Affymetrix, Inc. Method of identifying nucleotide differences
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US5200314A (en) 1990-03-23 1993-04-06 Chiron Corporation Polynucleotide capture assay employing in vitro amplification
EP0834576B1 (en) 1990-12-06 2002-01-16 Affymetrix, Inc. (a Delaware Corporation) Detection of nucleic acid sequences
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5424413A (en) 1992-01-22 1995-06-13 Gen-Probe Incorporated Branched nucleic acid probes
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
EP0705271B1 (en) 1993-06-25 2002-11-13 Affymetrix, Inc. (a Delaware Corporation) Hybridization and sequencing of nucleic acids
US5500356A (en) 1993-08-10 1996-03-19 Life Technologies, Inc. Method of nucleic acid sequence selection
US6309823B1 (en) 1993-10-26 2001-10-30 Affymetrix, Inc. Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same
US5681697A (en) 1993-12-08 1997-10-28 Chiron Corporation Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US6600996B2 (en) 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
EP0709466B1 (en) 1994-10-28 2006-09-27 Gen-Probe Incorporated Compositions and methods for the simultaneous detection and quantification of multiple specific nucleic acid sequences
CN1181720A (zh) 1995-04-25 1998-05-13 伊萝莉公司 可远程编程的存储器材料及其应用
US5648245A (en) 1995-05-09 1997-07-15 Carnegie Institution Of Washington Method for constructing an oligonucleotide concatamer library by rolling circle replication
US5968740A (en) 1995-07-24 1999-10-19 Affymetrix, Inc. Method of Identifying a Base in a Nucleic Acid
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US5962271A (en) 1996-01-03 1999-10-05 Cloutech Laboratories, Inc. Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
EP0912761A4 (en) 1996-05-29 2004-06-09 Cornell Res Foundation Inc DETERMINATION OF DIFFERENCES IN THE NUCLEIC ACID SEQUENCE BY MEANS OF A COMBINATION OF LIGASE DETERMINATION AND POLYMERASE CHAIN REACTION
JPH1021373A (ja) 1996-07-05 1998-01-23 Fuji Photo Film Co Ltd 画像解析装置
WO1998015644A2 (en) 1996-09-27 1998-04-16 The Chinese University Of Hong Kong Parallel polynucleotide sequencing method
US6124092A (en) 1996-10-04 2000-09-26 The Perkin-Elmer Corporation Multiplex polynucleotide capture methods and compositions
US6117631A (en) 1996-10-29 2000-09-12 Polyprobe, Inc. Detection of antigens via oligonucleotide antibody conjugates
US6046005A (en) 1997-01-15 2000-04-04 Incyte Pharmaceuticals, Inc. Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group
EP0985142A4 (en) 1997-05-23 2006-09-13 Lynx Therapeutics Inc SYSTEM AND APPARATUS FOR THE SEQUENTIAL TREATMENT OF ANALYTES
US6399334B1 (en) 1997-09-24 2002-06-04 Invitrogen Corporation Normalized nucleic acid libraries and methods of production thereof
WO1999028505A1 (en) 1997-12-03 1999-06-10 Curagen Corporation Methods and devices for measuring differential gene expression
US6265163B1 (en) 1998-01-09 2001-07-24 Lynx Therapeutics, Inc. Solid phase selection of differentially expressed genes
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US6653077B1 (en) 1998-09-04 2003-11-25 Lynx Therapeutics, Inc. Method of screening for genetic polymorphism
US6480791B1 (en) 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
US6197554B1 (en) 1998-11-20 2001-03-06 Shi-Lung Lin Method for generating full-length cDNA library from single cells
DE60018225T2 (de) * 1999-03-01 2005-12-29 Pfizer Products Inc., Groton Oxamsäuren mit einer Cyanogruppe als Liganden für den Thyroidrezeptor
US6629040B1 (en) 1999-03-19 2003-09-30 University Of Washington Isotope distribution encoded tags for protein identification
EP1165839A2 (en) 1999-03-26 2002-01-02 Whitehead Institute For Biomedical Research Universal arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
CA2644688C (en) 1999-04-20 2012-11-13 Kankyo Engineering Co., Ltd. Method for determining a concentration of target nucleic acid molecules, nucleic acid probes for the method, and method for analysing data obtained by the method
US6326148B1 (en) 1999-07-12 2001-12-04 The Regents Of The University Of California Detection of copy number changes in colon cancer
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
SE9903988D0 (sv) 1999-11-03 1999-11-03 Amersham Pharm Biotech Ab Method of analysis
US6489114B2 (en) 1999-12-17 2002-12-03 Bio Merieux Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby
US6235483B1 (en) 2000-01-31 2001-05-22 Agilent Technologies, Inc. Methods and kits for indirect labeling of nucleic acids
EP1990428B1 (en) 2000-02-07 2010-12-22 Illumina, Inc. Nucleic acid detection methods using universal priming
GB2364054B (en) 2000-03-24 2002-05-29 Smithkline Beecham Corp Method of amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof
EP2206791B1 (en) 2000-04-10 2016-07-13 Taxon Biosciences, Inc. Methods for the survey and genetic analysis of populations
US20030207300A1 (en) 2000-04-28 2003-11-06 Matray Tracy J. Multiplex analytical platform using molecular tags
US7630063B2 (en) 2000-08-02 2009-12-08 Honeywell International Inc. Miniaturized cytometer for detecting multiple species in a sample
CN101525660A (zh) 2000-07-07 2009-09-09 维西根生物技术公司 实时序列测定
US6858412B2 (en) 2000-10-24 2005-02-22 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic DNA
US20020142345A1 (en) 2000-12-22 2002-10-03 Nelsen Anita J. Methods for encoding and decoding complex mixtures in arrayed assays
US20030049616A1 (en) 2001-01-08 2003-03-13 Sydney Brenner Enzymatic synthesis of oligonucleotide tags
WO2002070684A2 (en) 2001-01-11 2002-09-12 Lion Bioscience Ag Gene library for screening methods
US7027932B2 (en) 2001-03-21 2006-04-11 Olympus Optical Co., Ltd. Biochemical examination method
CA2344599C (en) 2001-05-07 2011-07-12 Bioneer Corporation Selective polymerase chain reaction of dna of which base sequence is completely unknown
US6905827B2 (en) 2001-06-08 2005-06-14 Expression Diagnostics, Inc. Methods and compositions for diagnosing or monitoring auto immune and chronic inflammatory diseases
US6830931B2 (en) 2001-07-12 2004-12-14 Automated Cell, Inc. Method and apparatus for monitoring of proteins and cells
US20030175908A1 (en) 2002-01-29 2003-09-18 Sten Linnarsson Methods and means for manipulating nucleic acid
US20030186251A1 (en) 2002-04-01 2003-10-02 Brookhaven Science Associates, Llc Genome sequence tags
US20070178478A1 (en) 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
WO2004003219A2 (en) 2002-06-28 2004-01-08 Igen International, Inc. Improved assay systems and components
US20050019776A1 (en) 2002-06-28 2005-01-27 Callow Matthew James Universal selective genome amplification and universal genotyping system
EP1546721B2 (en) 2002-08-16 2017-05-17 Avantra Biosciences Corporation Substrates for isolating, reacting and microscopically analyzing materials
US7361821B2 (en) 2002-09-20 2008-04-22 Intel Corporation Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading
DE60229890D1 (de) 2002-09-30 2008-12-24 Hoffmann La Roche Oligonukleotide zur genotypisierung des thymidylat-synthase gens
JP5695287B2 (ja) 2002-10-02 2015-04-01 カリフォルニア インスティテュート オブ テクノロジー 微小流体の核酸解析
US7822555B2 (en) 2002-11-11 2010-10-26 Affymetrix, Inc. Methods for identifying DNA copy number changes
WO2004044225A2 (en) 2002-11-11 2004-05-27 Affymetrix, Inc. Methods for identifying dna copy number changes
US7704687B2 (en) 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
US7269518B2 (en) 2003-04-30 2007-09-11 Agilent Technologies, Inc. Chemical array reading
US20040259118A1 (en) 2003-06-23 2004-12-23 Macevicz Stephen C. Methods and compositions for nucleic acid sequence analysis
EP2918595B1 (en) 2003-07-05 2019-12-11 The Johns-Hopkins University Method and compositions for detection and enumeration of genetic variations
GB0319332D0 (en) 2003-08-16 2003-09-17 Astrazeneca Ab Amplification
US20050048498A1 (en) 2003-08-29 2005-03-03 Applera Corporation Compositions, methods, and kits for assembling probes
US7354706B2 (en) 2003-09-09 2008-04-08 The Regents Of The University Of Colorado, A Body Corporate Use of photopolymerization for amplification and detection of a molecular recognition event
US7824856B2 (en) 2003-09-10 2010-11-02 Althea Technologies, Inc. Expression profiling using microarrays
JP2007512811A (ja) 2003-11-10 2007-05-24 インベスチゲン, インコーポレイテッド 検出のための核酸を調製する方法
WO2005071110A2 (en) 2004-01-23 2005-08-04 Lingvitae As Improving polynucleotide ligation reactions
EP1713936B1 (en) 2004-02-12 2009-12-09 Population Genetics Technologies Ltd Corporation of Great Britain Genetic analysis by sequence-specific sorting
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
WO2005111242A2 (en) 2004-05-10 2005-11-24 Parallele Bioscience, Inc. Digital profiling of polynucleotide populations
CA2569745A1 (en) 2004-06-07 2005-12-22 Irm Llc Dispensing systems, software, and related methods
US20060035258A1 (en) 2004-08-06 2006-02-16 Affymetrix, Inc. Methods for identifying DNA copy number changes
US20060041385A1 (en) 2004-08-18 2006-02-23 Bauer Kenneth D Method of quantitating proteins and genes in cells using a combination of immunohistochemistry and in situ hybridization
US20060073506A1 (en) 2004-09-17 2006-04-06 Affymetrix, Inc. Methods for identifying biological samples
EP1836302B1 (en) 2004-12-23 2010-04-14 Amersham Biosciences Corp. Ligation-based rna amplification
JP5165383B2 (ja) 2004-12-23 2013-03-21 アイ−スタツト・コーポレイシヨン 分子診断システム及び方法
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
JP5526326B2 (ja) 2005-02-10 2014-06-18 独立行政法人理化学研究所 核酸配列増幅方法
WO2006099604A2 (en) 2005-03-16 2006-09-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
EP2518161A1 (en) 2005-03-18 2012-10-31 Fluidigm Corporation Method for detection of mutant alleles
US20060263789A1 (en) 2005-05-19 2006-11-23 Robert Kincaid Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using
US7695886B2 (en) 2005-05-19 2010-04-13 Fuji Xerox Co., Ltd. Process for producing resin particle liquid dispersion for electrostatic image developing toner, electrostatic image developing toner and production process thereof
US8407013B2 (en) 2005-06-07 2013-03-26 Peter K. Rogan AB initio generation of single copy genomic probes
US7796815B2 (en) 2005-06-10 2010-09-14 The Cleveland Clinic Foundation Image analysis of biological objects
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
CN101263227A (zh) 2005-09-16 2008-09-10 454生命科学公司 cDNA文库制备
US8313711B2 (en) 2005-11-01 2012-11-20 Freeslate, Inc. Liquid dispensing for high-throughput experimentation
US7375211B2 (en) 2005-11-18 2008-05-20 Kou Zhong C Method for detection and quantification of T-cell receptor Vβ repertoire
US20080070303A1 (en) 2005-11-21 2008-03-20 West Michael D Methods to accelerate the isolation of novel cell strains from pluripotent stem cells and cells obtained thereby
US7636465B2 (en) 2005-12-09 2009-12-22 Cytyc Corporation Cross-frame object reconstruction for image-based cytology applications
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
WO2007087310A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Nucleic acid analysis using sequence tokens
US20080038727A1 (en) 2006-03-10 2008-02-14 Applera Corporation MicroRNA and Messenger RNA Detection on Arrays
US7880142B2 (en) 2006-04-04 2011-02-01 Sidec Technologies Ab Extended electron tomography
US20080194414A1 (en) 2006-04-24 2008-08-14 Albert Thomas J Enrichment and sequence analysis of genomic regions
WO2007136874A2 (en) 2006-05-18 2007-11-29 President And Fellows Of Harvard College Genomic library construction
EP4108780A1 (en) 2006-06-14 2022-12-28 Verinata Health, Inc. Rare cell analysis using sample splitting and dna tags
DK2518162T3 (en) 2006-11-15 2018-06-18 Biospherex Llc Multi-tag sequencing and ecogenomic analysis
US8050476B2 (en) 2006-11-22 2011-11-01 General Electric Company Heart rate demodulation of periodic movement in ultrasound data for object identification
CA2672315A1 (en) 2006-12-14 2008-06-26 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
WO2008087869A1 (ja) 2007-01-16 2008-07-24 Olympus Corporation 蛍光信号解析装置および蛍光信号解析方法
WO2008109207A2 (en) 2007-01-30 2008-09-12 The Regents Of The University Of California Methods and devices for biomolecular arrays
US20080269068A1 (en) 2007-02-06 2008-10-30 President And Fellows Of Harvard College Multiplex decoding of sequence tags in barcodes
WO2008096318A2 (en) 2007-02-09 2008-08-14 Koninklijke Philips Electronics N.V. Identification system
KR100882711B1 (ko) 2007-03-12 2009-02-06 성균관대학교산학협력단 사이크로박터 스피시스 hj147 균주 유래의 우라실-dna글리코실라제 및 이의 용도
US20080274458A1 (en) 2007-05-01 2008-11-06 Latham Gary J Nucleic acid quantitation methods
US20090061513A1 (en) 2007-05-15 2009-03-05 Picovitro Ab Cell sorting and cell cultivation methods
JP2010528608A (ja) 2007-06-01 2010-08-26 454 ライフ サイエンシーズ コーポレイション 複合的な混合物から個々の試料を特定するためのシステムおよび方法
WO2009031054A2 (en) 2007-06-29 2009-03-12 Population Genetics Technologies Ltd. Methods and compositions for isolating nucleic acid sequence variants
WO2009105670A2 (en) 2008-02-21 2009-08-27 Gentel Biosciences, Inc. Substrates for multiplexed assays and uses thereof
US8687189B2 (en) 2008-03-03 2014-04-01 Ajjer, Llc Analysis of arrays by laser induced breakdown spectroscopy
US20090298709A1 (en) 2008-05-28 2009-12-03 Affymetrix, Inc. Assays for determining telomere length and repeated sequence copy number
DE102008025656B4 (de) 2008-05-28 2016-07-28 Genxpro Gmbh Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
US20100120097A1 (en) 2008-05-30 2010-05-13 Board Of Regents, The University Of Texas System Methods and compositions for nucleic acid sequencing
US20100069250A1 (en) 2008-08-16 2010-03-18 The Board Of Trustees Of The Leland Stanford Junior University Digital PCR Calibration for High Throughput Sequencing
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US20100159533A1 (en) * 2008-11-24 2010-06-24 Helicos Biosciences Corporation Simplified sample preparation for rna analysis
US8492096B2 (en) 2008-12-24 2013-07-23 Boris Pasche TGFBR1 expression modifies risk for colorectal cancer
KR20110138340A (ko) 2009-01-20 2011-12-27 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 약물 타겟을 진단, 예후 예측 및 동정하기 위한 단일 세포 유전자 발현
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
BRPI1006113A2 (pt) 2009-03-05 2016-02-16 Daiichi Sankyo Co Ltd "derivado de piridina".
EP2230312A1 (en) 2009-03-19 2010-09-22 Helmholtz-Zentrum für Infektionsforschung GmbH Probe compound for detecting and isolating enzymes and means and methods using the same
EP3002337B1 (en) 2009-03-30 2018-10-24 Illumina, Inc. Gene expression analysis in single cells
CN102439177B (zh) 2009-04-02 2014-10-01 弗卢伊蒂格姆公司 用于对目标核酸进行条形码化的多引物扩增方法
WO2010127186A1 (en) 2009-04-30 2010-11-04 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
FR2945545B1 (fr) 2009-05-14 2011-08-05 Univ Aix Marseille Ii Methode de detection d'adn procaryote extrait d'un echantillon de selles
GB0909923D0 (en) 2009-06-09 2009-07-22 Oxford Gene Tech Ip Ltd Picowell capture devices for analysing single cells or other particles
WO2011008530A2 (en) 2009-06-29 2011-01-20 Luminex Corporation Chimeric primers with hairpin conformations and methods of using same
US8330957B2 (en) 2009-06-29 2012-12-11 Hager Enviromental and Atmospheric Technologies, LLC Device and method for quantification of gases in plumes by remote sensing
WO2011021102A2 (en) 2009-08-20 2011-02-24 Population Genetics Technologies Ltd Compositions and methods for intramolecular nucleic acid rearrangement
US8936762B2 (en) 2009-09-01 2015-01-20 Trustees Of Boston University High throughput multichannel reader and uses thereof
RU2552215C2 (ru) 2009-09-01 2015-06-10 Конинклейке Филипс Электроникс Н.В. Устройство и способ отбора нуклеиновых кислот с помощью микроматриц
US9625454B2 (en) 2009-09-04 2017-04-18 The Research Foundation For The State University Of New York Rapid and continuous analyte processing in droplet microfluidic devices
US9488656B2 (en) 2009-09-30 2016-11-08 Quest Diagnostics Investments Incorporated BCR-ABL truncation mutations
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US20110245085A1 (en) 2010-01-19 2011-10-06 Rava Richard P Methods for determining copy number variations
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
EP2534267B1 (en) 2010-02-12 2018-04-11 Raindance Technologies, Inc. Digital analyte analysis
JP5901046B2 (ja) 2010-02-19 2016-04-06 国立大学法人 千葉大学 OATP1B3mRNAの新規な選択的スプライシングバリアント
WO2011123246A2 (en) 2010-04-01 2011-10-06 Illumina, Inc. Solid-phase clonal amplification and related methods
WO2011143659A2 (en) 2010-05-14 2011-11-17 Fluidigm Corporation Nucleic acid isolation methods
US8828688B2 (en) 2010-05-27 2014-09-09 Affymetrix, Inc. Multiplex amplification methods
US9080210B2 (en) 2010-06-09 2015-07-14 Keygene N.V. High throughput screening using combinatorial sequence barcodes
EP2407242A1 (en) 2010-07-13 2012-01-18 Dublin City University Direct clone analysis and selection technology
US20120040843A1 (en) 2010-08-12 2012-02-16 Dublin City University Centrifugal capture system
EP2623613B8 (en) 2010-09-21 2016-09-07 Population Genetics Technologies Ltd. Increasing confidence of allele calls with molecular counting
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
CA2814049C (en) 2010-10-08 2021-07-13 President And Fellows Of Harvard College High-throughput single cell barcoding
US20120088691A1 (en) 2010-10-08 2012-04-12 Gao Chen Highly multiplexed real-time pcr using encoded microbeads
EP3461914A1 (en) * 2010-10-22 2019-04-03 Cold Spring Harbor Laboratory Varietal counting of nucleic acids for obtaining genomic copy number information
US20130225623A1 (en) 2010-10-27 2013-08-29 Mount Sinai School Of Medicine Methods of Treating Psychiatric or Neurological Disorders with MGLUR Antagonists
US9970874B2 (en) 2010-11-29 2018-05-15 Dako Denmark A/S Methods and systems for analyzing images of specimens processed by a programmable quantitative assay
WO2012078863A2 (en) 2010-12-09 2012-06-14 Akonni Biosystems Sample analysis system
DK2652155T3 (en) 2010-12-16 2017-02-13 Gigagen Inc Methods for Massive Parallel Analysis of Nucleic Acids in Single Cells
WO2012092515A2 (en) 2010-12-30 2012-07-05 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
US20120190020A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
US9365897B2 (en) 2011-02-08 2016-06-14 Illumina, Inc. Selective enrichment of nucleic acids
US9150852B2 (en) 2011-02-18 2015-10-06 Raindance Technologies, Inc. Compositions and methods for molecular labeling
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
KR20120110431A (ko) 2011-03-29 2012-10-10 에스케이하이닉스 주식회사 반도체 메모리 장치
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
EP3907299A1 (en) 2011-04-15 2021-11-10 The Johns Hopkins University Safe sequencing system
JP2014512826A (ja) 2011-04-25 2014-05-29 バイオ−ラド ラボラトリーズ インコーポレイテッド 核酸分析のための方法および組成物
SG10201605049QA (en) 2011-05-20 2016-07-28 Fluidigm Corp Nucleic acid encoding reactions
AU2012261237B2 (en) 2011-05-24 2017-06-01 BioNTech SE Individualized vaccines for cancer
US9518292B2 (en) 2011-05-26 2016-12-13 Brandeis University Methods for suppression PCR
US8841071B2 (en) 2011-06-02 2014-09-23 Raindance Technologies, Inc. Sample multiplexing
US9752176B2 (en) 2011-06-15 2017-09-05 Ginkgo Bioworks, Inc. Methods for preparative in vitro cloning
US20140147860A1 (en) 2011-06-27 2014-05-29 Life Technologies Corporation Acoustic Cytometry Methods and Protocols
KR101454886B1 (ko) 2011-08-01 2014-11-03 주식회사 셀레믹스 핵산분자의 제조방법
KR101337094B1 (ko) 2011-11-30 2013-12-05 삼성에스디에스 주식회사 염기 서열 정렬 장치 및 그 방법
WO2013117595A2 (en) 2012-02-07 2013-08-15 Illumina Cambridge Limited Targeted enrichment and amplification of nucleic acids on a support
WO2013120089A1 (en) 2012-02-10 2013-08-15 Raindance Technologies, Inc. Molecular diagnostic screening assay
US9176031B2 (en) 2012-02-24 2015-11-03 Raindance Technologies, Inc. Labeling and sample preparation for sequencing
ES2663234T3 (es) 2012-02-27 2018-04-11 Cellular Research, Inc Composiciones y kits para recuento molecular
EP2820174B1 (en) 2012-02-27 2019-12-25 The University of North Carolina at Chapel Hill Methods and uses for molecular tags
SG10201507700VA (en) * 2012-05-08 2015-10-29 Adaptive Biotechnologies Corp Compositions and method for measuring and calibrating amplification bias in multiplexed pcr reactions
EP2850211B1 (en) 2012-05-14 2021-09-08 iRepertoire, Inc. Method for increasing accuracy in quantitative detection of polynucleotides
SG11201407901PA (en) 2012-05-21 2015-01-29 Fluidigm Corp Single-particle analysis of particle populations
CN108587867B (zh) 2012-05-25 2021-12-17 北卡罗来纳-查佩尔山大学 微流体装置、用于试剂的固体支持体和相关方法
CA2875695C (en) 2012-06-15 2022-11-15 The Board Of Regents Of The University Of Texas System High throughput sequencing of multiple transcripts of a single cell
EP2861761A1 (en) 2012-06-15 2015-04-22 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
CA2877094A1 (en) 2012-06-18 2013-12-27 Nugen Technologies, Inc. Compositions and methods for negative selection of non-desired nucleic acid sequences
CN108456717A (zh) 2012-07-17 2018-08-28 考希尔股份有限公司 检测遗传变异的系统和方法
US9695416B2 (en) 2012-07-18 2017-07-04 Siemens Healthcare Diagnostics Inc. Method of normalizing biological samples
WO2014018460A1 (en) 2012-07-24 2014-01-30 Sequenta, Inc. Single cell analysis using sequence tags
US20140378345A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
US20140378322A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2881685C (en) 2012-08-14 2023-12-05 10X Genomics, Inc. Microcapsule compositions and methods
US20150005200A1 (en) 2012-08-14 2015-01-01 10X Technologies, Inc. Compositions and methods for sample processing
US20150005199A1 (en) 2012-08-14 2015-01-01 10X Technologies, Inc. Compositions and methods for sample processing
US20140378349A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
CN107090491A (zh) 2012-11-05 2017-08-25 鲁比康基因组学公司 条形编码核酸
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2014108850A2 (en) 2013-01-09 2014-07-17 Yeda Research And Development Co. Ltd. High throughput transcriptome analysis
WO2014116729A2 (en) 2013-01-22 2014-07-31 The Board Of Trustees Of The Leland Stanford Junior University Haplotying of hla loci with ultra-deep shotgun sequencing
WO2014116979A1 (en) 2013-01-24 2014-07-31 Sabic Innovative Plastics Ip B.V. Microwell plate made from a polyester-polycarbonate
ES2931314T3 (es) 2013-02-01 2022-12-28 Becton Dickinson Co Métodos y sistemas para evaluar el comportamiento de una muestra en un citómetro de flujo
EP2954065B1 (en) 2013-02-08 2021-07-28 10X Genomics, Inc. Partitioning and processing of analytes and other species
WO2014126937A1 (en) 2013-02-14 2014-08-21 The Board Of Trustees Of The Leland Stanford Junior University Suspension arrays and multiplexed assays based thereon
US20140274811A1 (en) 2013-03-14 2014-09-18 Lyle J. Arnold Methods for Amplifying a Complete Genome or Transcriptome
CA2906076A1 (en) 2013-03-15 2014-09-18 Abvitro, Inc. Single cell bar-coding for antibody discovery
WO2014145992A1 (en) * 2013-03-15 2014-09-18 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
WO2014165762A1 (en) 2013-04-05 2014-10-09 Raindance Technologies, Inc. Rare cell analysis after negative selection
EP2805769A1 (en) 2013-05-24 2014-11-26 European Molecular Biology Laboratory Methods for nano-scale single cell analysis
US20160122753A1 (en) 2013-06-12 2016-05-05 Tarjei Mikkelsen High-throughput rna-seq
MX361481B (es) 2013-06-27 2018-12-06 10X Genomics Inc Composiciones y metodos para procesamiento de muestras.
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
US10395758B2 (en) 2013-08-30 2019-08-27 10X Genomics, Inc. Sequencing methods
EP3041957A4 (en) 2013-09-04 2017-03-29 Fluidigm Corporation Proximity assays for detecting nucleic acids and proteins in a single cell
GB201317301D0 (en) 2013-09-30 2013-11-13 Linnarsson Sten Method for capturing and encoding nucleic acid from a plurality of single cells
US10633691B2 (en) 2013-09-30 2020-04-28 Di Wu Methods to profile molecular complexes or single cells via proximity dependant barcoding
JP2017504307A (ja) 2013-10-07 2017-02-09 セルラー リサーチ, インコーポレイテッド アレイ上のフィーチャーをデジタルカウントするための方法およびシステム
SG10201807112XA (en) 2013-12-30 2018-09-27 Atreca Inc Analysis of nucleic acids associated with single cells using nucleic acid barcodes
AU2015227054A1 (en) * 2014-03-05 2016-09-22 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US20150298091A1 (en) 2014-04-21 2015-10-22 President And Fellows Of Harvard College Systems and methods for barcoding nucleic acids
CN106795553B (zh) 2014-06-26 2021-06-04 10X基因组学有限公司 分析来自单个细胞或细胞群体的核酸的方法
CN106536756A (zh) 2014-06-26 2017-03-22 10X基因组学有限公司 核酸序列的分析
US20160289669A1 (en) 2015-01-22 2016-10-06 Becton, Dickinson And Company Devices and systems for molecular barcoding of nucleic acid targets in single cells
US10697010B2 (en) 2015-02-19 2020-06-30 Becton, Dickinson And Company High-throughput single-cell analysis combining proteomic and genomic information
WO2016138500A1 (en) * 2015-02-27 2016-09-01 Cellular Research, Inc. Methods and compositions for barcoding nucleic acids for sequencing
WO2016138496A1 (en) 2015-02-27 2016-09-01 Cellular Research, Inc. Spatially addressable molecular barcoding
WO2016160844A2 (en) 2015-03-30 2016-10-06 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
WO2016172373A1 (en) 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US9618871B2 (en) 2015-04-28 2017-04-11 Kyocera Document Solutions Inc. Image forming apparatus
ES2745694T3 (es) 2015-09-11 2020-03-03 Cellular Res Inc Métodos y composiciones para normalización de biblioteca de ácido nucleico
US11397882B2 (en) 2016-05-26 2022-07-26 Becton, Dickinson And Company Molecular label counting adjustment methods
TWI600309B (zh) 2016-05-28 2017-09-21 Hon Hai Prec Ind Co Ltd 角度調整機構
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US20180037942A1 (en) 2016-08-03 2018-02-08 Cellular Research, Inc. Enzyme-independent molecular indexing
EP3541973B1 (en) * 2016-11-18 2024-03-27 Twist Bioscience Corporation Polynucleotide libraries having controlled stoichiometry and synthesis thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004526433A (ja) 2001-01-25 2004-09-02 ティーエム バイオサイエンス コーポレイション 標識および標識補体として使用するためのポリヌクレオチド、製品、ならびにその使用方法
JP2008538505A (ja) 2005-04-21 2008-10-30 アイシス ファーマシューティカルズ インコーポレイティッド 細菌の同定に用いる組成物
WO2015031691A1 (en) 2013-08-28 2015-03-05 Cellular Research, Inc. Massively parallel single cell analysis

Also Published As

Publication number Publication date
EP3452614B1 (en) 2023-06-28
CA3019589A1 (en) 2017-11-09
US10822643B2 (en) 2020-11-03
AU2023202747A1 (en) 2023-05-25
AU2017261189B2 (en) 2023-02-09
EP4269616A2 (en) 2023-11-01
JP2019520046A (ja) 2019-07-18
US20170314067A1 (en) 2017-11-02
JP2022153390A (ja) 2022-10-12
WO2017192387A1 (en) 2017-11-09
EP4269616A3 (en) 2024-02-14
EP3452614A1 (en) 2019-03-13
AU2017261189A1 (en) 2018-10-11
CN109072288A (zh) 2018-12-21
ES2956757T3 (es) 2023-12-27

Similar Documents

Publication Publication Date Title
JP7129343B2 (ja) 正確な分子バーコーディング
US11639517B2 (en) Determining 5′ transcript sequences
EP4158055B1 (en) Oligonucleotides and beads for 5 prime gene expression assay
EP4055160B1 (en) Using random priming to obtain full-length v(d)j information for immune repertoire sequencing
US11661625B2 (en) Primers for immune repertoire profiling
US20200263169A1 (en) Hybrid targeted and whole transcriptome amplification
US20220010361A1 (en) TARGET ENRICHMENT USING NUCLEIC ACID PROBES FOR scRNAseq
EP4179110A1 (en) Cdna spike-in control for single cell analysis
JP2018530998A6 (ja) ライブラリー正規化のための方法および組成物
JP2018530998A (ja) ライブラリー正規化のための方法および組成物
JP2005536193A (ja) 少量のポリヌクレオチドを濃縮する方法
EP3902922A1 (en) Method and kit for preparing complementary dna
US9970048B2 (en) Oligonucleotides and methods for the preparation of RNA libraries
JP2018527928A (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
WO2020167830A1 (en) Determining expressions of transcript variants and polyadenylation sites
JP2021514651A (ja) 単一分子配列決定のための一本鎖環状dna鋳型の作成
WO2020118200A1 (en) Methods for preparing cdna samples for rna sequencing, and cdna samples and uses thereof
EP4256077A1 (en) Whole transcriptome analysis in single cells

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181225

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190926

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20191002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200424

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200903

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20200903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210520

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211020

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20211020

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20211215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20211215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220630

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220630

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220706

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220822

R150 Certificate of patent or registration of utility model

Ref document number: 7129343

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150