JP2017526353A - 標的化されたシークエンシングからのデジタル測定値 - Google Patents

標的化されたシークエンシングからのデジタル測定値 Download PDF

Info

Publication number
JP2017526353A
JP2017526353A JP2017506386A JP2017506386A JP2017526353A JP 2017526353 A JP2017526353 A JP 2017526353A JP 2017506386 A JP2017506386 A JP 2017506386A JP 2017506386 A JP2017506386 A JP 2017506386A JP 2017526353 A JP2017526353 A JP 2017526353A
Authority
JP
Japan
Prior art keywords
probe
sequence
nucleic acid
adapter
specific nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017506386A
Other languages
English (en)
Other versions
JP2017526353A5 (ja
JP6803327B2 (ja
Inventor
ジョナサン スコルニック,
ジョナサン スコルニック,
ベンジャミン シュローダー,
ベンジャミン シュローダー,
ダグラス アモアズ,
ダグラス アモアズ,
ステファニー シー. ウェルガ,
ステファニー シー. ウェルガ,
Original Assignee
ニューゲン テクノロジーズ, インコーポレイテッド
ニューゲン テクノロジーズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ニューゲン テクノロジーズ, インコーポレイテッド, ニューゲン テクノロジーズ, インコーポレイテッド filed Critical ニューゲン テクノロジーズ, インコーポレイテッド
Publication of JP2017526353A publication Critical patent/JP2017526353A/ja
Publication of JP2017526353A5 publication Critical patent/JP2017526353A5/ja
Application granted granted Critical
Publication of JP6803327B2 publication Critical patent/JP6803327B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本明細書では、複数の核酸内の、1種または複数の特定核酸を定量化するための方法、組成物、およびキットが開示される。一部の実施形態では、シークエンシングライブラリーを、特定核酸に特異的な、濃縮されたプローブ伸長産物から構築し、シークエンシングする。一部の実施形態では、結果として得られるリードを、重複リードを除去するために使用する。一部の実施形態では、検証されたプローブの計数を使用して、出発核酸試料中の特定核酸分子の数を定量化または決定する。

Description

発明の分野
本教示は、遺伝子発現およびコピー数変異についてのデジタル測定値をもたらす標的化核酸シークエンシングの使用に関する。
関連出願への相互参照
この出願は、2014年8月6日に出願された米国仮出願第62/034,043号(これは、全ての目的のためにその全体が参考として本明細書に援用される)の利益を主張する。
特定核酸についてのデジタル計数をもたらす分子的方法は、研究および臨床のコミュニティにとって関心の対象である。これらの方法を使用して、遺伝子発現(デジタル遺伝子発現もしくはDGE)またはコピー数変異(CNV)を直接測定することができる。デジタルリードアウトにより得ることができる、高精度の測定値は、マイクロアレイ技術と比較して、データに高度な信頼性をもたらし、研究者が、試料の間のわずかな差違を同定したり、同様に、腫瘍生検材料中など、細胞のサブセット内の差違を同定したりすることを可能とするほか、細胞間の変動を決定することも可能とする。
しかし、特化した装置を伴わずに、目的のトランスクリプトーム領域およびゲノム領域についてのハイスループットの解析を可能とする、選択的な標的の定量化のための異なる方法が、依然として必要とされている。本明細書で開示される方法、組成物、およびキットは、これらの必要を満たし、関連する利点をもたらす。
一態様では、複数の核酸内の、複数の特定核酸を定量化するための方法であって、a.複数のプローブ伸長産物のシークエンシングライブラリーを生成するステップであって、特定核酸配列内のプローブ標的領域と相補的であり、これとハイブリダイズするプローブを伸長させることにより、各プローブ伸長産物を導出しうるステップと;b.複数のプローブ伸長産物を含むライブラリーをシークエンシングして、複数のプローブ伸長産物の配列データを生成するステップと;c.アラインさせた配列の各々を、計数するステップであって、アラインメントの数が、複数の核酸内の、対応する特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、組成物中の複数の特定核酸分子を定量化するための方法であって、a.複数のプローブ伸長産物を生成するステップであって、各プローブ伸長産物が、特定核酸分子内のプローブ標的領域と相補的なプローブ配列を含む、ステップと;b.複数のプローブ伸長産物をシークエンシングして、複数のプローブ伸長産物の各々の配列を生成するステップと;c.複数のプローブ伸長産物の各々の配列を、基準配列データベースに対してアラインさせるステップであって、基準配列データベースが、プローブ配列を含む、ステップと;d.基準配列データベース内の配列との、各プローブ伸長産物の配列についてのアラインメントの数を決定するステップであって、アラインメントの数が、プローブ伸長産物のプローブが相補的である特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、複数の核酸内の、複数の特定核酸を定量化するための方法であって、a.複数のプローブ伸長産物のシークエンシングライブラリーを生成するステップであって、各プローブ伸長産物が、各プローブ伸長産物の5’末端に付着した、第1のアダプターを含み、特定核酸配列内のプローブ標的領域と相補的であり、これとハイブリダイズするプローブを伸長させることにより、各プローブ伸長産物を導出しうるステップと;b.ライブラリーをシークエンシングして、複数のプローブ伸長産物の配列データを生成するステップと;c.配列データ内のプローブ配列の存在を同定し、複数のプローブ伸長産物内の各プローブ配列を計数するステップであって、計数されたプローブの数が、複数の核酸内の、複数の特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、複数の特定核酸分子を定量化するための方法であって、a.複数のプローブ伸長産物を生成するステップであって、各プローブ伸長産物が、(i)第1のアダプターと、(ii)特定核酸分子内のプローブ標的領域と相補的なプローブ配列とを含む、ステップと;b.複数のプローブ伸長産物をシークエンシングして、複数のプローブ伸長産物の各々についての配列を含む配列データを生成するステップと;c.配列データ内の、各プローブ伸長産物のプローブ配列の存在を同定するステップと;d.複数のプローブ伸長産物内の、プローブ配列の各々の数を決定するステップであって、プローブ配列の各々の数が、プローブ配列の各々が相補的である複数の特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、複数の核酸内の、複数の特定核酸を定量化するための方法であって、a.複数の核酸の5’末端に、第1のアダプター配列を追加するステップと;b.複数のプローブをハイブリダイズさせるステップであって、各プローブが、複数の特定核酸内の一特定核酸内のプローブ標的領域と相補的である、ステップと;c.各プローブを、追加された第1のアダプター配列へと伸長させて、第1のアダプター配列および第2のアダプター配列を有する、複数のプローブ伸長産物を生成するステップと;d.複数のプローブ伸長産物を含むシークエンシングライブラリーを生成するステップと;e.ライブラリーをシークエンシングするステップであって、複数のプローブ伸長産物の各々についての配列データを得るステップと;f.複数のプローブ伸長産物の各々についての配列データを、プローブデータベースの基準コピー内の所定の配列に対してアラインさせるステップであって、前記所定の配列が、各プローブに特異的である、ステップと;g.その所定の配列に対してアラインさせた各プローブ配列を計数するステップであって、その特定核酸に特異的な各プローブについての計数の数が、複数の核酸内の、複数の特定核酸内の、特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、複数の核酸分子内の、複数の特定核酸分子を定量化するための方法であって、a.複数の核酸分子の各々の5’末端へと、第1のアダプター配列を追加するステップと;b.複数のプローブを、複数の特定核酸分子とハイブリダイズさせるステップであって、各プローブが、特定核酸分子内のプローブ標的領域と相補的である、ステップと;c.各プローブを、追加された第1のアダプター配列へと伸長させて、第1のアダプター配列および第2のアダプター配列を有する複数のプローブ伸長産物を生成して、複数のプローブ伸長産物を産生するステップと;d.複数のプローブ伸長産物をシークエンシングして、複数のプローブ伸長産物の各々についての配列データを生成するステップと;e.複数のプローブ伸長産物の各々の配列を、プローブデータベースの基準コピー内の所定の配列に対してアラインさせるステップであって、前記所定の配列が、各プローブに特異的である、ステップと;f.その所定の配列に対してアラインさせた各プローブ配列の数を決定するステップであって、数が、プローブが相補的である特定核酸分子の量を指し示すステップとを含む方法が開示される。
一態様では、複数の核酸内の、複数の特定核酸を定量化するための方法であって、a.複数のハイブリダイズさせたプローブを伸長させるステップであって、各プローブが複数の特定核酸内の一特定核酸内のプローブ標的領域と相補的であり、各プローブが5’の第1のアダプターを有する、ステップと;b.第2のアダプター配列を、複数のプローブ伸長産物の二本鎖末端へと追加して、シークエンシングライブラリーを生成するステップと;c.ライブラリーをシークエンシングするステップであって、複数のプローブ伸長産物の各々についての配列データを得ることができるステップと;d.各プローブ標的領域に対応する各プローブ配列を計数するステップであって、その特定核酸に特異的な各プローブについての計数の数が、複数の核酸内の、複数の特定核酸内の、特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、複数の特定核酸分子を定量化するための方法であって、a.各プローブが複数の特定核酸分子内の一特定核酸分子内のプローブ標的領域とハイブリダイズし、各プローブがその5’末端において第1のアダプターを有する複数のプローブを伸長させて、複数の伸長産物を生成するステップと;b.第2のアダプターを、複数のプローブ伸長産物の二本鎖末端へと追加するステップと;c.複数のプローブ伸長産物をシークエンシングして、プローブ伸長産物の各々の配列データを生成するステップと;d.プローブ標的領域とハイブリダイズした各プローブの数を決定するステップであって、数が、プローブ標的領域を含む、特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、複数の核酸内の、複数の特定核酸を定量化するための方法であって、a.複数のプローブをハイブリダイズさせるステップであって、各プローブが、複数の特定核酸内の一特定核酸内のプローブ標的領域と相補的であり、各プローブが、5’の第1のアダプターを有する、ステップと;b.各プローブを伸長させて、第1のアダプター配列を有する、複数のプローブ伸長産物を生成するステップと;c.第2のアダプター配列を、複数のプローブ伸長産物の二本鎖末端へと追加するステップと;d.複数のプローブ伸長産物を含むシークエンシングライブラリーを生成するステップと;e.ライブラリーをシークエンシングするステップであって、複数のプローブ伸長産物の各々についての配列データを得ることができるステップと;f.複数のプローブ伸長産物の各々についての配列データを、プローブデータベース内の所定の配列に対してアラインさせるステップであって、前記所定の配列が、各プローブに特異的である、ステップと;g.プローブ標的領域に対してアラインさせた各プローブ配列を計数するステップであって、その特定核酸に特異的な各プローブについての計数の数が、複数の核酸内の、複数の特定核酸内の、特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一態様では、組成物中の複数の特定核酸分子を定量化するための方法であって、a.複数のプローブを、特定核酸分子内のプローブ標的領域とハイブリダイズさせるステップであって、各プローブが、その5’末端に、第1のアダプターを有する、ステップと;b.各プローブを伸長させて、第1のアダプター配列を含む複数のプローブ伸長産物を生成するステップと;c.第2のアダプター配列を、複数のプローブ伸長産物の二本鎖末端へと追加するステップと;d.複数のプローブ伸長産物をシークエンシングして、複数のプローブ伸長産物の各々の配列を生成するステップと;e.複数のプローブ伸長産物の各々の配列を、プローブデータベース内の所定の配列に対してアラインさせるステップであって、前記プローブデータベースが、複数の所定の配列を含み、各所定の配列が、プローブに特異的である、ステップと;f.各プローブ伸長産物の配列について、シークエンシングデータベース内の所定の配列に対してアラインメントの数を決定するステップであって、アラインメントの数が、プローブがハイブリダイズする、特定核酸分子の各々の量を指し示すステップとを含む方法が開示される。
一部の実施形態では、配列データ、またはシークエンシングされた複数のプローブ伸長産物は、フォワードリード、インデックスリード、およびリバースリードのうちの少なくとも1つを含む。一部の実施形態では、リバースリードは、プローブ標的領域を含む。一部の実施形態では、各プローブがそのそれぞれの特定核酸内のそのそれぞれのプローブ標的領域配列へとアニールした特異性を検証することができる。一部の実施形態では、配列データ、もしくはシークエンシングされた複数のプローブ伸長産物を、ゲノムデータベースもしくはトランスクリプトームデータベースの座標へとマッピングすることができ、かつ/または配列データ、もしくはシークエンシングされた複数のプローブ伸長産物を、プローブデータベースの基準コピーに対してアラインさせて、意図されるプローブのアニーリングおよび伸長を検証することができる。一部の実施形態では、配列データ、またはシークエンシングされた複数のプローブ伸長産物を、ゲノムデータベースまたはトランスクリプトームデータベースの座標へとマッピングすることができる。一部の実施形態では、リバースリードまたはフォワードリードは、プローブ標的領域を含む。一部の実施形態では、フォワードリードおよびリバースリードの配列データ、またはシークエンシングされた複数のプローブ伸長産物を、複数の特定核酸についてマッピングすることができ、インデックスリードの配列データ、またはシークエンシングされた複数のプローブ伸長産物により、バーコード配列およびn−ランダム配列のうちの少なくとも1つを同定することができる。一部の実施形態では、フォワードリードのマッピング座標と、インデックスリードのn−ランダム塩基との組み合わせにより、各プローブ伸長産物についてのPCR重複を決定し、同じフォワードリード座標および同じn−ランダム塩基配列を有する配列を、重複として同定し、単一の特定核酸分子として一括し、計数することができ、この場合、フォワードリード座標は同じであるが、n−ランダム塩基配列は異なる配列の各々を、別々の特定核酸分子として計数することができる。
一部の実施形態では、フォワードリードと、対応するリバースリードとを、ペアエンドでアラインさせることができる。一部の実施形態では、重複の一括に続き、各プローブ配列について計数されるリバースリードまたはフォワードリードの数により、複数の特定核酸内の、各出発特定核酸分子についての分子の数を表す値を生成する。一部の実施形態では、ゲノムは、哺乳動物、細菌、ウイルス、リケッチア、または植物のゲノムまたはトランスクリプトームからなる群より選択される。一部の実施形態では、第1のアダプターを追加する前に、複数の特定核酸に末端修復を施す。一部の実施形態では、末端修復は、平滑末端修復である。一部の実施形態では、プローブは、DNAポリメラーゼ、RNAポリメラーゼ、または逆転写酵素からなる群より選択されるポリメラーゼにより伸長させることができる。
一部の実施形態では、シークエンシングライブラリーを生成する前に、複数のプローブ伸長産物を増幅しうるか、または任意選択でこれを増幅する。一部の実施形態では、第2のアダプターを付加する前に、プローブ伸長産物を、制限エンドヌクレアーゼで処理するか、またはこれに平滑末端修復/末端修復を施すことができる。一部の実施形態では、プローブ伸長産物の伸長は、第1のアダプターの付加をさらに含む。一部の実施形態では、プローブ伸長産物の増幅は、増幅産物の各末端へのフローセル配列の付着をさらに含む。一部の実施形態では、制限エンドヌクレアーゼで処理されたプローブ伸長産物により、共通の末端を伴うフォワードリードをもたらす。一部の実施形態では、配列データ、またはシークエンシングされた複数のプローブ伸長産物を、ゲノムまたはトランスクリプトームの座標へとマッピングして、意図されるプローブのアニーリングおよび伸長を検証することができる。一部の実施形態では、配列データ、またはシークエンシングされた複数のプローブ伸長産物を、プローブデータベースの基準コピーに対してアラインさせて、意図されるプローブのアニーリングを検証することができる。一部の実施形態では、リバースリード配列またはフォワードリード配列を、それらが、どのプローブ配列を表すのかに従いビニングおよび計数することができ、この場合、各プローブが表される回数は、出発特定核酸分子が、元の試料中に存在する回数についての尺度でありうる。一部の実施形態では、フォワードリードは、特定核酸配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、または少なくとも25塩基を含みうる、特定核酸配列の少なくとも一部を含む。
一部の実施形態では、第1のアダプター配列または第2のアダプター配列は、インデックス配列のプライミング部位、インデックスヌクレオチド配列、n−ランダムヌクレオチド配列、フォワードリードプライミング部位、およびリバースリードプライミング部位、ならびにこれらの組み合わせのうちの少なくとも1つを含む。一部の実施形態では、第2のアダプター配列または第1のアダプター配列は、フォワードリードプライミング部位、リバースリードプライミング部位、およびリンカー配列、ならびにこれらの組み合わせのうちの少なくとも1つを含む。一部の実施形態では、5’の第1のアダプターは、各プローブ伸長産物に共通でありうる。一部の実施形態では、5’テール配列は、第2のアダプター配列を含みうる。一部の実施形態では、プローブ伸長産物の増幅は、増幅産物の各末端へのフローセル配列の付着をもたらす。
一部の実施形態では、インデックスリードは、インデックスヌクレオチド配列およびn−ランダム塩基配列のうちの、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15塩基を含む。一部の実施形態では、インデックスリードは、n−ランダム塩基およびインデックスヌクレオチド配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10塩基を含む。一部の実施形態では、インデックスリードは、n−ランダム塩基および任意選択でインデックスヌクレオチド配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10塩基を含む。一部の実施形態では、n−ランダム塩基のヌクレオチド配列は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ヌクレオチドを含む。一部の実施形態では、インデックスヌクレオチド配列は、バーコード配列をさらに含む。
一部の実施形態では、リバースリードは、プローブ配列および特定核酸配列の一部、ならびにこれらの組み合わせのうちの少なくとも1つを含む。一部の実施形態では、リバースリードは、プローブ配列のうちの、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、または少なくとも60塩基を含む。一部の実施形態では、リバースリードは、プローブ配列に対して3’の特定核酸配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、または少なくとも20塩基を含む。
さらなる態様では、開示される方法により生成および/または増幅されたプローブ伸長産物の組成物が開示される。
なおさらなる態様では、複数の核酸は、組織、臓器、単一の細胞、腫瘍、患者から採取された有機流体(organic fluid)の検体、遊離循環核酸、真菌、原核生物、およびウイルスからなる群より選択される試料に由来しうる。一部の実施形態では、患者は、腫瘍を有することが知られている場合もあり、これを有することが疑われる場合もある。一部の実施形態では、有機流体は、少なくとも1つの循環腫瘍細胞(CTC)または播種性腫瘍細胞(CTD)を含有する。一部の実施形態では、患者は、伝染性感染または伝染性疾患でありうる、ウイルス感染を有することが知られている場合もあり、これを有することが疑われる場合もある。
一部の実施形態では、本開示の組成物は、複数の核酸分子を含む。一部の実施形態では、各プローブ伸長産物は、特定核酸分子内のプローブ標的領域と相補的なプローブの伸長産物である。
なおさらなる態様では、オリゴヌクレオチドアダプター;プローブ標的領域配列の一部と相補的なプローブ;前記アダプター配列と相補的なプライマー;プローブ配列の一部と相補的なプライマー;リガーゼ;ポリメラーゼ;およびキットの使用のための指示のうちの少なくとも1または複数を含む核酸分子のデジタル測定のためのキットが開示される。なおさらなる態様では、核酸分子のデジタル測定のためのキットであって、本開示の1種または複数の態様を含むキットが開示される。
一部の実施形態では、本開示の方法、組成物、およびキットは、Liら、2012年、Bioinformatics、28巻(10号):1307〜1313頁;Bellosら、2014年、Nucleic Acids Res.、42巻(20号):e158頁;Jiangら、2015年、Nucleic Acids Res.、43巻(6号):e39頁;Xiら、2011年、Proc. Natl. Acad. Sci.、108巻(46号):1128〜1136頁;FromerおよびPurcell、2014年、Curr. Protoc. Hum. Genet.、81巻:7.21.1〜7.23.21節;Sathirapongsasutiら、2011年、Bioinformatics、31巻(15号):1〜8頁;Krummら、2012年、Genome Res.、22巻(8号):1525〜1532頁;Plagnolら、2012年、Bioinformatics、28巻(21号):2747〜2754頁において開示されている、1種または複数の態様を含む。
参照による組込み
本明細書で言及される、全ての刊行物、特許、および特許出願は、各個別の刊行物、特許、または特許出願を、参照により組み込むことが、具体的かつ個別に指し示された場合と同じ程度に、参照により本明細書に組み込まれる。
係属中の出願である、USSN13/750,768、USSN14/030,761、USSN61/903,826、およびUSSN61/989,113は、参照によりそれらの全体が本明細書に組み込まれる。
開示される発明の新規の特徴および利点についてのよりよい理解は、開示される発明の原理を利用する、例示的な実施形態について明記する以下の記載と、付属の図面とを参照することにより得ることができる。
図1は、gDNAを使用する本明細書で開示されるライブラリーの生成についての実施形態を例示するフローチャートである。
図2は、cDNAを使用する本明細書で開示されるライブラリーの生成についての実施形態を例示するフローチャートである。
図3は、二本鎖gDNAを使用する本明細書で開示されるライブラリーの生成についての実施形態を例示するフローチャートである。
図4は、二本鎖gDNAを使用する本明細書で開示されるライブラリーの生成についての実施形態を例示するフローチャートである。
図5は、シークエンシングライブラリーと、シークエンシングリードの領域とを構築するための本明細書で開示される実施形態を例示する。
図6は、シークエンシングデータから、重複リードを除去するための本明細書で開示される実施形態を例示する。図6A:フォワードリード、図6B:インデックスリード、図6C:リバースリード。
図7は、シークエンシングされた領域を同定して、配列データを得るための本明細書で開示される実施形態を例示する:図7A:フォワードリード、図7B:インデックスリード、図7C:リバースリード。
図8は、シークエンシングされた領域を同定して、配列データを得るための本明細書で開示される実施形態を例示する:図8A:配列リードを含有するプローブ、図8B:特定核酸についてのシークエンシングリード、図8C:インデックス塩基リードおよびn−ランダム塩基リード、またはこれらの組み合わせのうちの少なくとも1つを含む、インデックス化シークエンシングリード。
図9は、シークエンシングライブラリーの生成および後続のデジタル定量化のための本明細書で開示される実施形態を、図により例示する。
図10は、デジタル定量化のための配列データをシークエンシングおよび解析するNGSのための、シークエンシングライブラリーを使用するための本明細書で開示される実施形態を、図により例示する。
図11は、染色体の順序による、95の遺伝子のパネル内の、RNAレベルにおける遺伝子の存在度についてのプロットを、グラフにより例示する。赤で染色された遺伝子は、顕著に下方調節され、緑で染色された遺伝子は、顕著に上方調節されている。エラーバーは、DNAデータおよびRNAデータの両方における標準偏差を反映する。 図11は、染色体の順序による、95の遺伝子のパネル内の、RNAレベルにおける遺伝子の存在度についてのプロットを、グラフにより例示する。赤で染色された遺伝子は、顕著に下方調節され、緑で染色された遺伝子は、顕著に上方調節されている。エラーバーは、DNAデータおよびRNAデータの両方における標準偏差を反映する。 図11は、染色体の順序による、95の遺伝子のパネル内の、RNAレベルにおける遺伝子の存在度についてのプロットを、グラフにより例示する。赤で染色された遺伝子は、顕著に下方調節され、緑で染色された遺伝子は、顕著に上方調節されている。エラーバーは、DNAデータおよびRNAデータの両方における標準偏差を反映する。
図12は、染色体の順序で分取された509の遺伝子パネル内の全ての遺伝子について測定されたレベルのプロットを、グラフにより例示する。コピー数の変化した遺伝子は、緑で染色される。エラーバーは、試料データセットのプローブ計数と、対照データセットのプローブ計数とを組み合わせた変動を反映する。 図12は、染色体の順序で分取された509の遺伝子パネル内の全ての遺伝子について測定されたレベルのプロットを、グラフにより例示する。コピー数の変化した遺伝子は、緑で染色される。エラーバーは、試料データセットのプローブ計数と、対照データセットのプローブ計数とを組み合わせた変動を反映する。 図12は、染色体の順序で分取された509の遺伝子パネル内の全ての遺伝子について測定されたレベルのプロットを、グラフにより例示する。コピー数の変化した遺伝子は、緑で染色される。エラーバーは、試料データセットのプローブ計数と、対照データセットのプローブ計数とを組み合わせた変動を反映する。
本開示は、デジタル測定値を結果としてもたらす標的化された核酸シークエンシングのための方法について記載する。これらのデジタル測定が有用である場合の例は、デジタル遺伝子発現およびコピー数変異においてである。出発材料は、核酸、DNA、RNA、cDNA、または二本鎖cDNAでありうる。開示される方法、組成物、およびキットは、そのプローブ標的領域とハイブリダイズさせた相補的プローブを利用して、プローブ標的領域に由来するプローブ伸長産物を生成することを記載する。プローブ伸長産物は、ハイスループットシークエンシングを進める、標的の濃縮およびライブラリーの生成のために使用する。シークエンシングデータの解析は、トランスクリプトームの遺伝子発現またはゲノムDNAのコピー数変異のデジタル測定値をもたらす。
標的化プローブを、特定核酸とハイブリダイズさせ、NuGEN Ovation Target Enrichment Kitを使用して、ポリメラーゼにより伸長させる。ペアドエンドシークエンシングを、結果として得られる、濃縮されたライブラリーに対して実施することができる。リードを、ゲノムまたはトランスクリプトームへとマッピングし、PCR重複リードを同定する(特許出願であるUSSN61/903,826において記載されている)。次いで、プローブ配列を、重複を除外した(de−duplicate)配列データセット内でそれらがどのくらいの回数出現するのかを、出発試料中に存在した元の核酸のコピーの数の尺度として計数する。ランダム配列ではなく、プローブ配列の計数を使用することにより、各デジタル測定値について、異なる試料にわたり、正確に同じ配列を評価するため、コピー数解析が簡素化される。これは、代替的エクソン使用に起因して、試料間で変化しうる、遺伝子の長さなどの因子について正規化するのに役立ちうるほか、ゲノムまたはトランスクリプトームへのシークエンシングリードのマッピングに伴う公知の問題も低減する。
開示される発明の方法は、RNA−Seq解析、デジタル遺伝子発現、遺伝子型決定、コピー数変異の決定、および全ゲノム増幅を含むがこれらに限定されない、遺伝子試料解析のための多様な適用と共に使用することができる。
そうでないことが指定されない限りにおいて、生化学、核酸化学、分子生物学、および分子遺伝学の用語および記号は、その分野内の標準的な取り決めおよび教科書、例えば、Sambrookら、Molecular Cloning: A Laboratory Manual、増補2版(Cold Spring Harbor Laboratory、1989年);KornbergおよびBaker、DNA Replication、2版(W.H. Freeman、New York、1992年);Gaits編、Oligonucleotide Synthesis: A Practical Approach(IRL Press、Oxford、1984年);Lehninger、Biochemistry、2版(Worth Publishers、New York、1975年);Eckstein編、Oligonucleotides and Analogs: A Practical Approach(Oxford University Press、New York、1991年)などによる用語および記号に従う。
本明細書および付属の特許請求の範囲で使用される、単数形の「1つの(a)」、「1つの(an)」、および「その(the)」とは、文脈によりそうでないことが明らかに指示されるのでない限りにおいて、複数の指示対象を含む。こうして、例えば、「ポリメラーゼ」に対する言及は、1つの薬剤を指す場合もあり、このような薬剤の混合物を指す場合もあり、「方法」に対する言及は、当業者に公知の同等なステップおよび/または方法などに対する言及を含む。
加えて、理解を容易とするために、本明細書で規定される、多数の用語についても開示する。
本明細書で使用される「アダプター」という用語は、配列が公知のオリゴヌクレオチドであって、目的の特定核酸配列または標的ポリヌクレオチド鎖へのその付着が、目的の特定核酸または標的ポリヌクレオチド鎖の増幅準備のできた産物の生成を可能とするオリゴヌクレオチドを指す場合がある。少なくとも1つのアダプターの付加の前に、特定核酸試料を断片化する場合もあり、断片化しない場合もある。
目的の特定配列領域/鎖の、増幅準備のできた産物の生成に適する、多様なアダプターデザインが想定される。例えば、二本鎖アダプターを使用する場合、アダプターの2つの鎖は、自己相補的な場合もあり、非相補的な場合もあり、部分的に相補的な場合もある。アダプターは、少なくとも部分的なフォワード配列プライミング部位と、ランダム配列とを含有しうる。
一部の実施形態では、アダプターは、さらなる識別子配列、例えば、バーコード配列を含む。本明細書で使用される「バーコード」という用語は、バーコードを会合させたポリヌクレオチドのいくつかの特徴の同定を可能とする、公知の核酸配列を指す場合がある。一部の実施形態では、同定されるポリヌクレオチドの特徴は、ポリヌクレオチドが由来する試料でありうる。バーコードは、例えば、標的ポリヌクレオチドへと接続されると、標的ポリヌクレオチドが由来した試料の識別子として用いられうる核酸配列を含みうる。一部の実施形態では、バーコードは、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、またはこれを超えるヌクレオチドの長さである。一部の実施形態では、バーコードは、10、9、8、7、6、5、または4ヌクレオチドの長さより短い。一部の実施形態では、複数のバーコード中の各バーコードは、少なくとも3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、またはこれを超える位置など、少なくとも3つのヌクレオチド位置において、複数のバーコード中の他のあらゆるバーコードと異なる。一部の実施形態では、いくつかのポリヌクレオチドと会合させたバーコードは、他のポリヌクレオチドと会合させたバーコードと長さが異なる。バーコードは、それらが会合するバーコードに基づき、試料の同定を可能とするのに十分な長さであり、これを可能とするのに十分に異なる配列を含みうる。一部の実施形態では、フォワードアダプターおよびリバースアダプターのいずれも、複数のバーコード配列のうちの少なくとも1つを含みうる。一部の実施形態では、第1のアダプターおよび第2のアダプターは、複数のバーコード配列のうちの少なくとも1つを含む。一部の実施形態では、各リバースアダプターは、複数のバーコード配列のうちの少なくとも1つを含み、この場合、複数のバーコード配列のうちの、各バーコード配列は、複数のバーコード配列中の他のあらゆるバーコード配列と異なる。一部の実施形態では、第1のアダプターおよび第2のアダプターのいずれも、複数のバーコード配列のうちの少なくとも1つを含む。一部の実施形態では、第2のアダプターのオリゴヌクレオチドについてのバーコードを、第1のアダプターのオリゴヌクレオチドについてのバーコードと独立に選択する。一部の実施形態では、対をなすアダプターが、同じであるか、または異なる1種または複数のバーコードを含むように、バーコードを有する、第1のアダプターのオリゴヌクレオチドと、第2のアダプターのオリゴヌクレオチドとを対合させる。一部の実施形態では、本発明の方法は、標的ポリヌクレオチドが接続されるバーコード配列に基づき、標的ポリヌクレオチドが由来しうる試料を同定するステップをさらに含む。バーコードは、例えば、標的ポリヌクレオチドへと接続されると、標的ポリヌクレオチドが由来した試料の識別子として役立つ核酸配列を含みうる。
ライゲーションを利用して、目的の配列領域の所望の末端に、アダプターを追加することは、開示される方法を実行するのに適しうる。核酸、核酸修飾酵素、および結果として得られる、核酸のライゲーション可能な末端の選択に応じて、多様なライゲーションモダリティーが想定される。例えば、目的の標的領域/配列を含む平滑末端産物を生成しうる場合は、平滑末端ライゲーションが適しうる。代替的に、公知の配列特異性を有する制限酵素を使用して、切断を実行し、公知の配列突出を伴う切断部位の生成をもたらしうる場合は、目的の配列領域の切断部位との、アダプターのハイブリダイゼーションと、後続のライゲーションとを可能とするように、アダプターの適切な末端を設計することができる。ライゲーションはまた、問題の核酸の配列を得るように、さらに修飾されうる、単一の核酸配列を結果としてもたらす2つの核酸分子の任意の接続も指す場合がある。アダプターの効率的かつ迅速なライゲーションのための試薬および方法は、市販されており、当技術分野でも公知である。
本明細書で使用される「増幅すること」、「増幅」、および特定核酸を「増幅する」という用語は、目的の核酸試料の複数のコピーを、例えば、DNAコピーの形態で生成する手順を指す場合がある。当技術分野では、例えば、PCRおよびqPCRなど、核酸を増幅する多くの方法およびプロトコールが公知である。
本明細書で使用される「cDNA」という用語は、相補的DNAを指す場合がある。相補的DNAは、酵素である逆転写酵素およびDNAポリメラーゼにより触媒される反応において、メッセンジャーRNA(mRNA)鋳型から合成することができる。
本明細書で使用される「相補的」という用語は、配列の全部に対する相補性を指す場合もあり、配列のうちの一部だけに対する相補性を指す場合もある。特異的オリゴヌクレオチドプライマーまたはプローブの、ハイブリダイズ可能な配列内のヌクレオチドの数は、オリゴヌクレオチドプライマーまたはプローブをハイブリダイズさせるのに使用されるストリンジェンシーの条件により、過剰でランダム非特異的ハイブリダイゼーションが防止されるような数でありうる。オリゴヌクレオチドプライマーまたはプローブのうちの、ハイブリダイズする部分内のヌクレオチドの数は、標的ポリヌクレオチド上の規定された配列であって、オリゴヌクレオチドプライマーまたはプローブがハイブリダイズする配列と少なくとも同じくらいの大きさの数、すなわち、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも約20であることが可能であり、12〜約200ヌクレオチド、通例、約20〜約50ヌクレオチドのうちの、約6〜約10、または6〜約12ヌクレオチドでありうる。標的ポリヌクレオチド/オリゴヌクレオチドは、オリゴヌクレオチドプライマー、プライマー、またはプローブより大型でありうる。
本明細書で使用される「〜を変性させること」という用語は、二本鎖核酸の、一本鎖への分離を指す場合がある。変性は、当技術分野で公知の方法であって、物理的変性、熱的変性、および/または化学的変性を含むがこれらに限定されない方法のうちのいずれかを使用して達成することができる。
本明細書で使用される「FFPE」という頭字語は、ホルマリン固定パラフィン包埋を明示する。FFPEとは、組織試料の保存において使用される方法であって、試料を、パラフィンと称する蝋を適用してカップリングさせたホルマリン溶液中で固定しうる方法である。
本明細書で使用される「ゲノムDNA」という語句は、ゲノムデオキシリボ核酸を、gDNAと略記した、染色体のDNAを指す場合がある。gDNAは、生物の遺伝物質を含む。
本明細書で使用される「ゲノム」という用語は、患者、組織、臓器、単一の細胞、腫瘍、患者から採取された有機流体の検体、遊離循環核酸、真菌、原核生物、およびウイルスに由来する、DNA、RNA、またはcDNAである配列を指す場合がある。本明細書で使用される「トランスクリプトーム」とは、発現される、生物の部分的ゲノムまたは全ゲノムを反映しうる、全てのRNA配列でありうる。
本明細書で使用される「キット」という用語は、材料を送達するための任意のシステムを指す場合がある。反応アッセイの文脈では、このような送達システムは、適切な容器内の、オリゴヌクレオチド、緩衝成分、添加剤、反応増強剤、酵素などの反応成分の、1つの場所から別の場所への保存、輸送、または送達を可能とするエレメントであって、一般に、アッセイを実施するための書面での指示と共に提供されるエレメントを含みうる。キットは、関連する反応試薬と、支持材料とを含有する、1つまたは複数の筐体または箱を含みうる。キットは、2つまたはこれを超える個別の容器を含む場合があり、これらの容器の各々は、全キット成分のうちの一部を含む。容器は、意図されるレシピエントへと、一緒にまたは別個に送達される場合もある。
本明細書で使用される「核酸(NA)修飾酵素」という語句は、DNA特異的修飾酵素を指す場合がある。NA修飾酵素は、二本鎖DNAに対する特異性について選択することができる。酵素は、二重鎖特異的エンドヌクレアーゼ、平滑末端頻発カッター(blunt−end frequent cutter)制限酵素、または他の制限酵素であり得る。平滑末端カッターの例は、DraIまたはSmaIを含みうる。NA修飾酵素は、New England Biolabsにより提供されている酵素でありうる。NA修飾酵素は、ホーミングエンドヌクレアーゼ(ホーミングエンドヌクレアーゼとは、厳密に規定された認識配列を有さないエンドヌクレアーゼでありうる)でありうる。NA修飾酵素は、ニッキングエンドヌクレアーゼ(ニッキングエンドヌクレアーゼとは、二本鎖DNA基質内のDNAの1つの鎖だけを切断しうる、エンドヌクレアーゼでありうる)でありうる。NA修飾酵素は、高忠実度エンドヌクレアーゼ(高忠実度エンドヌクレアーゼとは、エンドヌクレアーゼの野生型バージョンより「スター活性」が小さくなるように操作された、エンドヌクレアーゼでありうる)でありうる。一部の実施形態では、NA修飾酵素は、配列特異的であり、かつ、二重鎖特異的な、DNA修飾酵素でありうる。
本明細書で使用される「核酸断片」および「特定核酸」という語句は、互換的に使用され、本明細書で使用される通り、核酸試料の一部を指す場合がある。インプット試料中の核酸は、断片化された核酸分子の集団へと断片化することもでき、1種または複数の特異的なサイズ範囲のポリヌクレオチドへと断片化することもできる。断片の平均の長さは、約10〜約10,000ヌクレオチド、約50〜約2,000ヌクレオチド、約100〜2,500、10〜1,000、10〜800、10〜500、50〜500、50〜250、または50〜150ヌクレオチドの長さでありうる。断片の平均の長さは、10,000ヌクレオチド未満、5,000ヌクレオチド未満、2,500ヌクレオチド未満、2,000ヌクレオチド未満、1,000ヌクレオチド未満、400ヌクレオチド未満、300ヌクレオチド未満、200ヌクレオチド未満、または150ヌクレオチド未満など、500ヌクレオチド未満でありうる。
本明細書で使用される「特定核酸配列」または「特定配列」という語句は、デジタル測定および/またはデジタル定量化が所望される、目的のポリヌクレオチド配列であって、核酸断片を含むがこれらに限定されない配列でありうる。特定配列は、その実際の配列に関して、公知の場合もあり、公知でない場合もある。本明細書で使用される「鋳型」とは、特定核酸配列を含有するポリヌクレオチドでありうる。「特定配列」、「特定核酸配列」、「特定ヌクレオチド配列」、「目的の領域」、または「目的の配列」という用語、およびこれらの変化形は、互換的に使用される。
本明細書で使用される「適格化核酸」および「標的核酸断片を適格化する」という語句は、i)DNAポリメラーゼに許容可能な鋳型、すなわち、鋳型がDNAポリメラーゼに対する架橋もしくは阻害剤を含有する可能性がない、またはii)定量化、増幅、検出を目的として、断片を修飾しうるように、ポリヌクレオチド配列の5’末端および/もしくは3’末端における、バーコード、アダプター、プライマーと相補的な配列などのうちの少なくとも1つの付着を含むがこれらに限定されない修飾を有する鋳型である、gDNA配列またはRNA配列の断片を指す場合もあり、当業者に公知の他の方法であって、gDNA配列解析およびcDNA配列解析の方法を指す場合もある。阻害剤の存在は、FFPE調製中の固定を経た組織試料から得られたgDNAを使用する結果でありうる。
本明細書で使用される「オリゴヌクレオチド」という用語は、200残基長未満、例えば、15〜100ヌクレオチド長の間のポリヌクレオチド鎖を指す場合があるが、また、より長いポリヌクレオチド鎖も包含しうる。オリゴヌクレオチドは、一本鎖の場合もあり、二本鎖の場合もある。本発明で使用される「オリゴヌクレオチド」という用語は、「プライマー」、「プローブ」、および「アダプター」という用語と互換的に使用することができる。
「PCR」とは、本発明の全ての方法において使用される核酸増幅技術であり、元は、Mullis K.B.ら、米国特許第4,683,195号およびMullis K.B.、米国特許第4,683,202号により発見され、記載された、「ポリメラーゼ連鎖反応」という用語の略号である。一部の実施形態では、PCRは、1つのプライマーの伸長が、次のPCRサイクルにおける別のプライマーのための鋳型をもたらすなど、設計される各鎖について、2つのオリゴヌクレオチドプライマーを用いる。本明細書では、考察されるオリゴヌクレオチドプライマーを識別することを目的として、オリゴヌクレオチドプライマーの対のうちのいずれか1つを、「フォワード」プライマーまたは「リバース」プライマーと名づけることができる。PCRは、(i)二本鎖核酸の鎖を分離する変性ステップに続く、(ii)プライマーを、目的の配列を挟む位置にアニールさせるアニーリングステップと、次いで、(iii)プライマーを、5’から3’の方向で伸長させ、これにより、標的配列と相補的な核酸断片を形成する伸長ステップとの反復(またはサイクル)からなりうる。上記のステップの各々は、自動式サーモサイクラーを使用して、異なる温度で行うことができる。PCRサイクルを、所望される頻度で反復する結果として、その末端が、通例、使用されるプライマーの5’末端により規定される、標的DNA断片の指数関数的蓄積をもたらすことができる。この規則には、本明細書で記載される例外を含む、ある特定の例外も適用されうる。各ステップにおける、特定の温度、インキュベーション時間、およびステップの間の変化の速度は、当業者に周知の多くの因子に依存し、例は、例えば、McPherson M. J.ら(1991年および1995年)など、公表されている多数のプロトコール中に見出すことができる。PCR条件は、広い範囲で変動させうるが、二本鎖標的核酸は、>90℃の温度で変性させることができ、プライマーは、50〜75℃の範囲の温度でアニールさせることができ、伸長は、72〜78℃の範囲で実施することができる。
本明細書で使用される「定量的PCR」または「qPCR」という語句は、試料中の、1種または複数の特定標的配列の存在度を測定するように設計されたPCRを指す場合がある。定量的測定値は、個別にアッセイすることもできるか、または標的核酸と併せてアッセイすることもできる、1種または複数の基準核酸配列を使用して作成することができる。当技術分野では、定量的PCRのための技法が周知であり、参照により本明細書に組み込まれる、以下の文書:Gu Z.ら(2003年)、J. Clin. Microbiol.、41巻:4636〜4641頁;Becker−Andre M.およびHahlbrock K.(1989年)Nucleic Acids Res.、17巻:9437〜9446頁;Freeman W. M.ら(1999年)Biotechniques、26巻:112〜122頁、124〜125頁;Lutfalla G.およびUze G.(2006年)、Methods Enzymol.、410巻:386〜400頁;Clementi M.ら(1993年)PCR Methods Appl.、2巻:191〜196頁;Diviacco S.ら(1992年)Gene、122巻:313〜320頁において例示されている。
本明細書で使用される「部分」という語句は、全長に満たない核酸配列、核酸配列断片、特定核酸配列、特定核酸断片、プローブ、プライマーなどを指す場合がある。部分は、約50〜約2,000ヌクレオチド、約100〜2,500、10〜1,000、10〜800、10〜500、20〜250、または20〜150ヌクレオチド未満の長さでありうる。
本明細書で使用される「プライマー」という用語は、鋳型(特異的なポリヌクレオチド、標的DNA、標的RNA、プライマー伸長産物、またはプローブ伸長産物など)とハイブリダイズまたはアニールすることが可能であり、また、鋳型と相補的なポリヌクレオチドの重合を促進することも可能でありうる、遊離3’ヒドロキシル基を一般に伴う、オリゴヌクレオチドを指す場合がある。プライマーは、プライマーのテールを構成する、ハイブリダイズしない配列を含有しうる。プライマーは、その配列が、標的と完全に相補的でなくてもやはり、標的とハイブリダイズしうる。
本明細書で利用されるプライマーは、PCR、qPCR、伸長反応など、ポリヌクレオチド鋳型に沿った、ポリメラーゼによる伸長反応において用いられるオリゴヌクレオチドでありうる。オリゴヌクレオチドプライマーは、一本鎖でありうる合成ポリヌクレオチドであって、その3’末端において、標的ポリヌクレオチドの配列とハイブリダイズすることが可能でありうる配列を含有する合成ポリヌクレオチドでありうる。
特定核酸とハイブリダイズするプライマーの3’領域は、配列またはプライマー結合性部位に対する、少なくとも80%、好ましくは90%、より好ましくは95%、最も好ましくは100%の相補性を含みうる。
「テール配列」という用語は、プライマー配列またはプローブ配列に隣接し、かつそれの5’にあるハイブリダイズしない配列を指す場合がある。「プローブ伸長産物」という用語は、例えば、特定核酸配列内で、プローブのハイブリダイゼーションと、プローブから開始される鋳型指向性合成とから生じる、DNA断片を指す場合がある。プローブは、存在し、特定核酸へと追加される場合、ポリメラーゼにより、アダプター配列へと伸長させることができる。結果として得られるプローブ伸長産物は、第1のアダプター、例えば、特定核酸配列へと追加されるアダプターと、例えば、プライマーまたはプローブのテール配列内に見出される、第2のアダプターとの両方を有しうる。
本明細書で使用される「ランダムプライマー」とは、必ずしも、試料中の特定の(particular)配列または特定配列に基づき設計されうるわけではなく、ランダムプライマーの配列は、試料中の1種または複数の配列とハイブリダイズ可能でありうる(所与のセットの条件下で)という統計学的予測(または経験的観察)に基づきうる配列を含むプライマーでありうる。ランダムプライマーは、オリゴヌクレオチド上の所与の位置におけるヌクレオチドが、4つのヌクレオチドのうちのいずれか、または4つのヌクレオチドのうちの選択される群のうちのいずれか(例えば、4つのヌクレオチドのうちの3つだけ、または4つのヌクレオチドのうちの2つだけ)でありうる、ランダム配列を含むオリゴヌクレオチドまたはオリゴヌクレオチドの集団でありうる。本明細書で使用された、「n−ランダムオリゴヌクレオチド」という表記とは、アダプター内またはプライミング部位内の、少なくとも0、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも6つ、少なくとも8つ、少なくとも9つ、少なくとも10などの塩基を指す場合がある。
本明細書で使用される「ランダムヌクレオチド」および「n−ランダムヌクレオチド配列」とは、アダプター内またはプライマー内に、必ずしも、試料中の特定の配列または特定配列に基づき設計されうるわけではなく、ランダムヌクレオチドを有するアダプターまたはプライマーは、プライマー内、アダプター内、または試料中の、1種または複数の配列とハイブリダイズ可能でありうる(所与のセットの条件下で)という統計学的予測(または経験的観察)に基づきうる配列を含みうる、ヌクレオチドでありうる。ランダムオリゴヌクレオチドは、オリゴヌクレオチド上の所与の位置におけるヌクレオチドが、4つのヌクレオチドのうちのいずれか、または4つのヌクレオチドのうちの選択される群のうちのいずれか(例えば、4つのヌクレオチドのうちの3つだけ、または4つのヌクレオチドのうちの2つだけ、またはヌクレオチドのうちの1つだけ)でありうる、ランダム配列を含むオリゴヌクレオチドまたはオリゴヌクレオチドの集団でありうる。本明細書で使用された、「n−ランダムオリゴヌクレオチド」という表記とは、アダプター内またはプライマー内の、少なくとも0、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、少なくとも10などの塩基を指す場合がある。
本明細書で使用される「試料」という用語は、目的の核酸を含有するか、または目的の核酸を含有することが仮定される任意の物質を指す場合があり、こうして、核酸、細胞、生物、組織、流体(例えば、脊髄液またはリンパ液)、患者から採取された有機流体の試料と、血液、血漿、血清、尿、涙液、糞便、気道および尿生殖路、唾液、異なる臓器の断片、組織、血液細胞、循環腫瘍細胞(CTC)または播種性腫瘍細胞(CTD)、骨、核酸分子を含有することが疑われているin vitroにおける細胞培養物または検体の試料を含むがこれらに限定されない試料とを含む。
「伝染性感染」および「伝染性疾患」という語句は、人から人へ;動物から動物への、動物からヒトへの、またはヒトから動物への、直接的な接触または近接による偶発的な接触により感染可能な感染症および疾患を指す場合がある。
本明細書で使用される「PCR重複」という用語は、元の同じ核酸分子に由来するので、別のシークエンシングリードと同じプライマー/プローブ伸長産物配列であり、したがって、固有の核酸分子を表さない、任意のシークエンシングリードを指す場合がある。
本明細書で使用される「プローブ」という用語は、オリゴヌクレオチド配列を指す場合がある。プローブは、プローブ標的領域と相補的でありうる。プローブ標的領域と相補的なプローブ配列は、約200残基長未満、例えば、約15〜100ヌクレオチド長の間でありうるが、また、より長いポリヌクレオチド鎖を包含することも意図されうる。プローブ標的領域は、一本鎖の場合もあり、二本鎖の場合もある。プローブ標的領域は、ポリメラーゼを使用して伸長を施される、相補的プローブのためのハイブリダイゼーション部位をもたらす。
本明細書で使用される「プローブ標的領域」という用語は、ゲノムデータベース内もしくはトランスクリプトームデータベース内の領域、またはゲノム配列内もしくはトランスクリプトーム配列内の領域であって、それに対してプローブが設計される領域を指す場合がある。領域は、特異的な相補的領域を越えて伸長させることが可能であり、ゲノムまたはトランスクリプトームの隣接領域を含みうる。そのプローブ標的領域に対してアラインさせたプローブ配列は、プローブのアニーリングの特異性の検証をもたらすので、プローブ伸長産物の特異性の検証ももたらすことが可能であり、こうして、計数される特定核酸分子の特異性の検証ももたらしうる。
プローブ標的領域は、特定核酸配列内にある。プローブ標的領域は、約500残基長であることが可能であり、また、約80〜1000残基の間でもありうる。本明細書で使用される「プローブ標的領域」という用語は、「プローブのハイブリダイゼーション部位」という用語および「プローブのアニーリング部位」と互換的に使用することができる。
本明細書で使用される「検証されたプローブ」または「検証されたプローブ配列」という用語は、存在することが検証され、結果として得られるシークエンシングデータに由来する、意図される特定標的核酸とハイブリダイズすることが検証された、プローブの配列を指す場合がある。
ここで、開示される発明の例示的な実施形態について、詳細に言及する。開示される方法および組成物について、例示的な実施形態と共に記載するが、これらの例示的な実施形態は、開示される発明を限定することを意図するものではないことが理解されるであろう。逆に、開示される発明は、開示される発明の精神および範囲に含まれうる、代替物、改変、および等価物を包含することを意図する。
一部の実施形態では、本明細書では、複数の核酸を含む試料に由来する、目的の特定核酸配列を定量化するための方法および組成物が開示される。本明細書で記載される方法は、従来のアダプター、配列特異的プローブ標的領域のプローブ、ポリメラーゼ酵素およびライゲーション酵素、ならびにライゲーションを使用して、特定核酸配列を増幅しうる。方法はさらに、トランスクリプトームまたはゲノムDNAに由来する、少なくとも第1の特定核酸配列のデジタル測定も可能としうる。
デジタル遺伝子発現は、複数の方式で実施されているが、各々が重大な欠点を有するので、新たな方法論が、核酸分子の適正なデジタル計数を実施するために重要となっている。デジタル核酸計数のための現行の方法は、デジタルPCR、ハイスループットシークエンシング、およびNanostring n−counter systemにより実施される、ハイブリダイゼーションベースの計数を含みうる。
デジタルPCRは、PCR容器、すなわち1プレート内の1ウェル内で、またはエマルジョン1液滴のいずれか当たり1コピーを得る点まで、出発核酸材料を希釈することにより実施することができる。エンドポイントPCRは、所与の標的プライマーのセットについて実施することができ、増幅事象に対して陽性であるウェルまたは液滴の数を計数することができる。この方法の主要な欠点は、ポアソン分布に基づき、容器1つ当たりの標的核酸1コピーを正確に得ることの問題であり、また、反応も、探査されうる核酸試料1例当たり少数の標的に大きく限定されうる(低マルチプレックス能)。
Nanostringのn−counter systemでは、蛍光シグナルを測定することにより、インプット核酸を計数する、単分子分解能を伴う、プローブハイブリダイゼーションスキームを利用する。この技術の大きな欠点は、使用しなければならない蛍光タグと、同じ分子上の異なる領域を標的化することができないこととに起因する、低い多重化である。例えば、使用される蛍光タグのサイズに起因して、n−counter systemは、同じRNA転写物内の、2つのエクソンの存在について探査することが不可能でありうる。
ハイスループットシークエンシングは、核酸分子のデジタル計数のための優れた方法であると考えうるが、これもまた、大きな欠点を抱えている。ゲノムDNAならびにRNA計数のいずれのためにも、シークエンシングの前に、核酸をランダムにせん断する場合がある。このランダムなせん断が、標的の塩基組成へとバイアスを導入する結果として、所与の目的の標的の不均質な増幅またはシークエンシングがもたらされうる。核酸断片の計数における両義性の大きな供給源は、計数するのに現在使用されている方法に基づきうる。すなわち、所与の目的の遺伝子(またはゲノム標的領域)について、異なるサイズであり、したがって、必然的に異なる数のシークエンシングリードを生成する標的を、互いと比較しうるように、得られるシークエンシングリードの数を、標的領域のサイズにより正規化しなければならない。同じ遺伝子の、異なる長さのアイソフォームが、様々な存在度で存在するので、標的領域のサイズは、試料間で必ずしも固定されないため、両義性が生じる。これは、RNAシークエンシングの場合に、最も容易に見ることができるが、ゲノムDNAにも同等に当てはまる。
RNAシークエンシングでは、遺伝子計数は、生成されるデータの種類に応じて、RPKMまたはFPKM(計数10億当たりのリード/断片、または計数10億当たりの断片)として表すことができる。シークエンシングデータの計数は、リード(またはペアドエンドシークエンシングの場合は断片)の数、標的RNAのサイズ(キロベース単位)、およびシークエンシングリードの総数(百万単位)により決定することができる。問題は、標的RNAのサイズを測定することにあり、1つのサイズが、全ての試料にわたり仮定されている。しかし、代替的エクソン使用により、RNAのサイズは、異なる試料間で、最大で何kbもの配列にわたり異なりうるため、2つの試料の間のRPKM/FPKM測定値では、サイズ変数が潜在的に変更されることが周知である。加えて、一定数のシークエンシングリードについて、代替的エクソン使用により、1つの遺伝子のサイズを変更することは、他の遺伝子に由来するリードの数も変化させることになるので、1つの遺伝子についてのサイズ測定値の変化は、試料中の全ての遺伝子についてのRPKM/FPKM測定値にも影響を及ぼす。RNAシークエンシングに関して記載したのとまったく同様に、試料間で目的の標的領域のサイズを変更する部分的な重複および欠失を考慮する場合、ゲノムDNA計数も、同様の問題を抱える場合がある。
一部の実施形態では、本明細書では、複数の核酸を有する試料に由来する特定核酸配列のデジタル測定のための方法および組成物が開示される。核酸は、DNAの場合もあり、RNAの場合もある。核酸は、一本鎖の場合もあり、二本鎖の場合もある。DNAは、ゲノムDNA、cDNA、DNA/RNAハイブリッド体、またはこれらの任意の組み合わせでありうる。一部の実施形態では、インプット試料中の核酸は、二本鎖DNAでありうる。一部の実施形態では、方法は、インプット試料中の核酸を断片化して、核酸断片を生成するステップを含む。一部の実施形態では、試料を断片化しない。一部の実施形態では、核酸の断片化は、核酸を断片化するための、当技術分野で公知であるか、または本明細書で記載される方法であって、物理的(すなわち、超音波処理)断片化反応、および/または酵素的(すなわち、制限酵素処理)断片化反応を含みうるがこれらに限定されない方法により達成することができる。
物理的断片化法は、噴霧化、超音波処理、および/または流体力学的せん断を含みうる。一部の実施形態では、断片化は、機械的に達することができ、インプット試料中の核酸を、音響的超音波処理にかけることを含む。一部の実施形態では、断片化は、インプット試料中の核酸を、1種または複数の酵素が二本鎖核酸の切断を生成するのに適する条件下で、1種または複数の酵素により処理することを含む。核酸断片またはポリヌクレオチド断片の生成に有用な酵素の例は、配列特異的ヌクレアーゼおよび配列非特異的ヌクレアーゼを含みうる。ヌクレアーゼの非限定的な例は、DNアーゼI、Fragmentase、制限エンドヌクレアーゼ、これらの改変体、およびこれらの組み合わせを含みうる。酵素的断片化反応を実行するための試薬は、市販されている(例えば、New England Biolabsから)。例えば、DNアーゼIによる消化は、Mg++の非存在下およびMn++の存在下で、DNA内のランダム二本鎖切断を誘導しうる。一部の実施形態では、断片化は、インプット試料中の核酸を、1種または複数の制限エンドヌクレアーゼで処理することを含む。断片化は、5’突出、3’突出、平滑末端、またはこれらの組み合わせを有する断片をもたらしうる。断片化が1種または複数の制限エンドヌクレアーゼの使用を含む場合など、一部の実施形態では、試料ポリヌクレオチドの切断は、予測可能な配列を有する突出を後に残す。
一部の実施形態では、インプット試料中の核酸は、断片化された核酸分子の集団へと断片化することもでき、1種または複数の特異的なサイズ範囲のポリヌクレオチドへと断片化することもできる。一部の実施形態では、断片の平均の長さは、約10〜約10,000ヌクレオチドでありうる。一部の実施形態では、断片の平均の長さは、約50〜約2,000ヌクレオチドでありうる。一部の実施形態では、断片の平均の長さは、約100〜2,500、10〜1,000、10〜800、10〜500、50〜500、50〜250、または50〜150ヌクレオチドでありうる。一部の実施形態では、断片の平均の長さは、5,000ヌクレオチド未満、2,500ヌクレオチド未満、2,500ヌクレオチド未満、1,000ヌクレオチド未満など、10,000ヌクレオチド未満、400ヌクレオチド未満、300ヌクレオチド未満、200ヌクレオチド未満、または150ヌクレオチド未満など、500ヌクレオチド未満でありうる。
一部の実施形態では、核酸の断片化に続いて、核酸断片の末端修復を施すことができる。一部の実施形態では、断片化されていない試料に、末端修復を施すことができる。末端修復は、平滑末端、非平滑末端(すなわち、粘着末端または付着末端)、または3’−エクソヌクレアーゼ活性を欠くポリメラーゼによる、核酸断片の3’末端への、単一のdAヌクレオチドの付加など、一塩基突出の生成を含みうる。末端修復は、任意の数の酵素および/またはOvation(商標)Ultralow NGS Library System(NuGEN)など、市販のキットを含むがこれらに限定されない、当技術分野で公知の方法を使用して実施することができる。一部の実施形態では、末端修復を、二本鎖DNA断片上で実施して、平滑末端を生成することができ、この場合、二本鎖DNA断片は、5’ホスフェートおよび3’ヒドロキシルを含有する。一部の実施形態では、二本鎖DNA断片を、平滑末端ポリッシング(または「末端修復」)して、平滑末端を有するDNA断片を生成した後、アダプターへと接続することができる。二本鎖断片上の平滑末端の生成は、二本鎖産物の突出する一本鎖末端を分解するための、例えば、エクソヌクレアーゼ1、エクソヌクレアーゼ7、またはこれらの組み合わせなど、一本鎖特異的DNAエクソヌクレアーゼの使用により行うことができる。代替的に、二本鎖DNA断片は、例えば、マングビーンエンドヌクレアーゼまたはS1エンドヌクレアーゼであるがこれらに限定されない、一本鎖特異的DNAエンドヌクレアーゼの使用により、平滑末端化することができる。代替的に、二本鎖産物は、二本鎖産物の突出する一本鎖末端を分解するための、例えば、T4 DNAポリメラーゼなど、一本鎖エクソヌクレアーゼ活性を含むポリメラーゼ、もしくは一本鎖エクソヌクレアーゼ活性を含む他の任意のポリメラーゼ、またはこれらの組み合わせの使用により平滑末端化することができる。場合によって、一本鎖エクソヌクレアーゼ活性を含むポリメラーゼは、1種または複数のdNTPを含むか、またはこれらを含まない、反応混合物中でインキュベートすることができる。他の場合には、一本鎖核酸特異的エクソヌクレアーゼと、1種または複数のポリメラーゼとの組み合わせを使用して、核酸を含む試料を断片化することにより生成される二本鎖断片を平滑末端化することができる。さらに他の場合には、二本鎖断片の突出する一本鎖末端に充填することにより、核酸断片を平滑末端化することもできる。例えば、断片を、1種または複数のdNTPの存在下で、T4 DNAポリメラーゼもしくはKlenowポリメラーゼ、またはこれらの組み合わせなどのポリメラーゼと共にインキュベートして、二本鎖断片の一本鎖部分を充填し得る。代替的に、二本鎖DNA断片は、エクソヌクレアーゼおよび/またはポリメラーゼを使用する一本鎖突出分解反応と、1種または複数のdNTPの存在下で、1種または複数のポリメラーゼを使用する充填反応との組み合わせにより、平滑にすることができる。平滑末端修復または末端ポリッシングのための市販のキットはまた、NEB Quick Blunting(商標)キットまたはNEBNext(登録商標)End Repair キット(New England Biolabs)も含む。
一部の実施形態では、断片化された特定核酸を、一本鎖核酸断片へと変性させることができる。一部の実施形態では、非断片化試料を、一本鎖核酸鎖へと変性させることができる。当業者には、二本鎖核酸を一本鎖核酸へと変性させるための方法が周知である。方法は、熱変性、化学的変性などを含むがこれらに限定されない。
特定核酸断片配列または非断片化核酸試料配列を定量化するための、本明細書で記載される方法は、少なくとも第1のアダプターを、本明細書で記載される方法により生成される、核酸断片または非断片化核酸試料配列へと追加するステップをさらに含みうる。一部の実施形態では、少なくとも第1のアダプターは、フォワードアダプターでありうる。少なくとも第1のアダプターを、本明細書で記載される方法により生成される、核酸断片または非断片化核酸試料配列へと追加するステップは、ライゲーション反応またはプライミング反応を使用して達成することができる。一部の実施形態では、少なくとも第1のアダプターの、核酸断片または非断片化核酸試料配列への追加は、ライゲーションを含む。一部の実施形態では、少なくとも第1のアダプターの、核酸断片または非断片化核酸試料配列へのライゲーションは、核酸断片または非断片化核酸試料配列の末端修復に続いて施すことができる。一部の実施形態では、少なくとも第1のアダプターの、核酸断片または非断片化核酸試料配列へのライゲーションは、核酸断片または非断片化核酸試料配列の末端修復を伴わない、核酸断片または非断片化核酸試料配列の生成に続いて施すことができる。
少なくとも第1のアダプターは、当技術分野で公知の任意の種類のアダプターであって、アダプターが2つの相補鎖を含む、従来の二重鎖アダプターまたは二本鎖アダプターを含むがこれらに限定されないアダプターでありうる。一部の実施形態では、第1のアダプターは、二本鎖DNAアダプターでありうる。一部の実施形態では、第1のアダプターは、配列が公知のオリゴヌクレオチドであることが可能であり、こうして、少なくとも第1のアダプターを追加しうるか、または付着させうる、任意のポリヌクレオチドを増幅および/またはシークエンシングするための、配列特異的プライマーの生成および/または使用を可能とする。一部の実施形態では、第1のアダプターは、従来の二重鎖アダプターであることが可能であり、この場合、第1のアダプターは、当技術分野で周知の配列を含む。一部の実施形態では、本明細書で記載される方法は、配列が公知の二本鎖DNAであって、平滑末端化することが可能であり、本明細書で記載される方法により、1つの配向性で生成される二本鎖核酸断片へとカップリングさせうる二本鎖DNAを含む、第1の二重鎖アダプターの使用を伴いうる。一部の実施形態では、核酸断片のライブラリー内の各核酸断片、または非断片化核酸のライブラリー内の非断片化核酸試料が、一方の末端へとライゲーションされた第1のアダプターを含むように、第1のアダプターを、本明細書で記載される方法により生成される核酸断片のライブラリーへと追加またはライゲーションすることができる。一部の実施形態では、少なくとも第1のアダプターを、一本鎖核酸断片または非断片化核酸試料配列へと、追加またはライゲーションすることができ、プローブ伸長産物へと組み込むことができる。
少なくとも第1のアダプターの、核酸断片または非断片化核酸試料配列へのライゲーションにより、ライゲーション産物である、第1のアダプターの特定核酸断片の複合体、または第1のアダプターの非断片化核酸試料の配列が生成される。一部の実施形態では、第1のアダプターの特定核酸断片の複合体を変性させることができる。一部の実施形態では、第1のアダプターの非断片化核酸試料の配列を変性させることができる。変性は、当技術分野で公知の方法であって、物理的変性、熱的変性、および/または化学的変性を含むがこれらに限定されない方法のうちのいずれかを使用して達成することができる。一部の実施形態では、変性は、熱的変性または熱変性を使用して達成することができる。一部の実施形態では、例えば、図1で描示される通り、少なくとも第1のアダプターの特定核酸断片の複合体、または少なくとも第1のアダプターの非断片化核酸試料の配列の変性により、少なくとも第1のアダプター配列を、核酸断片または非断片化核酸試料配列の5’末端だけにおいて含む、一本鎖核酸断片または非断片化核酸試料配列が生成される。
一部の実施形態では、5’末端または5’末端および3’末端の両方へと追加された第1のアダプター配列を含む、核酸断片または非断片化核酸試料配列を変性させて、5’末端または5’末端および3’末端の両方へと追加された第1のアダプター配列を含む、一本鎖核酸断片または非断片化核酸試料配列を生成する。一部の実施形態では、本明細書で記載される本発明の方法を使用して、5’末端または5’末端および3’末端の両方へと追加された第1のアダプター配列を含む、複数の一本鎖核酸断片または非断片化核酸試料配列を生成することができる。一部の実施形態では、第1の末端において、一本鎖特定核酸内に存在する、目的のプローブ標的領域配列と相補的な配列を含み、第2の末端において、第2のアダプターに由来する配列を含み、第2のアダプター配列が、プローブ標的領域と相補的でないオリゴヌクレオチドプローブを、一本鎖特定核酸断片または非断片化核酸試料配列とアニールさせることができる。一部の実施形態では、第2のアダプター配列は、リバースアダプターに由来する配列でありうる。
一部の実施形態では、目的のプローブ標的領域配列は、一本鎖特定核酸断片または非断片化核酸試料配列のうちの1種または複数の中に存在しうる。一部の実施形態では、目的とする異なるまたは別々のプローブ標的領域配列は、一本鎖核酸断片または非断片化核酸試料配列のうちの1種または複数の中に存在しうる。一部の実施形態では、1種または複数のオリゴヌクレオチドは、1種または複数の一本鎖核酸断片内または非断片化核酸試料配列内に存在する、目的とする同じ配列と相補的な配列を含みうる。この実施形態では、1種または複数のオリゴヌクレオチドは、目的とする同じ配列の異なる部分または領域と相補的でありうる配列を含みうる。一部の実施形態では、異なる領域は、互いと隣接する場合がある。一部の実施形態では、異なる領域は、互いと隣接しない場合がある。一部の実施形態では、目的とする同じ標的核酸配列と相補的な配列を含む、1種または複数のオリゴヌクレオチドは、同じ第2のアダプター配列をさらに含みうる。一部の実施形態では、1種または複数のプローブオリゴヌクレオチドは、1種または複数の一本鎖核酸断片内または非断片化核酸試料配列内に存在しうる、目的とする異なるまたは別々の配列と相補的な配列を含みうる。一部の実施形態では、目的とする異なるまたは別々の標的核酸配列と相補的な配列を含む、1種または複数のオリゴヌクレオチドプローブは、同じ第2のアダプター配列をさらに含みうる。一部の実施形態では、目的の標的配列と相補的な配列は、オリゴヌクレオチドプローブの3’末端にあることが可能であり、第2のアダプター配列は、オリゴヌクレオチドの5’末端にあることが可能である。一部の実施形態では、第2のアダプター配列は、目的の標的核酸配列と相補的でない場合がある。このようにして、第2のアダプター配列は、テールとして役立つ。第2のアダプター配列は、従来のアダプター配列でありうる。一部の実施形態では、第2のアダプター配列は、上記で記載した通り、一本鎖核酸断片または非断片化核酸試料配列へと追加される、第1のアダプターの配列と異なりうるか、または別々でありうる、従来のアダプター配列でありうる。一部の実施形態では、第2のアダプター配列は、公知の配列であることが可能であり、こうして、第2のアダプター配列を、追加しうるか、または付着させうる、任意のポリヌクレオチドの増幅および/またはシークエンシングのための、配列特異的プライマーの生成および/または使用を可能とする。別個の実施形態では、オリゴヌクレオチドプローブは、事前の変性を伴わずに、5’末端または5’末端および3’末端の両方へと追加された第1のアダプター配列を含む、特定核酸断片または非断片化核酸試料配列へとアニールさせることができる。この実施形態では、オリゴヌクレオチドのアニーリングは、オリゴヌクレオチドと、二本鎖核酸断片または非断片化核酸試料配列の5’末端または5’末端および3’末端の両方へと追加された第1のアダプター配列を含む、二本鎖核酸断片または非断片化核酸試料配列との間の、三重螺旋または三重鎖の形成を介するアニーリングでありうる。この実施形態では、二本鎖核酸断片または非断片化核酸試料配列は、目的の配列を含み、5’末端または5’末端および3’末端の両方へと追加された第1のアダプター配列を含む、複数の二本鎖核酸断片または非断片化核酸試料配列の中に存在しうる。この実施形態に付け加えて、オリゴヌクレオチドプローブは、二本鎖特定核酸断片内または非断片化核酸試料配列内の、プローブ標的領域と相補的な配列も含む。総じて、1種または複数の(more or a plurality of)特定核酸断片または非断片化核酸試料配列の中の核酸断片内または非断片化核酸試料配列内に存在する、目的のプローブ標的領域配列と相補的な配列を含むオリゴヌクレオチドプローブの使用は、本明細書で記載される方法を使用する、前記核酸断片または非断片化核酸試料配列の選択的結合および後続の濃縮を可能とする。
上記で記載したオリゴヌクレオチドプローブのアニーリングに続き、ポリメラーゼを使用して、オリゴヌクレオチドプローブを伸長させることができる。一部の実施形態では、ポリメラーゼは、DNA依存性DNAポリメラーゼでありうる。一部の実施形態では、DNA依存性DNAポリメラーゼは、本明細書で記載されるDNA依存性DNAポリメラーゼのうちのいずれかであることが可能であり、オリゴヌクレオチドの伸長は、当技術分野で公知の方法のうちのいずれかを介する伸長でありうる。一部の実施形態では、プローブ標的領域核酸と相補的でない第2のアダプター配列と、特定核酸断片内に存在する、目的のプローブ標的領域配列と相補的な配列であって、一方および/または両方の末端へと追加された第1のアダプターを含む配列とを含むオリゴヌクレオチドプローブを、核酸断片へとアニールさせ、ポリメラーゼにより伸長させて、第1の末端において、第1のアダプター配列を含み、第2の末端において、第2のアダプター配列を含む、プローブ伸長産物を生成することができる。一部の実施形態では、特定核酸断片は、一方および/または両方の末端へと追加された第1のアダプターを含む、複数の核酸断片の中に存在しうる。この実施形態では、プローブ伸長産物を、目的のプローブ標的領域配列を含有する核酸断片だけについて生成することができる。
一部の実施形態では、本明細書で記載される方法により生成されるプローブ伸長産物を、増幅反応にかけることができる。一部の実施形態では、増幅反応は、指数関数的であることが可能であり、多様な温度サイクルで実行することができる。増幅反応は、等温反応でありうる。一部の実施形態では、増幅は、定量的ポリメラーゼ連鎖反応(qPCR)でありうる。一部の実施形態では、増幅反応は、等温でありうる。一部の実施形態では、プローブ伸長産物は、本明細書で記載される方法により生成される通り、一方の末端上に、少なくとも第1のアダプター配列を含み、他方の末端上に、第2のアダプター配列を含む。一部の実施形態では、プローブ伸長産物は、第1のアダプターと相補的な配列を含む第1のプライマーと、特定核酸鎖内の、プローブ標的領域と相補的な鎖内の、5’テール配列と相補的な配列を有する第2のプライマーとを使用して増幅することができる。このようにして、第1のアダプター配列およびプローブ標的領域の両方を含むプローブ伸長産物を増幅し、そのようにして濃縮することができる。少なくとも第1のアダプター配列およびプローブ標的領域配列の両方を有するプローブ伸長産物を増幅し、増幅されたプローブ伸長産物であって、前記ライゲーションされた特定核酸断片または非断片化核酸試料配列から生成されたプローブ伸長産物を定量化することができる。一部の実施形態では、少なくとも第1のアダプター配列および/または第2のアダプター配列は、識別子配列を含みうる。一部の実施形態では、識別子配列は、バーコード配列でありうる。一部の実施形態では、バーコード配列は、少なくとも第1のアダプターに固有でありうる。一部の実施形態では、少なくとも第1のアダプターおよび/または第2のアダプター配列は、例えば、シークエンシングおよびシークエンシング反応の後における特定核酸の同定などであるがこれらに限定されない、下流における適用のために使用しうる配列を含みうる。一部の実施形態では、少なくとも第1のアダプターおよび/または第2のアダプター配列は、Illuminaにより開発され、本明細書で記載されるシークエンシング法によるシークエンシングのために使用しうるフローセル配列33および35(図5)を含みうる。
目的の特定核酸配列断片を定量化するための、本明細書で記載される方法の、開示される実施形態についての概略図を、図1および図2に例示する。図中で使用される番号付けスキームは、例示的なものであるにすぎない。1つを超える図中に現れる同じ番号は、全部または一部において同一なオリゴヌクレオチド配列を指し示すことを意図するものではなく、開示される方法を実施するための基準となる構成要素、部位、または領域を指し示すことを意図するものである。
図1および図2の方法は、核酸断片、非断片化核酸試料、またはインサートの、ライゲーションされたライブラリーの生成を例示するが、この場合、ライゲーションされたライブラリーの各核酸配列は、フォワードリードプライミング部位と相補的なプライマーと、プローブ標的領域を含むプローブ伸長産物内の、リバースリードプライミング部位と相補的なプライマーとを使用するPCR増幅により、特異的なプローブ標的領域配列を有する特定核酸分子の定量化を可能とするシークエンシングカバレッジ(sequencing coverage)をもたらすように、アダプター内の、共通のフォワードリードプライミング部位と、特異的なプローブ標的領域配列とを含む。
図1は、せん断されたgDNAの使用について例示する。せん断されたDNA 8は、特定核酸断片10を有するgDNAの5’末端へとライゲーションされたアダプター11を有する。断片10は、プローブ標的領域50を含む。アダプターは、シークエンシングリード1のフォワードオリゴヌクレオチドプライミング部位12、6Nオリゴヌクレオチド配列14などのn−ランダムオリゴヌクレオチド塩基、インデックス塩基オリゴヌクレオチド配列16、および、使用されるハイスループットシークエンシング法に応じて、インデックスプライミング部位18のうちの少なくとも1つを含みうる。アダプター11をライゲーションすると、特定核酸断片10は、固有の識別子配列標識である、インデックスリードに加えた、n−ランダムオリゴヌクレオチドを有しうる。インデックス配列16を使用して、特定核酸試料を同定し、6Nオリゴヌクレオチド配列14を、重複シークエンシングリードのマーキングに使用する。5’テールオリゴヌクレオチド配列20を有するプローブオリゴヌクレオチド配列19は、プローブ標的領域50と相補的であり、かつ、これとハイブリダイズすることが可能であり、アダプター11を介する、dNTPおよびDNAポリメラーゼの存在下における、単一プライマー伸長反応により伸長させることができる。結果として得られるプローブ伸長産物22は、インデックスプライミング部位18と部分的に相補的でありうるフォワードプライマー24と、5’テール配列20の逆相補体と部分的に相補的でありうるリバースプライマー26とを使用して増幅することができる。増幅反応により、プローブ標的領域50を有する特定核酸10の存在を濃縮して、特定核酸配列のライブラリーを生成する。
図2に例示される通り、同様の単一プライマー伸長反応は、cDNAにも適用可能でありうる。cDNA 7は、特定核酸断片9の5’末端へとライゲーションされたアダプター11を有する。断片9は、プローブ標的領域60を含む。アダプターは、フォワードシークエンシングリードのオリゴヌクレオチドプライミング部位12、6Nオリゴヌクレオチド配列14など、公知のランダムオリゴヌクレオチド塩基、インデックス塩基オリゴヌクレオチド配列16、および、使用されるハイスループットシークエンシング法に応じて、インデックスシークエンシングリードのプライミング部位18のうちの少なくとも1つを含みうる。インデックス配列16を使用して、特定核酸試料を同定し、6Nオリゴヌクレオチド配列14を、重複シークエンシングリードの同定に使用する。5’テールオリゴヌクレオチド配列20を有するプローブオリゴヌクレオチド配列19は、プローブ標的領域配列60と相補的であり、かつ、これとハイブリダイズすることが可能であり、アダプター15を介する、dNTPおよびDNAポリメラーゼの存在下における、単一プライマー伸長反応により伸長させることができる。結果として得られるプローブ伸長産物21は、18と部分的に相補的でありうるフォワードプライマー24と、5’テール配列20の逆相補体と部分的に相補的でありうるリバースプライマー26とを使用して増幅することができる。増幅反応により、プローブ標的領域60を有する特定核酸9の存在を濃縮して、特定核酸配列のライブラリーを生成する。
目的の特定核酸配列断片を定量化するための、本明細書で記載される方法の、開示される実施形態についての概略図を、二本鎖gDNAについて図3および図4に例示する。図中で使用される番号付けスキームは、例示的なものであるにすぎない。1つを超える図中に現れる同じ番号は、全部または一部において同一なオリゴヌクレオチド配列を指し示すことを意図するものではなく、開示される方法を実施するための基準となる構成要素、部位、または領域を指し示すことを意図するものである。
図3および図4の方法は、核酸断片、非断片化核酸試料、またはインサートの、シークエンシングライブラリーの生成を例示するが、この場合、シークエンシングライブラリーの各核酸配列は、特異的なプローブ標的領域配列を有する特定核酸分子の定量化を可能とするシークエンシングカバレッジが存在し得るように、1つのアダプター内の、共通のフォワードプライミング部位と、特異的なプローブ標的領域配列とを含む。シークエンシングは、共通のフォワードプライミング部位と相補的なプライマーと、特定核酸配列内の特異的なプローブ標的領域配列と相補的なプライマーとを使用する、PCR増幅を伴うか、またはこれを伴わない、ライゲーションされたプローブ伸長産物から作製されるシークエンシングライブラリーを使用して行うことができる。
図3は、せん断されたgDNAの使用を例示する。特定核酸10を有する、せん断されたgDNAは、プローブ標的領域50を含む。5’テールオリゴヌクレオチド配列20を有する、プローブオリゴヌクレオチド配列19は、プローブ標的領域配列50と相補的であり、かつ、これとハイブリダイズすることが可能であり、特定核酸10の末端を介する、dNTPおよびDNAポリメラーゼの存在下における、単一プローブ伸長反応であって、二本鎖DNAを創出する伸長反応において伸長させることができる。結果として得られるプローブ伸長産物は、特定核酸断片10の3’末端へとライゲーションされたアダプターを有しうる。アダプターは、フォワードシークエンシングリード1のオリゴヌクレオチドプライミング部位12、6Nオリゴヌクレオチド配列14などのn−ランダムオリゴヌクレオチド塩基、インデックス塩基オリゴヌクレオチド配列16、および、使用されるハイスループットシークエンシング法に応じて、インデックスプライミング部位18のうちの少なくとも1つを含みうる。インデックス配列16を使用して、特定核酸試料を同定し、6Nオリゴヌクレオチド配列14を、重複シークエンシングリードのマーキングに使用する。ライゲーション産物22は、インデックスプライミング部位18と部分的に相補的でありうるフォワードプライマー24と、5’テール配列21の逆相補体と部分的に相補的でありうるリバースプライマー26とを使用して増幅することができる。増幅反応により、プローブ標的領域50を有する特定核酸10の存在を濃縮して、特定核酸配列のライブラリーを生成することができる。
図4は、せん断されたgDNAの使用を例示する。特定核酸10を有する、せん断されたgDNAは、プローブ標的領域50を含む。5’テールオリゴヌクレオチド配列20を有する、プローブオリゴヌクレオチド配列19は、プローブ標的領域配列50と相補的であり、かつ、これとハイブリダイズすることが可能であり、gDNA 10の末端を介する、dNTPおよびDNAポリメラーゼの存在下における、単一プローブ伸長反応であって、二本鎖DNAを創出する伸長反応において伸長させることができる。結果として得られるプローブ伸長産物は、制限酵素70により消化することができる。例示的な制限酵素は、XbaI、EcoRI、EcoRV、およびBamHIを含むがこれらに限定されない。制限酵素による消化に続き、アダプターを、特定核酸断片10を有する二本鎖gDNAの末端へとライゲーションすることができる。アダプターは、リード1のフォワードオリゴヌクレオチドプライミング部位12、6Nオリゴヌクレオチド配列14などのn−ランダムオリゴヌクレオチド塩基、インデックス塩基オリゴヌクレオチド配列16、および、使用されるハイスループットシークエンシング法に応じて、インデックスプライミング部位18のうちの少なくとも1つを含みうる。インデックス配列16を使用して、特定核酸試料を同定し、6Nオリゴヌクレオチド配列14を、重複シークエンシングリードのマーキングに使用する。ライゲーション産物22は、図3に例示される通り、インデックスプライミング部位18と部分的に相補的でありうるフォワードプライマー24と、5’テール配列21と部分的に相補的でありうるリバースプライマー26とを使用して増幅することができる。増幅反応により、プローブ標的領域50を有する特定核酸10の存在を濃縮して、特定核酸配列のライブラリーを生成することができる。
図5(番号付けは、図1または図2で使用される番号付けを指す)に例示される通り、同様の単一プライマー伸長反応は、様々なシークエンシングプラットフォームのためのシークエンシングライブラリーを創出するのに、gDNAまたはcDNAへと適用可能でありうる。gDNAまたはcDNA(せん断されているか、またはせん断されていない)10または9は、特定核酸断片10または9の5’末端へとライゲーションされたアダプター11を有する。断片10または9は、それぞれ、プローブ標的領域50または60を含む。アダプターは、フォワードオリゴヌクレオチドプライミング部位12、6Nオリゴヌクレオチド配列14など、公知のランダムオリゴヌクレオチド塩基、インデックス塩基オリゴヌクレオチド配列16、および、使用されるハイスループットシークエンシング法に応じて、インデックスプライミング部位18のうちの少なくとも1つを含みうる。5’テールオリゴヌクレオチド配列20を有するプローブオリゴヌクレオチド配列19は、プローブ標的領域配列50または60と相補的であり、かつ、これとハイブリダイズすることが可能であり、アダプター11を介する、dNTPおよびDNAポリメラーゼの存在下における、単一プライマー伸長反応により伸長させることができる。結果として得られるプローブ伸長産物21または22は、18と部分的に相補的でありうるフォワードプライマー24と、5’テール配列20と部分的に相補的でありうるリバースプライマー26とを使用して増幅することができる。増幅反応により、プローブ標的領域50または60を有する特定核酸10または9の存在を濃縮して、特定核酸配列のライブラリーを生成することができる。
ライブラリーは、NuGEN Ovation(登録商標)Target Enrichment System(NuGEN)を使用して、PCRを介して、選択された目的のプローブ標的領域配列を有する、プローブ伸長産物配列を選択的に増幅することにより調製することができる。図5は、Illuminaハイスループットシークエンシングプラットフォームを使用する場合に、ハイスループットシークエンシングで使用される核酸ライブラリーの例を例示する。例えば、遺伝子発現またはコピー数変異の定量化のデジタル測定のために、各配列ライブラリーの特定配列リード領域を解析することができる。
一部の実施形態では、特定核酸は、ビオチンを含むがこれらに限定されない、インジケーター分子によりタグ付けすることができる。次いで、タグ付けされた特定核酸分子を、元の試料分子に由来するものとして識別することができる。一部の実施形態では、インジケーター分子の付着は、標識されたヌクレオチド、例えば、ビオチニル化されたヌクレオチドの、ライゲーションまたはポリメラーゼによる付加を介して達することができる。次いで、ポリメラーゼによるプローブの伸長を伴うか、またはこれを伴わずに、プローブ標的領域と相補的でありうるプローブを、タグ付けされた核酸とハイブリダイズさせることができる。一部の実施形態では、ハイブリダイズしないプローブは、例えば、ビオチン/ストレプトアビジン間相互作用を介して、タグ付けされた核酸を捕捉することにより除去する。一部の実施形態では、標的とハイブリダイズしたプローブを、標的と共に捕捉する。ハイブリダイズしないプローブの除去に続き、捕捉されたプローブを、標的核酸から溶出させ、計数する。一部の実施形態では、計数は、Illuminaプラットフォームを介するシークエンシング、およびこれらのタグの計数により行うことができる。一部の実施形態では、プローブは、当業者に公知の通り、ナノ小孔または蛍光タグ付けによりタグ付けすることができる。
インプット核酸
インプットは、ヒト核酸でありうる。一部の実施形態では、インプットは、DNAでありうる。一部の実施形態では、インプットヒト核酸は、二本鎖DNA、ゲノムDNA、または1つを超える生物に由来する混合型DNAなど、複合体DNAでありうる。一部の実施形態では、インプットは、RNAでありうる。一部の実施形態では、RNAは、当技術分野で標準的な技法を使用して得、精製することができ、mRNA、tRNA、snRNA、rRNA、低分子非コードRNA、マイクロRNA、ポリソームRNA、プレmRNA、イントロンRNA、無細胞RNA、およびこれらの断片を含みうるがこれらに限定されない、精製形態または非精製形態にあるRNAを含みうる。非コードRNAまたはncRNAは、snoRNA、マイクロRNA、siRNA、piRNA、および長鎖ncRNAを含みうる。一部の実施形態では、DNA断片は、RNAを、プライマー(すなわち、ランダムプライマー)と組み合わせること、および、RNA鋳型を、RNA依存性DNAポリメラーゼを用いて逆転写することを含みうるがこれらに限定されない、RNA鋳型から、cDNAを生成するための、当技術分野で周知の方法のうちのいずれかを使用する、第1の鎖合成反応を介して、cDNAへと転換されたRNAに由来しうる。一部の実施形態では、DNA断片は、当技術分野で周知の方法のうちのいずれかを使用する、第1の鎖合成反応および第2の鎖合成反応を介して、二本鎖cDNAへと転換されたRNAに由来しうる。
一部の実施形態では、インプットDNAは、異なる種のゲノムの混合物から作製されるcDNAでありうる。インプット複合体はまた、異なるヒトのゲノムの混合物にも由来しうる。インプットDNAは、異なるヒトのゲノムの混合物から作製されるcDNAでありうる。インプットDNAは、特定の種、例えば、ヒト、ラット、マウス、他の動物、特定の植物、細菌、藻類、ウイルスなどのDNAでありうる。インプット複合体はまた、宿主病原体、細菌集団など、異なる種のゲノムの混合物にも由来しうる。代替的に、インプット核酸は、合成供給源に由来しうる。インプットDNAは、ミトコンドリアDNAでありうる。インプットDNAは、無細胞DNAでありうる。無細胞DNAは、例えば、血清試料または血漿試料から得ることができる。インプットDNAは、1種または複数の染色体を含みうる。例えば、インプットDNAが、ヒトに由来する場合、DNAは、第1染色体、第2染色体、第3染色体、第4染色体、第5染色体、第6染色体、第7染色体、第8染色体、第9染色体、第10染色体、第11染色体、第12染色体、第13染色体、第14染色体、第15染色体、第16染色体、第17染色体、第18染色体、第19染色体、第20染色体、第21染色体、22染色体、X染色体、またはY染色体のうちの1または複数を含みうる。DNAは、直鎖状ゲノムに由来する場合もあり、環状ゲノムに由来する場合もある。DNAは、プラスミドDNA、コスミドDNA、細菌の人工染色体(BAC)、または酵母人工染色体(YAC)でありうる。インプットDNAは、1例を超える個別のヒトに由来しうる。インプットDNAは、二本鎖の場合もあり、一本鎖の場合もある。インプットDNAは、クロマチンの部分でありうる。インプットDNAは、ヒストンと会合している場合がある。
一部の実施形態では、プローブオリゴヌクレオチドを、目的の特定核酸配列へと方向づけることができ、特定核酸内のプローブ標的領域を有する一本鎖特定核酸標的とハイブリダイズするように設計することができる。一部の実施形態では、選択された目的の配列領域を標的化するプローブを、一本鎖DNAまたはcDNAプローブ標的領域とハイブリダイズするように設計することができる。インプット核酸試料が、ゲノムDNAまたは他の二本鎖DNAを含む場合、インプット核酸試料をまず変性させて、標的を一本鎖とし、オリゴヌクレオチドプローブの、所望される目的のプローブ標的領域である配列領域とのハイブリダイゼーションを可能とすることができる。一部の実施形態では、他の二本鎖DNAは、1種または複数の標的RNAの第1の鎖合成および第2の鎖合成により生成される二本鎖cDNAでありうる。これらの実施形態では、本明細書で記載される方法および組成物により、複数のプローブ標的領域を含有する、複数の目的の特定核酸配列領域の、領域特異的濃縮および増幅を可能とすることができる。一部の実施形態では、本明細書で記載される方法および組成物は、各々が、対応する別々のプローブ標的領域を含有する目的の別々の領域を有する、少なくとも2つまたはこれを超える別々の特定核酸配列断片または非断片化核酸試料配列の、マルチプレックス増幅、濃縮、および定量化を可能とする。
他の実施形態では、選択された目的の配列領域を標的化するプローブを、二本鎖核酸断片または非断片化核酸試料配列の変性を伴わずに、二本鎖核酸標的断片または非断片化核酸試料配列とハイブリダイズするように設計することができる。他の実施形態では、選択された目的の配列領域を標的化するプローブを、dsDNAの変性を伴わずに、二本鎖DNA標的とハイブリダイズするように設計することができる。これらの実施形態では、選択された目的の配列領域を標的化するプローブを、選択された目的の配列領域において、三重螺旋(三重鎖)を形成するように設計することができる。プローブの、目的の二本鎖DNA配列領域とのハイブリダイゼーションは、二本鎖核酸試料の事前の変性を伴わずに実行することができる。このような実施形態では、本明細書で記載される方法および組成物により、目的の配列領域の領域特異的定量化のほか、鎖特異的増幅および定量化も可能とすることができる。この方法は、dsDNAであるインプットDNAを変性させる必要なしに、複合体核酸からの、目的の鎖特異的配列領域のコピーを生成し、こうして、天然の複合体核酸試料中の、多数の目的の配列領域の定量化および解析を可能とするために有用でありうる。方法は、in situにおいて実行される研究および解析のために使用することが可能であり、単一の細胞、または極めて小規模な、十分に規定された細胞集団のコレクション中の複合体ゲノムDNAについての研究および解析を可能としうるほか、クロマチン構造の破壊を伴わない、複合体ゲノムDNAの解析も許容しうる。
一部の実施形態では、本明細書では、さらなる識別子配列、例えば、バーコード配列を含むアダプターが開示される。一部の実施形態では、少なくとも第1のアダプターは、複数のバーコード配列のうちの少なくとも1つを含む。一部の実施形態では、各リバースアダプターは、複数のバーコード配列のうちの少なくとも1つを含み、この場合、複数のバーコード配列のうちの、各バーコード配列は、複数のバーコード配列中の他のあらゆるバーコード配列と異なる。一部の実施形態では、第2のアダプターのオリゴヌクレオチドについてのバーコードを、少なくとも第1のアダプターのオリゴヌクレオチドについてのバーコードと独立に選択することができる。一部の実施形態では、対をなすアダプターが、同じであるか、または異なる1種または複数のバーコードを含むように、バーコードを有する、第1のアダプターのオリゴヌクレオチドと、第2のアダプターのオリゴヌクレオチドとを対合させることができる。一部の実施形態では、本発明の方法は、標的ポリヌクレオチドが由来する試料を、標的ポリヌクレオチドが接続されるバーコード配列に基づき同定するステップをさらに含みうる。バーコードは、例えば、標的ポリヌクレオチドへと接続されると、標的ポリヌクレオチドが由来した試料の識別子として役立つ核酸配列を含みうる。
目的のプローブ標的領域である配列領域/鎖の増幅準備のできた産物の生成に適しうる、多様なアダプター設計を想定することができる。一部の実施形態では、少なくとも第1のアダプターは、一本鎖の場合もあり、二本鎖の場合もある。例えば、二本鎖の場合、アダプターの2つの鎖は、自己相補的な場合もあり、非相補的な場合もあり、部分的に相補的な場合もある。近年、アダプター設計において、多くの改善がなされており、これにより、アダプター二量体の発生が低減されている。これらの改善は、ヌクレオチド類似体および構造化されたオリゴヌクレオチドの使用を含む場合があり、ライゲーション反応における高濃度のオリゴヌクレオチドの使用を可能としている。ライゲーション反応における高濃度のアダプターにより、研究者は、150コピーという少数のゲノムコピーから高品質のライブラリーを生成することが可能となっている。アダプターの、DNA断片、特に、目的の領域を含有する断片の末端へのライゲーションは、本発明の方法を実行するのに適しうる。核酸修飾酵素および結果として得られる二本鎖DNAの切断の選択に応じて、多様なライゲーションモダリティーを想定することができる。例えば、目的の標的領域/配列を含む平滑末端産物を生成する場合は、平滑末端ライゲーションが適しうる。代替的に、公知の配列特異性の制限酵素を使用して、切断を実行し、公知の配列突出を伴う切断部位の生成をもたらしうる場合は、目的の配列領域の切断部位との、アダプターのハイブリダイゼーションと、後続のライゲーションとを可能とするように、アダプターの適切な末端を設計することができる。アダプターの効率的かつ迅速なライゲーションのための試薬および方法は、市販されており、当技術分野でも公知である。
核酸修飾酵素
核酸(NA)修飾酵素は、DNA特異的修飾酵素でありうる。NA修飾酵素は、二本鎖DNAに対する特異性について選択することができる。酵素は、二重鎖特異的エンドヌクレアーゼ、平滑末端頻発カッター制限酵素または他の制限酵素であり得る。平滑末端カッターの例は、DraIまたはSmaIを含みうる。NA修飾酵素は、New England Biolabsにより提供されている酵素でありうる。NA修飾酵素は、ホーミングエンドヌクレアーゼ(ホーミングエンドヌクレアーゼとは、厳密に規定された認識配列を有さないエンドヌクレアーゼでありうる)でありうる。NA修飾酵素は、ニッキングエンドヌクレアーゼ(ニッキングエンドヌクレアーゼとは、二本鎖DNA基質内のDNAの1つの鎖だけを切断しうる、エンドヌクレアーゼでありうる)でありうる。NA修飾酵素は、高忠実度エンドヌクレアーゼ(高忠実度エンドヌクレアーゼとは、エンドヌクレアーゼの野生型バージョンより「スター活性」が小さくなるように操作された、エンドヌクレアーゼでありうる)でありうる。
DNA依存性DNAポリメラーゼ
本発明の方法および組成物における使用のためのDNA依存性DNAポリメラーゼは、本発明の方法に従うプローブ標的領域またはプライマーの伸長をもたらすことが可能でありうる。一部の実施形態では、DNA依存性DNAポリメラーゼは、DNA鋳型および/またはcDNA鋳型の存在下で、プローブ標的領域、核酸プライマーなどを伸長させることが可能なDNAポリメラーゼでありうる。本発明の方法に適する、例示的なDNA依存性DNAポリメラーゼは、3’−エクソヌクレアーゼを伴うか、またはこれを伴わない、Klenowポリメラーゼ、Bst DNAポリメラーゼ、Bsuポリメラーゼ、phi29 DNAポリメラーゼ、Ventポリメラーゼ、Deep Ventポリメラーゼ、Taqポリメラーゼ、T4ポリメラーゼ、およびE.coli DNAポリメラーゼ1、これらの誘導体、またはポリメラーゼの混合物を含むがこれらに限定されない。場合によって、ポリメラーゼは、5’−エクソヌクレアーゼ活性を含まない。他の場合において、ポリメラーゼは、5’エクソヌクレアーゼ活性を含む。場合によって、本発明のプライマー伸長産物またはオリゴヌクレオチド伸長産物は、例えば、Bstポリメラーゼなど、強い鎖置換活性を含むポリメラーゼを使用して実施することができる。他の場合において、本発明のプライマー伸長は、弱い鎖置換活性を含むか、または鎖置換活性を含まないポリメラーゼを使用して実施することができる。当業者は、プライマー伸長ステップにおける、鎖置換活性の使用の利点および欠点、ならびに、どのポリメラーゼが、鎖置換活性をもたらすと予測されうるのか(例えば、New England Biolabs、「Polymerases」を参照されたい)を認識することができる。
増幅法
本明細書で記載される方法、組成物、およびキットは、大規模並行シークエンシング(すなわち、次世代シークエンシング法)、目的の配列領域集団を濃縮したライブラリーの生成、またはハイブリダイゼーションプラットフォームなど、下流における適用のための、増幅準備のできた産物を生成するのに有用でありうる。当技術分野では、増幅法が周知である。適切な増幅反応は、指数関数的増幅の場合もあり、等温増幅の場合もあり、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、線形増幅、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、単一プライマー等温増幅(SPIA;例えば、米国特許第6,251,639号を参照されたい)、Ribo−SPIA、またはこれらの組み合わせを含むがこれらに限定されない、任意のDNA増幅反応を含みうる。場合によって、鋳型核酸をもたらすための増幅法は、例えば、cDNAの生成のために一般になされうる増幅など、少数ラウンド(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30ラウンドなど)の増幅だけが実施されうるように、限定的な条件下で実施することができる。増幅のラウンド数は、約1〜30、1〜20、1〜15、1〜10、5〜30、10〜30、15〜30、20〜30、10〜30、15〜30、20〜30、または25〜30でありうる。
PCRとは、好熱性の鋳型依存性ポリヌクレオチドポリメラーゼによる、変性、オリゴヌクレオチドプライマーのアニーリング、およびプライマーの伸長によるサイクルの反復に基づく、in vitroにおける増幅手順であって、プライマーに挟まれたポリヌクレオチド分析物の所望の配列のコピーの指数関数的増大を結果としてもたらす増幅手順である。DNAの対向する鎖へとアニールする、2つの異なるPCRプライマーは、ポリメラーゼに触媒される、一方のプライマーの伸長産物が、他方のプライマーのための鋳型鎖として役立ち得、その長さが、オリゴヌクレオチドプライマーの5’末端の間の距離により規定されうる、個別の二本鎖断片の蓄積をもたらすように配置することができる。さらなる増幅法については、参照によりその全体において本明細書に組み込まれる、2013年1月25日に出願されたUSSN13/750768において、さらに記載されている。
一部の実施形態では、増幅は、例えば、ポリメラーゼ連鎖反応(PCR)による、DNAの特定二本鎖配列の酵素的増幅における、指数関数的増幅でありうる。他の実施形態では、増幅法は、線形増幅でありうる。他の実施形態では、増幅法は、等温増幅でありうる。
下流における適用
本発明の一態様は、本明細書で開示される方法および組成物を、次世代シークエンシングまたはハイブリダイゼーションプラットフォームなど、下流における解析のために、目的の生体材料の喪失を最小限として、効率的かつ費用効果的に活用しうることである。本明細書で開示される方法はまた、目的の選択的ゲノム領域についての遺伝子情報の解析(例えば、SNP、コピー数変異、または他の疾患マーカーの解析)においても使用しうるほか、トランスクリプトーム解析、および目的の選択的領域と相互作用しうるゲノム領域による、デジタル遺伝子発現においても使用することができる。
シークエンシング
例えば、本発明の方法は、米国特許第5,750,341号;同第6,306,597号;および同第5,969,119号において記載されている通り、Illuminaにより市販されている方法によるシークエンシングに有用でありうる。一般に、二本鎖断片ポリヌクレオチドは、一方の末端(例えば、(A)/(A’))または両方の末端(例えば、(A)/(A’)および(C)/(C’))においてタグ付けされた、増幅された核酸配列を生成するように、本発明の方法により調製することができる。場合によって、本発明の方法により(例えば、SPIAまたは線形PCRにより)、一方の末端または両方の末端においてタグ付けされた一本鎖核酸を増幅することもできる。次いで、結果として得られる核酸を変性させることができ、増幅された一本鎖ポリヌクレオチドを、フローセルチャネルの内部表面へとランダムに付着させることができる。標識されていないヌクレオチドを添加して、二本鎖DNAの稠密なクラスターを生成する、固相架橋増幅を開始することができる。第1塩基のシークエンシングサイクルを開始するために、4つの、標識された可逆性ターミネーター、プライマー、およびDNAポリメラーゼを添加することができる。レーザーによる励起の後、フローセル上の各クラスターからの蛍光をイメージングすることができる。次いで、各クラスターについて、第1塩基の正体を記録することができる。シークエンシングのサイクルは、断片の配列を一度に1塩基ずつ決定するように実施することができる。
一部の実施形態では、本発明の方法は、Applied Biosystemsにより市販されているライゲーションによるシークエンシング法(例えば、SOLiDシークエンシング)を介するシークエンシングのための標的ポリヌクレオチドを調製するのに有用でありうる。他の実施形態では、方法は、454/Roche Life Sciencesにより市販されている方法であって、Margulies ら、Nature(2005年)、437巻:376〜380頁(2005年);ならびに米国特許第7,244,559号;同第7,335,762号;同第7,211,390号;同第7,244,567号;同第7,264,929号;および同第7,323,305号において記載されている方法および装置を含むがこれらに限定されない方法を使用する合成を介するシークエンシングのための標的ポリヌクレオチドを調製するのに有用でありうる。他の実施形態では、方法は、Helicos BioSciences Corporation(Cambridge、Mass.)により市販されている方法であって、米国出願第11/167,046号、および米国特許第7,501,245号;同第7,491,498号;同第7,276,720号;ならびに米国特許出願公開第US20090061439号;同第US20080087826号;同第US20060286566号;同第US20060024711号;同第US20060024678号;同第US20080213770号;および同第US20080103058号において記載されている方法を介するシークエンシングのための標的ポリヌクレオチドを調製するのに有用でありうる。他の実施形態では、方法は、Pacific Biosciencesにより市販されている方法であって、米国特許第7,462,452号;同第7,476,504号;同第7,405,281号;同第7,170,050号;同第7,462,468号;同第7,476,503号;同第7,315,019号;同第7,302,146号;同第7,313,308号;および米国出願公開第US20090029385号;同第US20090068655号;同第US20090024331号;および同第US20080206764号において記載されている方法を介するシークエンシングのための標的ポリヌクレオチドを調製するのに有用でありうる。
本明細書で提示される発明の方法において使用されうるシークエンシング法の別の例は、Ion Torrentにより提供されている半導体シークエンシング(例えば、Ion Personal Genome Machine(PGM)を使用する)である。Ion Torrentによる技術では、複数の層、例えば、マイクロ加工されたウェルを伴う層、イオン感受性層、およびイオンセンサー層を伴う半導体チップを使用しうる。核酸を、ウェルへと導入することができる、例えば、単一の核酸のクローン集団を、単一のビーズへと付着させ、ビーズを、ウェルへと導入することができる。ビーズ上の核酸のシークエンシングを開始するために、1種類のデオキシリボヌクレオチド(例えば、dATP、dCTP、dGTP、またはdTTP)を、ウェルへと導入することができる。DNAポリメラーゼにより、1種または複数のヌクレオチドを組み込む場合、ウェル内では、プロトン(水素イオン)が放出される可能性があり、これを、イオンセンサーにより検出することができる。次いで、半導体チップを洗浄し、プロセスを、異なるデオキシリボヌクレオチドで反復することができる。半導体チップのウェル内では、複数の核酸を、シークエンシングすることができる。半導体チップは、DNAをシークエンシングする化学感受性電界効果トランジスター(chemFET)アレイ(例えば、米国特許出願公開第20090026082号において記載されている)を含みうる。シークエンシングプライマーの3’末端における新たな核酸鎖への、1種または複数のトリホスフェートの組込みは、電流の変化を介して、chemFETにより検出することができる。アレイは、複数のchemFETセンサーを有しうる。
本明細書で提示される発明の方法において使用されうるシークエンシング法の別の例は、ナノ小孔シークエンシング(例えば、Soni G VおよびMeller A.(2007年)、Clin Chem、53巻:1996〜2001頁を参照されたい)である。ナノ小孔は、直径1ナノメートルのオーダーの小型の穴でありうる。ナノ小孔を、伝導性流体中に浸漬し、これを横切る電位を印加する結果として、ナノ小孔を通るイオンの伝導に起因する、微弱な電流がもたらされる。流れる電流の量は、ナノ小孔のサイズに感受性である。DNA分子が、ナノ小孔を通過するとき、DNA分子上の各ヌクレオチドは、ナノ小孔を、異なる程度に塞ぐ。こうして、DNA分子がナノ小孔を通過するときの、ナノ小孔を通過する電流の変化は、DNA配列のリーディングを表しうる。
遺伝子解析
本発明の方法は、目的の選択的ゲノム領域についての遺伝子情報の解析のほか、目的の選択的領域と相互作用しうるゲノム領域内でも使用することができる。本明細書で開示される増幅法は、遺伝子解析のための、当技術分野で公知のデバイス、キット、および方法であって、米国特許第6,449,562号、同第6,287,766号、同第7,361,468号、同第7,414,117号、同第6,225,109号、および同第6,110,709号において見出されるデバイス、キット、および方法などであるがこれらに限定されない、デバイス、キット、および方法において使用することができる。場合によって、本発明の増幅法を使用して、多型の存在または非存在を決定するDNAハイブリダイゼーション研究のために、目的の標的核酸を増幅することができる。多型または対立遺伝子は、遺伝子疾患などの疾患または状態と関連しうる。他の場合、多型、例えば、嗜癖、変性および加齢関連状態、がんなどと関連する多型は、疾患または状態への易罹患性と関連する。他の場合、多型は、冠動脈の健康の増大など、有益な形質と関連する場合もあり、HIVまたはマラリアなどの疾患に対する抵抗性と関連する場合もあり、骨粗鬆症、アルツハイマー病、または認知症などの変性疾患に対する抵抗性と関連する場合もある。
デジタル測定値
本発明の方法は、遺伝子発現、疾患と関連する遺伝子発現パターンについてのデジタル解析であって、診断、予後診断、および検出のほか、遺伝障害、例えば、染色体または遺伝子の転座、欠失、重複、および欠損の同定、ならびに目的の選択的ゲノム領域および目的の選択的領域と相互作用しうるゲノム領域についての研究も含むデジタル解析において使用することができる。一部の実施形態では、デジタル遺伝子発現(DGE)の決定またはコピー数変異(CNV)のデジタル測定値を、リード総数中の遺伝子リード数を定量化することにより達成することができる。一部の実施形態では、ペアドエンドシークエンシングを実施することができる。シークエンシングは、当業者に公知の様々なプラットフォーム上で、ハイスループットシークエンシングを介して実施することができる。一部の実施形態では、シークエンシングデータ/リードを、ゲノム/トランスクリプトーム(cDNAの場合)へとマッピングする。一部の実施形態では、米国特許出願公開第61/989,113号において記載されている通り、配列データを評価して、重複リードを除去することができる。一部の実施形態では、プローブ配列を、重複を除外した配列データセット内でそれらが出現する回数であって、出発試料中に存在する元の核酸分子のコピーの数の尺度としての回数について計数する。
一部の実施形態では、特定核酸内の、その相補的なプローブ標的領域へと適正にアニールするプローブについての検証を評価することができる。一実施形態では、適正にアニールするプローブについての評価は、ペアドエンドアラインメントにより行うことができ、両方の末端である、フォワードリードおよびリバースリードが、予測される通りにアラインされれば、プローブを計数する。一部の実施形態では、適正にアニールするプローブについての評価は、プローブ配列の3’の特定核酸についてシークエンシングされるプローブ配列+20塩基を検討することにより行うことができ、重複解析のためには、フォワードリードだけを使用することができる。プローブ+20がアラインされれば、プローブは、所望の場所に存在した。
ランダム配列ではなく、プローブ配列計数を使用する利点は、各測定について、同じ配列を、異なる試料にわたり使用するため、コピー数解析の簡素化である。プローブ計数は、マルチプレックスシークエンシングを介する、高い試料スループット(例えば、シークエンシングラン1つ当たりの試料少なくとも96例)を可能とする。標的化されたRNAシークエンシングは、コード遺伝子または非コード遺伝子、特定のエクソン、UTR、RNAアイソフォーム、および遺伝子融合体を標的化する能力を拡張しながら、90%を超えるリードが、標的化された遺伝子に由来するので、RNAシークエンシング解析についての高レベルの焦点をもたらしうる。プローブ計数はまた、エクソンの使用、転写物のサイズ、および配列依存性増幅/シークエンシングのバイアスを低減することも可能であり、PCR重複の除去を可能とする。
デジタル解析は、定量化の前にPCR重複を決定することにより実施することができる。Illuminaシークエンシング技術を使用するこのような解析を、図6A〜6Cに例示するが、図1も参照する。略述すると、gDNAについて例示されるフォワードリード(図1)は、図6Aにおいて示される通り、フォワード配列32のうちの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35塩基などの配列をシークエンシングするフォワードプライマー30であって、特定核酸10の配列へと伸長し、フォワードリード配列32を、ゲノム(またはcDNAの場合のトランスクリプトーム)領域へとマッピングするのに使用しうるフォワードプライマー30により活用されるフォワードプライミング部位12を含む。インデックスリードは、図6Bにおいて示される通り、試料の起源(例えば、ライブラリーと共通のライブラリーバーコード)を指し示しうる。インデックスリードは、インデックスプライマー34と共に、インデックスプライミング部位18において始まり、インデックス塩基(例えば、バーコード配列)16およびn−ランダム塩基14のうち、シークエンシングされる、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10塩基などを含み、インデックスリード36をもたらす。一部の実施形態では、インデックス化リード塩基配列およびN−ランダム塩基36と組み合わせたフォワードリード配列32は、各特定核酸配列のためのライゲーション事象に固有である。一部の実施形態では、フォワードリード配列32の開始部位のゲノム(cDNAの場合のトランスクリプトーム)座標に、インデックスリード配列36のN−ランダム塩基14を加えた組み合わせを使用して、各プローブ伸長産物21または22についてのPCR重複を決定し、こうして、プローブ標的領域50または60を有する、対応する特定核酸配列10または9を決定することができる。リバースリード44は、図6Cに例示される通り、プローブが、適正なゲノム/トランスクリプトーム位置へとアニールされ、こうして、その相補的なプローブ標的領域へとアニールされたことを検証する。フローセル配列33および35は、濃縮時に、プローブ伸長産物の末端に追加する。
デジタル解析は、定量化の前にPCR重複を決定することにより実施することができる。このような解析を、図8A〜8Cに例示するが、図1および図5も参照する。プローブ配列を有するリード44(図5)は、図8Aに例示される通り、プローブが、適正なゲノム/トランスクリプトーム位置へとアニールされ、こうして、その相補的なプローブ標的領域へとアニールされたことを検証する。プローブ配列を有するリードは、15塩基のリンカー38、40塩基のオリゴヌクレオチドの遺伝子特異的配列50または60(プローブ標的領域)、およびゲノム(またはトランスクリプトーム)データベースで表される40塩基のオリゴヌクレオチドの遺伝子特異的配列50または60に対して、約10塩基3’側にある、X塩基(例えば、10塩基)の領域10を含む。gDNAについて例示される、特定核酸配列10を有するリード(図1)は、図8Bにおいて示される通り、配列32のうちの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35塩基などの配列をシークエンシングするプライマー30(図5)であって、特定核酸9または10の配列へと伸長し、特定核酸配列を有するリード32を、ゲノム(またはcDNAの場合のトランスクリプトーム)領域へとマッピングするのに使用しうるプライマー30により活用されるプライミング部位12を含む。インデックス配列およびN6配列を含む配列リードは、図8Cにおいて示される通り、試料の起源(例えば、ライブラリーと共通のライブラリーバーコード)を指し示しうる。インデックスリードプライマー34は、インデックスプライミング部位18へとアニールし、インデックス塩基(例えば、バーコード配列)16およびn−ランダム塩基14の、シークエンシングされる、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10塩基などのうちの少なくとも1つを含むリード配列36を産出し、シークエンシングリード36をもたらす。一部の実施形態では、特定核酸配列を有するリード(図8A)により、プローブの、プローブ標的領域へのアニーリングの特異性を検証する。一部の実施形態では、特定核酸配列を有するリードを、プローブ標的配列データベースへとビニングするが、例えば、特定核酸配列9または10のうちの10塩基は、固有のプローブビン内にアラインされる必要があり、そのようにしてマッチングさせることにより、プローブの、そのプローブ標的領域へのアニーリングの特異性が検証される。一部の実施形態では、特定核酸配列を有するリードを、約10塩基のオリゴヌクレオチドマッチと比較し、配列がビン内で固有であるのかどうかを決定する。次いで、共通リードを、対応するN6と比較し、同一なN6リードを、単一のエントリーとして、併合し、1回だけ計数する。一部の実施形態では、インデックスリードおよびN6リードのうちの少なくとも1つを有するリードは、約14塩基の長さでありうる。一部の実施形態では、特定核酸配列を有するリードは、約10塩基でありうる。一部の実施形態では、プローブ配列を有するリードは、約65塩基(リンカー配列が約15塩基、プローブ標的領域(ゲノム/トランスクリプトーム内で表される遺伝子特異的配列)が約40塩基、およびプローブ標的領域に対して3’側にある約10塩基)でありうる。一部の実施形態では、参照表(look up table)を使用することができる。一部の実施形態では、プローブ配列を計数する。一部の実施形態では、N6配列は、排除する重複を指定する。
一部の実施形態では、リード配列36と組み合わせたリード配列32は、各特定核酸配列のためのライゲーション事象に固有である。一部の実施形態では、リード配列32の開始部位のゲノム(cDNAの場合のトランスクリプトーム)座標に、リード配列36のN−ランダム塩基14を加えた組み合わせを使用して、各プローブ伸長産物22または21についてのPCR重複を決定し、プローブ標的領域50または60を有する、対応する特定核酸配列10または9を決定することができる。一部の実施形態では、リード配列44は、図6Cに例示される通り、プローブが、適正なゲノム/トランスクリプトーム位置へとアニールされ、また、その相補的なプローブ標的領域50または60へもアニールされたことを検証する。
一部の実施形態では、上記で開示した通り、DGEまたはCNVの定量化の前に、重複リードを除去する。次いで、ゲノム/トランスクリプトーム内で適正にマッピングされたプローブ配列を計数する。一部の実施形態では、DGEまたはCNVを、各プローブ配列の計数により決定することができる。一部の実施形態では、プローブ計数を、例えば、遺伝子の全長において、プローブにわたり計数を平均することにより組み合わせることができる。一部の実施形態では、リード計数は、試料間で正規化することができ、例えば、リード計数を、全リードに対する百分率として正規化することができる。一部の実施形態では、リード計数は、例えば、各プローブ配列を計数する前に、全リード計数を正規化することにより正規化することができる。一部の実施形態では、リード計数は、ゲノムへとアラインさせたリードまたはプローブ標的領域に由来するリードの数により正規化することができる。
図5に例示される通り、シークエンシングライブラリーの構造およびシークエンシングリードの同定は、ハイスループットシークエンシング法を使用するマルチプレックスの定量化もたらす。図6を参照しながら、図7Aに例示される通り、フォワードプライマー30は、フォワードリード1のプライミング部位12と相補的である可能性があり、リードは、リード32を、ゲノムまたはトランスクリプトームへとマッピングするのに十分な程度に特定核酸10(gDNA)または13(cDNA)へと伸長させることができる。加えて、図7Bに例示されるインデックスリード配列は、相補的プライマー34と、「インデックス塩基」16および「n−ランダム塩基」14へのリーディング36とを使用して、「インデックスプライミング部位」18から読み取ることができる。加えて、「リバースリード配列」も決定することができる(図5、図6および図7C)。リバース配列プライマー42は、「リバースリードプライミング部位」38とハイブリダイズし、プローブ50または60(それぞれ、図1、図2のgDNAまたはcDNAであり、図6に例示される)(プローブ標的領域部位)、および少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10などの隣接塩基10(gDNA)または13(cDNA)を読み通して44、プローブ伸長産物22または21(gDNAまたはcDNA、それぞれ、図1、図2)が、適正なゲノムまたはトランスクリプトームとハイブリダイズするプローブの産物であったのかどうかを検証する。ゲノム内またはトランスクリプトーム内に適正にマッピングされたプローブ配列を計数する。DGEまたはCNVを、各プローブ配列の計数により決定することもでき、かつ/またはプローブ計数を、特定核酸配列に対応する遺伝子の長さにおいて、プローブにわたり計数を平均することを含むがこれらに限定されないことと組み合わせることもできる。リード計数は、試料間で正規化することができる。一部の実施形態では、リード計数は、試料間で正規化することができ、例えば、リード計数を、全リードに対する百分率として正規化することができる。一部の実施形態では、リード計数は、例えば、各プローブ配列を計数する前に、全リード計数を正規化することにより正規化することができる。一部の実施形態では、リード計数は、ゲノムへとアラインさせたリードまたはプローブ標的領域に由来するリードの数により正規化することができる。NGS配列解析の当業者には、正規化のための他の方法も周知である。
図9は、デジタル解析のために生成されるシークエンシングライブラリーの構築についてのグラフによる例示を提示する。
図10は、図9に例示される通りに構築されたシークエンシングライブラリーから生成されるシークエンシングデータの解析についてのグラフによる例示を提示する。
一部の実施形態では、開示される発明の方法は、例えば、組織、腫瘍、循環細胞についての遺伝子発現特徴および遺伝子発現特性であるがこれらに限定されない、遺伝子発現特徴および遺伝子発現特性を解析するほか、罹患患者を、非罹患患者と対比させて比較し、患者の正常組織を、患者の罹患組織と対比させて比較するためのデジタル測定値のために使用することができる。一部の実施形態では、開示される発明の方法は、コピー数変異(CNV)のデジタル定量化のために使用することができる。CNVは、ゲノム内のDNAの変更であって、DNA区画のコピー数の異常な変異または正常な変異を有する細胞を結果としてもたらす変更を指し示しうる。CNVにより、大きなゲノム領域の欠失であって、染色体内で正常より少ない数を結果としてもたらす欠失、または大きなゲノム領域の重複であって、染色体内で通常を超える数を有する重複を同定することができる。CNVと、疾患に対する易罹患性または抵抗性との間には、関連が存在する。このような測定値は、診断、疾患病期分類、予後診断、疾患の進行、ウイルス負荷の決定のほか、遺伝子発現またはCNVの、治療剤の有効性または効能に対する影響であって、当業者に公知の影響などの決定にも有用でありうる。
別の態様では、開示される方法により増幅される、第1の核酸断片の配列を含む組成物が開示される。一部の実施形態では、第1の核酸断片または非断片化核酸試料は、同じヒトから選択されるヒト試料:単一の細胞、非罹患組織、罹患組織、FFPE試料または新鮮凍結試料、組織、臓器、腫瘍、患者から採取された有機流体の検体、遊離循環核酸、真菌、原核生物、およびウイルスに由来しうる。一部の実施形態では、第2の核酸断片または非断片化核酸試料は、罹患組織の場合もあり、非疾患組織の場合もあり、同じ日に回収される場合もあり、別の日に回収される場合もあり、異なる試料から回収される場合もあり、異なる方法により調製された試料から回収される場合もあり異なる精製法によって試料から回収される場合もあり、これらの組み合わせの場合もある組織を有する、同じヒトから選択される試料に由来しうる。一部の実施形態では、第1のアダプター配列を含む、第1の核酸断片または非断片化核酸試料をさらに濃縮し、大規模並行シークエンシングのために調製することができる。一部の実施形態では、第1の核酸断片または非断片化核酸試料は、二本鎖でありうる。一部の実施形態では、第1のアダプター配列を、前記第1の核酸断片または非断片化核酸試料の5’末端へと追加することができる。一部の実施形態では、第1のアダプター配列は、核酸修飾酵素のための制限部位および/または切断部位を含む。
さらに別の態様では、開示される方法は、アダプターを伴う、第2のヒト核酸断片または第2の非断片化核酸試料を有しうる。一部の実施形態では、第2のヒト試料は、第1の核酸試料が由来するヒトと異なるヒトに由来しうる。一部の実施形態では、第2の核酸断片または第2の非断片化核酸試料は、罹患組織の場合もあり、非疾患組織の場合もあり、同じ日に回収される場合もあり、別の日に回収される場合もあり、異なる試料から回収される場合もあり、異なる方法により調製された試料から回収される場合もあり異なる精製法によって試料から回収される場合もあり、これらの組み合わせの場合もある組織を有する、同じヒトから選択される試料でありうる。一部の実施形態では、第2の核酸断片または第2の非断片化核酸試料は、罹患組織の場合もあり、非疾患組織の場合もあり、同じ日に回収される場合もあり、別の日に回収される場合もあり、異なる試料から回収される場合もあり、異なる方法により調製された試料から回収される場合もあり異なる精製法によって試料から回収される場合もあり、これらの組み合わせの場合もある組織を有する、異なるヒトから選択される試料でありうる。
さらなる態様では、既に開示された方法に従い、第2のヒト核酸を定量化するための方法が開示される。
キット
本明細書で記載される組成物のいずれも、キット中に組み入れることができる。非限定的な例では、適切な容器手段内のキットは、公知の配列を伴う、1つのアダプターと、配列特異的部分と、配列が公知である共通部分とを有する、1つのプローブと、少なくともアダプターまたはプローブの共通部分に対する、直接の部分的な相補体を有する、1つのフォワードプライマーと、アダプターまたはプローブの共通部分に対する、直接の部分的な相補体を有する、1つのリバースプライマーとを含む。キットは、ライゲーション、標的の濃縮、およびライブラリーの調製に有用な、さらなるアダプター、プライマー、および/または試薬もさらに含有しうる。キットは任意選択で、DNAポリメラーゼもさらに含有しうる。キットは任意選択で、増幅のための試薬、例えば、PCR増幅法に有用な試薬もさらに含有しうる。キットは任意選択で、シークエンシングのための試薬、例えば、次世代大規模並行シークエンシング法に有用な試薬もさらに含有しうる。
キットの容器は、構成要素を入れることができ、好ましくは、適切にアリコート分割しうる、少なくとも1つのバイアル、試験管、フラスコ、ボトル、シリンジ、または他の容器を含みうる。キット中に、1つを超える構成要素が存在する場合、キットはまた、さらなる構成要素を個別に入れることのできる、第2の容器、第3の容器、または他のさらなる容器も含有しうる。しかし、容器内には、構成要素の多様な組み合わせを含有させることもできる。
キットの構成要素を、1種または複数の溶液により提供しうる場合、溶液は、水溶液でありうる。しかし、キットの構成要素は、乾燥粉末として提供することもできる。試薬および/または成分を乾燥粉末として提供する場合、粉末は、適切な溶媒を添加することにより再構成することができる。
キットは、キットの構成要素を用いるための指示のほか、キット中に含有されていない、他の任意の試薬の使用のための指示も含みうる。指示は、実装されうる変更を含みうる。
(実施例I:2つの試料の間の、特定転写物の示差的発現レベル)
100ngの全RNAから出発して、製造元の推奨に従い、Ovation(登録商標)Target Enrichment cDNA Module(NuGEN型番9301−32)を使用して、二本鎖cDNAを作った。製造元の指示に従い、cDNA試料を、NuGEN Ovation(登録商標)Target Enrichment Kit(NuGEN型番0400−32)へと直接添加した。ハイブリダイゼーションにおいて使用されるプローブは、270の遺伝子を標的化するプローブのプール(NuGEN Ovation(登録商標)Target Enrichment System;注文情報については、NuGENに照会されたい)であった。
結果として得られるライブラリーを、2nMへと希釈し、ペアドエンドシークエンシングを、Illumina(登録商標)MiSeq(登録商標)DNA Sequencer上で、濃縮されたライブラリーに対して実施した。以下のペアドエンドシリーズを、75塩基のフォワードリード(R1)、75塩基リバースリード(R2)、14塩基のインデックスリード(I1)で試行した。
データ解析
ペアドエンドアラインメントを、フォワードシークエンシングリードおよびリバースシークエンシングリードについて実施し、デフォルトの設定でTopHat Alignmentソフトウェア(v.2.0.10)を使用して、各々を、ヒトゲノムversion hg19へとマッピングした。標的化される領域へとマッピングされなかったリードのペアは、排除した。次いで、開始座標が同じフォワードリードを、インデックス配列のN6配列(n−ランダム配列)について評価した。N6配列が同一な場合は、リードに、重複とマークし、群のうちの1つのリードだけを、単一の別々の核酸分子に由来するリードとして保持した。特許出願であるUSSN61/989,113において記載されている通りに、同定された重複リードにマークし、次いで、除去した(重複のマーキング)。ねらい通りで(on target)重複を除外したリードペアについてフィルタリングした後で、Trimgalore(v.0.3.1)を使用して、フィルタリングされたリバースリード配列をトリミングし、アダプターおよびリンカー配列を除去し、FASTX Trimmerソフトウェアを使用して、最初の35塩基へと短縮した。次いで、デフォルトパラメータおよび逆相補体マッチングを防止する「−norc」によるBowtie Alignmentソフトウェア(v.1.0.0)を使用して、トリミングされたリバースリード配列を、標的化オリゴヌクレオチドの配列を含有する、プローブ配列ファイル(使用されるプローブにより提示される)へとマッピングした。アラインさせたリバースリードを、それらの元のプライマーと関連させ、計数した。各プローブが検出される回数は、特定転写物が、元の試料中に存在する回数についての尺度であった。表1は、リード計数を試料間で正規化したDGEデータを例示する。
表1に描示される通り、混合したがん細胞系のRNA試料(UHR、ユニバーサルヒト基準RNA)における、TAF15遺伝子の発現レベルは、H2228細胞(腺がん;非小細胞肺がん)と比較して、比較的低レベルである。いずれの細胞型も、CCND3の発現レベルは、ほぼ同等である。逆に、UHRによるPBX1の発現は、H2228と比較して高度である。
(実施例II:ゲノムアラインメントを伴わない2つの試料の間の、特定転写物の示差的発現レベル)
100ngの全RNAから出発して、製造元の推奨に従い、Ovation(登録商標)Target Enrichment cDNA Module(NuGEN型番9301−32)を使用して、二本鎖cDNAを作る。製造元の指示に従い、cDNA試料を、NuGEN Ovation(登録商標)Target Enrichment Kit(NuGEN型番0400−32)へと直接添加する。ハイブリダイゼーションにおいて使用されるプローブは、270の遺伝子を標的化するプローブのプール(NuGEN Ovation(登録商標)Target Enrichment System;注文情報については、NuGENに照会されたい)である。
結果として得られるライブラリーを、2nMへと希釈し、ペアドエンドシークエンシングを、Illumina(登録商標)MiSeq(登録商標)DNA Sequencer上で、濃縮されたライブラリーに対して実施する。以下のペアドエンドシリーズを、75塩基のフォワードリード(R1)、75塩基リバースリード(R2)、14塩基のインデックスリード(I1)で試行する。
データ解析
5’末端において、15bpのリンカー配列および0〜3塩基の多様性配列についてのパターンマッチを伴うリバースリード配列をトリミングする。リンカーのトリミングの後で、BEETLソフトウェア(version 1.1.0;https://github.com/BEETL/BEETL)を使用して、リバースリードのうちの最初の40bpを、各リード内の12マーのタイル状(tiled)のプローブにマッチするように、Burrows−Wheeler変換(BWT)へと構築する。次いで、各リードペアに、リバースリードへの12マーのマッチが最も多いプローブに由来すると標識する。次いで、インデックス配列のN6配列(n−ランダム配列)を、フォワードリードの最初の10塩基と共に解析することにより、プローブごとに、標識されたリードペアの重複を除外した。リードが同じプローブに由来し、N6配列が同一であり、フォワードリードの最初の10塩基が同じである場合は、リードに、重複とマークし、群のうちの1つのリードだけを、単一の別々の核酸分子に由来するリードとして保持した。重複を除外したリードペアについてフィルタリングした後で、各プローブについて、重複を除外した総リード計数を得た。各プローブが検出される回数は、特異的なプローブが、元の試料中に存在する回数についての尺度であった。次いで、特定の試料中のその遺伝子についての相対存在度の尺度としての、プローブ注釈ファイルに基づき、プローブ1つ当たりの計数を平均して、遺伝子1つ当たりの計数を得る。
(実施例III:フォワードリードをマッピングする、特定転写物の示差的発現)
100ngの全RNAから出発して、製造元の推奨に従い、Ovation(登録商標)Target Enrichment cDNA Module(NuGEN型番9301−32)を使用して、ユニバーサルヒト基準試料(UHR)の二本鎖cDNAに由来するインプットを作った。製造元の指示に従い、cDNA試料を、NuGEN Ovation(登録商標)Target Enrichment Kit(NuGEN型番0400−32)へと直接添加した。また、Promega Male Reference Sampleによる100ngのDNAインプットから出発する対照ライブラリーも、製造元の推奨に従い、Ovation(登録商標)Target Enrichment Kit(NuGEN型番0400−32)を使用して加工した。ハイブリダイゼーションにおいて使用されるプローブは、95の遺伝子を標的化するプローブのプールであった。
結果として得られるライブラリーを、2nMへと希釈し、ペアドエンドシークエンシングを、Illumina(登録商標)MiSeq(登録商標)DNA Sequencer上で、濃縮されたライブラリーに対して実施した。以下のペアドエンドシリーズを、70塩基のフォワードリード(R1)、88塩基のリバースリード(R2)、14塩基のインデックスリード(I1)で試行した。
データ解析
RNA由来のデータおよびDNA由来のデータのいずれについても、フォワードリードを品質でトリミングし、かつ、フォワードリードから、リンカーおよびアダプター配列をトリミングした。DNA由来のデータについては、−m2パラメータによるBowtie Alignmentソフトウェアを使用して、フォワードリードを、ヒトゲノムversion hg19へとマッピングした。RNA由来のデータについては、STAR Alignmentソフトウェアを使用して、フォワードリードを、リボソームRNA基準配列へとまずマッピングし、次いで、リボソームRNAへとマッピングされなかったリードは、ここでもまた、STAR Alignmentソフトウェアを使用して、ヒトversion hg19へとマッピングした。アラインメントの後で、次いで、RNAデータおよびDNAデータの両方について、開始座標が同じフォワードリードを、インデックス配列のN6配列(n−ランダム配列)について評価した。N6配列が同一な場合は、リードに、重複とマークし、群のうちの1つのリードだけを、単一の別々の核酸分子に由来するリードとして保持した。特許出願であるUSSN61/989,113において記載されている通りに、同定された重複リードにマークし、次いで、除去した(重複のマーキング)。次いで、CoverageBedソフトウェアを、デフォルトの設定で使用して、各データセットについて、各標的領域(エクソン)の任意の部分で重なり合う、重複を除外したフォワードリードを計数した。各標的領域についての計数を、データセットの全ての標的領域内の全リードについて正規化し、次いで、遺伝子内の各エクソンに対応する標的領域を、DNAデータおよびRNAデータの正規化された遺伝子計数について平均した。発現レベルが、リードを生成するプローブの能力に影響を及ぼさないので、DNA計数は、まったく均一であることが予測される。RNA計数は、発現レベルの変化に起因して、変動性を有することが予測される。この考えに基づき、次いで、正規化計数のRNA/DNAのlog2比を、RNA内の遺伝子存在度の尺度として計算した。次いで、スチューデントのT検定を使用して、各遺伝子測定値についてのp値を計算した。p値を<0.05とし、log比を>0とする遺伝子は、上方調節される遺伝子として注記し、p値を<0.05とし、log比を<0とする遺伝子は、下方調節される遺伝子として注記した。
表2は、染色体の順序で、95の遺伝子によるパネル内のRNAレベルにおける全ての遺伝子の存在度のプロットからの、顕著に上方調節された5つの遺伝子、および顕著に下方調節された5つの遺伝子を描示する(図11)。
(実施例IV:フォワードリードを使用する、特定転写物の相対発現レベル)
100ngの全RNAから出発して、製造元の推奨に従い、Ovation(登録商標)Target Enrichment cDNA Module(NuGEN型番9301−32)を使用して、二本鎖cDNAを作る。ILMNリバースフローセル配列に対応するアダプターを、各cDNA断片の5’末端へとライゲーションする。配列特異的領域に続いて、ILMNフォワードフローセル配列に対応する、15塩基のリンカーおよびXX塩基配列を含有するプローブを、標的へとアニールさせ、DNAポリメラーゼにより伸長させる。フォワードフローセル配列およびリバースフローセル配列の両方を含有するDNA断片を、NuGENにより推奨され、そして提供される条件下で、かつ試薬と共にPCRにより増幅する。
結果として得られるライブラリーを、2nMへと希釈し、ペアドエンドシークエンシングを、Illumina(登録商標)MiSeq(登録商標)DNA Sequencer上で、濃縮されたライブラリーに対して実施する。以下のペアドエンドシリーズを、70塩基のフォワードリード(R1)、および14塩基のインデックスリード(I1)で試行する。
データ解析
Trimgaloreソフトウェア(v.0.3.1)を使用して、フォワードリード配列をトリミングして、リンカー配列を除去し、FASTX Trimmerソフトウェアを使用して、最後の55塩基へと短縮する。−m2パラメータによるBowtie Alignmentソフトウェアを使用して、トリミングされたフォワードリードを、ヒトゲノムversion hg19へとマッピングする。標的化される領域へとマッピングされないリードは、排除する。ゲノム内の同じ開始座標へとマッピングされるリードを同定する。次いで、開始座標が同じリードを、インデックス配列のN6配列(n−ランダム配列)について評価する。N6配列が同一な場合は、リードのペアに、重複とマークし、単一の別々の核酸分子に由来するペアとしてだけ計数する。特許出願であるUSSN61/989,113において記載されている通りに、同定された重複リードにマークし、次いで、除去する(重複のマーキング)。デフォルトパラメータおよび逆相補体マッチングを防止する「−norc」によるBowtie Alignmentソフトウェア(v.1.0.0)を使用して、残りのリードを、標的化オリゴヌクレオチドの配列を含有する、プローブ配列ファイル(使用されるプローブにより提示される)へとマッピングする。各プローブが検出される回数は、特定転写物が、元の試料中に存在する回数についての尺度である。標的領域(エクソン)の任意の部分で重なり合うリードを計数する。遺伝子内の各エクソンに対応する計数を平均する。あるエクソンの計数が平均を2標準偏差下回る場合は、そのエクソンを棄却し、平均を計算し直す。
(実施例V:DNAシークエンシングによるコピー数変異(CNV)の決定)
2例のヒトgDNA試料(1例は、男性のトリソミーの第13染色体に由来し、もう1例は、女性のダイソミーの第13染色体に由来する)を、Covarisシステムによる超音波処理を介して、約500bpの長さへと断片化した。各試料に由来するgDNAの500bpの断片100ngを、製造元の指示に従い、NuGEN Ovation(登録商標)Target Enrichment Kit(NuGEN、型番0400−32)へと添加した。ハイブリダイゼーションにおいて使用されるプローブは、344の遺伝子を標的化するプローブのプール(NuGEN Ovation(登録商標)Cancer Panel Target Enrichment System)であった。
結果として得られるライブラリーを、2nMへと希釈し、ペアドエンドシークエンシングを、Illumina(登録商標)MiSeq(登録商標)DNA Sequencer上で、濃縮されたライブラリーに対して実施した。以下のペアドエンドシリーズを、75塩基のフォワードリード(R1)、88塩基のリバースリード(R2)、14塩基のインデックスリード(I1)で試行した。
データ解析
データは、2つの独立の方法:重複を除去する方法および重複を除去しない方法により解析した。略述すると、デフォルトの設定で、Bowtie Alignmentソフトウェア(v.1.0.0)を使用して、フォワードリードを、ヒトゲノムversion hg19に対してアラインさせた。あるフォワードリードが、同じゲノム開始座標に対してアラインすることが決定されたら、対応するインデックスリードを検討した。ゲノムの開始座標が同じであるフォワードリードに対応するインデックスリードの配列が同一である場合は、リードに、重複とマークし、単一の別々の核酸分子としてだけ計数する(特許出願であるUSSN61/989,113において記載されている通り)。残りの別々のフォワードリードに対応するリバースリードは、Bowtieを使用して、プローブデータベース内の配列に対してアラインさせた。アラインさせたリバースリードは、それらが、どのプローブ配列を表すのかに従いビニングおよび計数した。各プローブが表される回数は、出発特定核酸分子が、元の試料中に存在する回数についての尺度であった。
代替的に、重複リードを除去せず、プローブデータベース内に存在する配列に従い、40塩基のリバースリードを分類する(cataloging)ことにより、表示を確立した。プローブ基準データベース内の各代表に対してアラインさせたリードの数を決定した。データベース内の配列にマッチしないリードは、無視した。各プローブが検出される回数は、特定配列が、元の試料中に存在する回数についての尺度であった。表3は、上記で記載したいずれかの方法を使用するCNVデータであって、リード計数を、総シークエンシングリード数に対して正規化し、10を下回るあらゆる計数を解析から除去したCNVデータを描示する。トリソミー男性の試料中の所与のプローブについてのプローブ計数の、女性の野生型試料中の同じプローブの計数に対する比を、所与の染色体における全てのプローブについて平均した。
表3に描示される通り、二倍体の男性は、2つのX染色体を有する、二倍体の正常(野生型、WT)な女性と対比して、単一のX染色体を有し、これは、X染色体についてのプローブ計数の0.54の比(または重複を除去しない場合の0.55の比)により同定される。同様に、男性および女性のいずれも、第13染色体を例外とする他の全ての染色体について、同等の正規化された計数を有しうる。13トリソミーの男性は、1.47のプローブ計数比(または重複を除去しない場合の1.49)により解釈される通り、余分な第13染色体を有することから、WTの女性に対する比較と対比して、第13染色体のコピー数変異が確立される。
(実施例VI:DNAシークエンシングによる、がん細胞系内のコピー数変異(CNV)の決定)
2例のヒトgDNA試料(1例は、正常男性のプール(Promega)に由来し、もう1例は、正常男性の同じプールに由来するが、2つの余分なコピーのEGFR遺伝子およびKIT遺伝子が、各々合計4コピーずつスパイクされた(qPCRにより既に検証されている))を、Covarisシステムによる超音波処理を介して、約500bpの長さへと断片化した。各試料に由来するgDNAの500bpの断片100ngを、製造元の指示に従い、NuGEN Ovation(登録商標)Target Enrichment Kit(NuGEN、型番0400−32)へと添加した。ハイブリダイゼーションにおいて使用されるプローブは、509の遺伝子を標的化するプローブのプール(NuGEN Ovation(登録商標)Cancer Panel 2.0 Target Enrichment System)であった。
結果として得られるライブラリーを、2nMへと希釈し、ペアドエンドシークエンシングを、Illumina(登録商標)MiSeq(登録商標)DNA Sequencer上で、濃縮されたライブラリーに対して実施した。以下のペアドエンドシリーズを、70塩基のフォワードリード(R1)、88塩基のリバースリード(R2)、14塩基のインデックスリード(I1)で試行した。
データ解析
いずれのデータセットについても、fastqフォーマットのフォワードリードから、リンカー配列および低品質の塩基を、Trim Galoreソフトウェアでトリミングする。デフォルトの設定で、 Bowtie Alignmentソフトウェア(v 1.0.0)を使用して、リードを、ヒトゲノム基準配列version hg19に対してアラインさせて、リードが、最大2つの地点へとマッピングされるようにし、単一の最良のアラインメントだけを取り出した(−m2−−best)。続いて、NuGEN社特製のNuDup deduplicationソフトウェア(https://github.com/nugentechnologies/nudup)を使用して、アラインさせたリードの重複を除外した。重複を除外するために、あるリードが、同じゲノム開始座標に対してアラインすることが決定されたら、対応するインデックスリードを検討する。ゲノムの開始位置が同じであるフォワードリードに対応するインデックスリードの配列が同一である場合は、リードに、重複とマークし、セットに由来する、品質が最良である、単一のリードだけを維持する。
濃縮実験で使用されるプローブは、プローブの開始座標〜プローブの約300bp下流の範囲内に着地するリードを産出すると予測される。濃縮における全てのプローブについて、プローブ着地帯域は、bedファイル内で、「probePlus300」として規定される。各probePlus300領域内の、重複を除外したリードの数は、BEDtoolsのcoverageBedを使用して計数する。各probePlus300領域について、絶対計数を、全てのprobePlus300領域内に収まる、重複を除外した全リード(全probePlus300領域計数の合計)により、実験にわたり計数を比較するために正規化する。次に、各遺伝子またはゲノム領域について、probePlus300計数を平均する。細胞系試料に由来する各遺伝子についての、正規化された平均probePlus300計数を、正常ブレンドの男性試料計数と、比として比較する。さらに、スチューデントのt検定を使用して、多重仮説で補正されたp値を<0.005として、平均されたprobePlus300計数が、所与の遺伝子について、2つの試料間で顕著に異なる遺伝子またはゲノム領域を計算することができる。
表4は、試料中のスパイクにおける、有意なコピー数の変化およびp値について描示する。具体的には、EGFR遺伝子およびKIT遺伝子のコピー数だけが有意に増大している(2つの遺伝子を約4コピーでスパイクした場合)。
(実施例VII:DNAシークエンシングによりコピー数変異を決定するための、迅速ライブラリー生成)
2例のヒトgDNA試料(1例は、男性のトリソミーの第13染色体に由来し、もう1例は、女性のダイソミーの第13染色体に由来する)を、Covarisシステムによる超音波処理を介して、約500bpの長さへと断片化することができる。各試料に由来するgDNAの500bpの断片1ugを、プローブおよびプローブのアニーリング溶液(NuGEN Ovation(登録商標)Target Enrichment Kit、型番0400−32)の存在下、95℃で5分間にわたり熱変性させ、1分間当たり0.1℃の速度で、60℃まで冷却し、この温度で少なくとも30分間にわたり保つことができる。アニーリングステップに続き、DNAポリメラーゼと、デオキシヌクレオチドとを、溶液へと添加して、それらの鋳型核酸と特異的にアニールしたプローブを伸長させることができる。この溶液を、室温まで冷却し、製造元の推奨に沿って、組み込まれなかったプローブを、示差的なビーズの結合と、SPRIビーズからの溶出とにより除去することができる。NuGEN Ovation(登録商標)Target Enrichment Kitにより提供されている溶液により、回収された二本鎖DNAに、末端修復およびライゲーションを施すことができる。
結果として得られるライブラリーを、2nMへと希釈し、ペアドエンドシークエンシングを、Illumina(登録商標)MiSeq(登録商標)DNA Sequencer上で、濃縮されたライブラリーに対して実施することができる。以下のペアドエンドシリーズを、75塩基のフォワードリード(リード1)、75塩基のリバースリード(リード2)、14塩基のインデックスリード(リード3)で試行することができる。
データ解析
プローブデータベース内に存在する配列により、75塩基のリバースリードを分類することを介して、データを解析することができる。プローブ基準データベース内の各代表に対してアラインするリードの数を決定することができる。データベース内の配列に対してアラインしなかったリードは、無視することができる。各プローブが検出される回数は、特定配列が、元の試料中に存在した回数についての尺度でありうる。リード計数を、総シークエンシングリード数に対して正規化し、10を下回るあらゆる計数を解析から除去することができる。トリソミーの男性の試料中の所与のプローブについてのプローブ計数の、野生型の女性の試料中の同じプローブの計数に対する比は、所与の染色体における全てのプローブについて平均することができる。
この試験によるデータは、男性試料を、2つのX染色体を有する、二倍体の正常(野生型、WT)な女性と対比して、単一のX染色体を有し、したがって、X染色体についてのプローブ計数が0.5の比である試料として明らかにするであろう。同様に、男性および女性のいずれも、第13染色体を例外とする他の全ての染色体について、同等の正規化された計数を有しうるであろう。13トリソミーの男性は、余分な第13染色体を有し、この結果としてとして、WTの女性と比べて、約1.5のプローブ計数比がもたらされるであろう。
当業者は、多くの改変、代替物、および等価物が可能であることを理解するであろう。全てのこのような改変、代替物、および等価物は、本明細書に包含されることを意図する。
本発明の原理について、具体的な実施形態との関連で記載してきたが、これらの記載は、例だけを目的としてなされるものであり、本発明の範囲を限定することを意図するものではないことを明らかに理解することができる。本明細書で開示されたことは、例示および記載のために提示されている。網羅的であること、または開示されることを、記載される正確な形態へと限定することは、意図されていない。当業者には、多くの改変および変更が明らかであろう。開示されていることは、記載される技術についての、開示される実施形態の、原理および実際的な適用を最もよく説明し、これにより、他の当業者が、想定される特定の使用に適する、多様な実施形態および多様な改変を理解することを可能とするために、選び出され、記載されている。開示されることの範囲は、以下の特許請求の範囲およびそれらの等価物により規定されることが意図される。

Claims (65)

  1. 組成物中の複数の特定核酸分子を定量化するための方法であって、
    a.複数のプローブ伸長産物を生成するステップであって、各プローブ伸長産物が、特定核酸分子内のプローブ標的領域と相補的なプローブ配列を含む、ステップと;
    b.前記複数のプローブ伸長産物をシークエンシングして、前記複数のプローブ伸長産物の各々の配列を生成するステップと;
    c.前記複数のプローブ伸長産物の各々の前記配列を、基準配列データベースに対してアラインさせるステップであって、前記基準配列データベースが、プローブ配列を含む、ステップと;
    d.前記基準配列データベース内の配列との、各プローブ伸長産物の前記配列についてのアラインメントの数を決定するステップであって、前記アラインメントの数が、前記プローブ伸長産物の前記プローブが相補的である前記特定核酸分子の各々の量を指し示す、ステップと
    を含む、方法。
  2. 複数の特定核酸分子を定量化するための方法であって、
    a.複数のプローブ伸長産物を生成するステップであって、各プローブ伸長産物が、(i)第1のアダプターと、(ii)特定核酸分子内のプローブ標的領域と相補的なプローブ配列とを含む、ステップと;
    b.前記複数のプローブ伸長産物をシークエンシングして、前記複数のプローブ伸長産物の各々の配列を含む配列データを生成するステップと;
    c.前記配列データ内の、各プローブ伸長産物の前記プローブ配列の存在を同定するステップと;
    d.前記複数のプローブ伸長産物内の、前記プローブ配列の各々の数を決定するステップであって、前記プローブ配列の各々の数が、前記プローブ配列の各々が相補的である前記複数の特定核酸分子の各々の量を指し示す、ステップと
    を含む、方法。
  3. 複数の核酸分子内の、複数の特定核酸分子を定量化するための方法であって、
    a.複数の核酸分子の各々の5’末端へと、第1のアダプター配列を追加するステップと;
    b.複数のプローブを、前記複数の特定核酸分子とハイブリダイズさせるステップであって、各プローブが、特定核酸分子内のプローブ標的領域と相補的である、ステップと;
    c.各プローブを、追加された前記第1のアダプター配列へと伸長させて、前記第1のアダプター配列および第2のアダプター配列を有する複数のプローブ伸長産物を生成して、複数のプローブ伸長産物を産生するステップと;
    d.前記複数のプローブ伸長産物をシークエンシングして、前記複数のプローブ伸長産物の各々についての配列データを生成するステップと;
    e.前記複数のプローブ伸長産物の各々の配列を、プローブデータベースの基準コピー内の所定の配列に対してアラインさせるステップであって、前記所定の配列が、各プローブに特異的である、ステップと;
    f.その所定の配列に対してアラインさせた各プローブ配列の数を決定するステップであって、前記数が、前記プローブが相補的である前記特定核酸分子の量を指し示す、ステップと
    を含む、方法。
  4. 複数の特定核酸分子を定量化するための方法であって、
    a.各プローブが前記複数の特定核酸分子内の一特定核酸分子内のプローブ標的領域とハイブリダイズし、かつ各プローブがその5’末端において第1のアダプターを有する複数のプローブを伸長させて、複数の伸長産物を生成するステップと;
    b.第2のアダプターを、前記複数のプローブ伸長産物の二本鎖末端へと追加するステップと;
    c.前記複数のプローブ伸長産物をシークエンシングして、前記プローブ伸長産物の各々の配列データを生成するステップと;
    d.プローブ標的領域とハイブリダイズした各プローブの数を決定するステップであって、前記数が、前記プローブ標的領域を含む、前記特定核酸分子の各々の量を指し示す、ステップと
    を含む、方法。
  5. 組成物中の複数の特定核酸分子を定量化するための方法であって、
    a.複数のプローブを、特定核酸分子内のプローブ標的領域とハイブリダイズさせるステップであって、各プローブが、その5’末端に、第1のアダプターを有する、ステップと;
    b.各プローブを伸長させて、前記第1のアダプター配列を含む複数のプローブ伸長産物を生成するステップと;
    c.第2のアダプター配列を、前記複数のプローブ伸長産物の二本鎖末端へと追加するステップと;
    d.前記複数のプローブ伸長産物をシークエンシングして、前記複数のプローブ伸長産物の各々の配列を生成するステップと;
    e.前記複数のプローブ伸長産物の各々の前記配列を、プローブデータベース内の所定の配列に対してアラインさせるステップであって、前記プローブデータベースが、複数の所定の配列を含み、各所定の配列が、プローブに特異的である、ステップと;
    f.各プローブ伸長産物の前記配列についての、前記シークエンシングデータベース内の所定の配列に対するアラインメントの数を決定するステップであって、前記アラインメントの数が、前記プローブがハイブリダイズする前記特定核酸分子の各々の量を指し示す、ステップと
    を含む、方法。
  6. 前記複数のプローブ伸長産物の前記配列が、フォワードリード、インデックスリード、およびリバースリードのうちの少なくとも1つを含む、請求項1から5のいずれか一項に記載の方法。
  7. 各プローブがそのそれぞれの特定核酸内のそのそれぞれのプローブ標的領域配列へとアニールした特異性を検証する、請求項6に記載の方法。
  8. 前記複数のプローブ伸長産物の前記配列を、ゲノムまたはトランスクリプトームの座標へとマッピングして、意図されるプローブのアニーリングおよび伸長を検証する、請求項6に記載の方法。
  9. 前記複数のプローブ伸長産物の前記配列を、ゲノムまたはトランスクリプトームの座標へとマッピングする、請求項6に記載の方法。
  10. 前記複数のプローブ伸長産物の前記配列を、プローブデータベースの基準コピーに対してアラインさせて、意図されるプローブのアニーリングおよび伸長を検証する、請求項7に記載の方法。
  11. 前記リバースリードが、前記プローブ標的領域を含む、請求項6に記載の方法。
  12. 前記フォワードリードが、前記プローブ標的領域を含む、請求項6に記載の方法。
  13. 前記フォワードリードおよび前記リバースリードの前記複数のプローブ伸長産物の前記配列を、前記複数の特定核酸についてマッピングする、請求項8および9のいずれか一項に記載の方法。
  14. 前記インデックスリードの前記複数のプローブ伸長産物の前記配列により、試料バーコード配列およびn−ランダム配列のうちの少なくとも1つを同定する、請求項6に記載の方法。
  15. 前記フォワードリードのマッピング座標と、前記インデックスリードのn−ランダム塩基との組み合わせにより、各プローブ伸長産物についてのPCR重複を決定する、請求項8に記載の方法。
  16. 同じフォワードリード座標および同じn−ランダム塩基配列を有する配列を、重複として同定し、単一の特定核酸分子として一括し、計数する、請求項15に記載の方法。
  17. フォワードリード座標は同じであるが、n−ランダム塩基配列は異なる配列の各々を、別々の特定核酸分子として計数する、請求項15に記載の方法。
  18. 前記フォワードリードのマッピング座標と、前記インデックスリードのn−ランダム塩基との組み合わせにより、特定核酸分子を同定する、請求項9に記載の方法。
  19. 同じフォワードリード座標および同じn−ランダム塩基配列を有する配列を、重複として同定し、単一の特定核酸分子として一括し、計数する、請求項18に記載の方法。
  20. フォワードリード座標は同じであるが、n−ランダム塩基配列は異なる配列の各々を、別々の特定核酸分子として計数する、請求項18に記載の方法。
  21. 前記フォワードリードと、対応するリバースリードとを、ペアエンドでアラインさせる、請求項18に記載の方法。
  22. 重複の一括に続き、各プローブ配列について計数されるリバースリードの数により、前記複数の特定核酸内の、各出発特定核酸分子についての分子の数を表す値を生成する、請求項16および19のいずれか一項に記載の方法。
  23. 重複の一括に続き、各プローブ配列について計数されるフォワードリードの数により、前記複数の特定核酸内の、各出発特定核酸分子についての分子の数を表す値を生成する、請求項16および19のいずれか一項に記載の方法。
  24. 各プローブ配列について計数されるリバースリードの数により、前記複数の特定核酸内の、各出発特定核酸分子についての分子の数を表す値を生成する、請求項17および19のいずれか一項に記載の方法。
  25. 前記ゲノムが、哺乳動物、細菌、ウイルス、リケッチア、または植物のゲノムまたはトランスクリプトームからなる群より選択される、請求項8および9のいずれか一項に記載の方法。
  26. 前記第1のアダプターを追加する前に、前記複数の特定核酸に末端修復を施す、請求項2および3のいずれか一項に記載の方法。
  27. 前記プローブを、ポリメラーゼにより伸長させる、請求項1から5のいずれか一項に記載の方法。
  28. 前記ポリメラーゼが、DNAポリメラーゼ、RNAポリメラーゼ、または逆転写酵素からなる群より選択される、請求項27に記載の方法。
  29. 前記アダプターの追加に続き、前記プローブ伸長産物を、任意選択で増幅する、請求項4から5のいずれか一項に記載の方法。
  30. 前記第2のアダプターを付加する前に、前記プローブ伸長産物を、制限エンドヌクレアーゼで処理するか、またはこれに末端修復を施す、請求項1および4から5のいずれか一項に記載の方法。
  31. 前記末端修復が、平滑末端修復である、請求項30に記載の方法。
  32. 前記プローブ伸長産物の伸長が、第1のアダプターの付加をさらに含む、請求項1および4から5のいずれか一項に記載の方法。
  33. 前記プローブ伸長産物の増幅が、前記増幅産物の各末端へのフローセル配列の付着をさらに含む、請求項29に記載の方法。
  34. 前記制限エンドヌクレアーゼで処理されたプローブ伸長産物により、共通の末端を伴うフォワードリードをもたらす、請求項31に記載の方法。
  35. 前記複数のプローブ伸長産物の前記配列を、ゲノムまたはトランスクリプトームの座標へとマッピングして、意図されるプローブのアニーリングおよび伸長を検証する、請求項34に記載の方法。
  36. 前記複数のプローブ伸長産物の前記配列を、プローブデータベースの基準コピーに対してアラインさせて、意図されるプローブのアニーリングを検証する、請求項35に記載の方法。
  37. 前記フォワードリードのマッピング座標と、前記インデックスリードのn−ランダム塩基との組み合わせにより、各プローブ伸長産物についてのPCR重複を決定する、請求項36に記載の方法。
  38. 同じフォワードリード座標および同じn−ランダム塩基配列を有する配列を、重複として同定し、単一の特定核酸分子として一括し、計数する、請求項37に記載の方法。
  39. 前記複数のプローブ伸長産物の前記配列を、プローブデータベースの基準コピーに対してアラインさせて、意図されるプローブのアニーリングを検証する、請求項34に記載の方法。
  40. リバースリード配列を、それらが、どのプローブ配列を表すのかに従いビニングおよび計数し、各プローブが表される回数が、前記出発特定核酸分子が、元の試料中に存在する回数についての尺度である、請求項35に記載の方法。
  41. フォワードリード配列を、それらが、どのプローブ配列を表すのかに従いビニングおよび計数し、各プローブが表された回数が、前記出発特定核酸分子が、元の試料中に存在した回数についての尺度であった、請求項36に記載の方法。
  42. 前記フォワードリードが、前記特定核酸配列の少なくとも一部を含む、請求項6に記載の方法。
  43. 前記フォワードリードが、前記特定核酸配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、または少なくとも25塩基を含む、請求項6に記載の方法。
  44. 前記第1のアダプター配列が、インデックス配列のプライミング部位、インデックスヌクレオチド配列、n−ランダムヌクレオチド配列、フォワードリードプライミング部位、およびリバースリードプライミング部位、ならびにこれらの組み合わせのうちの少なくとも1つを含む、請求項2、3、および31のいずれか一項に記載の方法。
  45. 前記第2のアダプター配列が、フォワードリードプライミング部位、リバースリードプライミング部位、およびリンカー配列、ならびにこれらの組み合わせのうちの少なくとも1つを含む、請求項2、3、および31のいずれか一項に記載の方法。
  46. 前記第2のアダプター配列が、インデックス配列のプライミング部位、インデックスヌクレオチド配列、n−ランダムヌクレオチド配列、フォワードリードプライミング部位、リバースリードプライミング部位、ならびにこれらの組み合わせのうちの少なくとも1つを含む、請求項1、4から5、および31のいずれか一項に記載の方法。
  47. 前記第1のアダプター配列が、フォワードリードプライミング部位、リバースリードプライミング部位、およびリンカー配列、ならびにこれらの組み合わせのうちの少なくとも1つを含む、請求項4から5、および31のいずれか一項に記載の方法。
  48. 前記5’の第1のアダプターが、各プローブ伸長産物に共通である、請求項4から5、および31のいずれか一項に記載の方法。
  49. 前記インデックスリードが、インデックスヌクレオチド配列およびn−ランダム塩基配列のうちの、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15塩基を含む、請求項6に記載の方法。
  50. 前記インデックスリードが、n−ランダム塩基およびインデックスヌクレオチド配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10塩基を含む、請求項6に記載の方法。
  51. 前記インデックスリードが、前記n−ランダム塩基および任意選択で前記インデックスヌクレオチド配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10塩基を含む、請求項6に記載の方法。
  52. 前記n−ランダム塩基のヌクレオチド配列が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ヌクレオチドを含む、請求項44および46のいずれか一項に記載の方法。
  53. 前記インデックスヌクレオチド配列が、バーコード配列をさらに含む、請求項44および46のいずれか一項に記載の方法。
  54. 前記リバースリードが、プローブ標的領域配列および前記特定核酸配列の一部、ならびにこれらの組み合わせのうちの少なくとも1つを含む、請求項6に記載の方法。
  55. 前記リバースリードが、プローブ配列のうちの、少なくとも少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、または少なくとも60塩基を含む、請求項54に記載の方法。
  56. 前記リバースリードが、前記プローブ配列に対して3’の特定核酸配列のうちの、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、または少なくとも20塩基を含む、請求項54に記載の方法。
  57. 請求項29に記載の方法により増幅されるプローブ伸長産物を含む組成物。
  58. 請求項1から5のいずれか一項に記載の方法により産生されるプローブ伸長産物を含む組成物。
  59. 前記複数の核酸が、組織、臓器、単一の細胞、腫瘍、患者から採取された有機流体の検体、遊離循環核酸、真菌、原核生物、およびウイルスからなる群より選択される試料に由来する、請求項1から5のいずれか一項に記載の方法。
  60. 前記患者が、腫瘍を有することが知られているか、またはこれを有することが疑われる、請求項59に記載の方法。
  61. 前記有機流体が、少なくとも1つの循環腫瘍細胞(CTC)または播種性腫瘍細胞(CTD)を含有する、請求項59に記載の方法。
  62. 前記患者が、ウイルス感染を有することが知られているか、またはこれを有することが疑われる、請求項59に記載の方法。
  63. 前記ウイルス感染が、伝染性感染または伝染性疾患である、請求項62に記載の方法。
  64. 前記組成物が、複数の核酸分子をさらに含む、請求項1から5に記載の方法。
  65. 各プローブ伸長産物が、特定核酸分子内のプローブ標的領域と相補的なプローブの伸長産物である、請求項1から5に記載の方法。
JP2017506386A 2014-08-06 2015-08-06 標的化されたシークエンシングからのデジタル測定値 Active JP6803327B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462034043P 2014-08-06 2014-08-06
US62/034,043 2014-08-06
PCT/US2015/044065 WO2016022833A1 (en) 2014-08-06 2015-08-06 Digital measurements from targeted sequencing

Publications (3)

Publication Number Publication Date
JP2017526353A true JP2017526353A (ja) 2017-09-14
JP2017526353A5 JP2017526353A5 (ja) 2018-08-30
JP6803327B2 JP6803327B2 (ja) 2020-12-23

Family

ID=55264574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017506386A Active JP6803327B2 (ja) 2014-08-06 2015-08-06 標的化されたシークエンシングからのデジタル測定値

Country Status (7)

Country Link
US (2) US10102337B2 (ja)
EP (1) EP3177740B1 (ja)
JP (1) JP6803327B2 (ja)
CN (1) CN107075581B (ja)
CA (1) CA2957633A1 (ja)
SG (1) SG11201700891SA (ja)
WO (1) WO2016022833A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020528741A (ja) * 2017-11-06 2020-10-01 イルミナ インコーポレイテッド 核酸インデックス付け技術

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110016499B (zh) 2011-04-15 2023-11-14 约翰·霍普金斯大学 安全测序系统
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
ES2701742T3 (es) 2012-10-29 2019-02-25 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
WO2014093330A1 (en) 2012-12-10 2014-06-19 Clearfork Bioscience, Inc. Methods for targeted genomic analysis
US20140274738A1 (en) 2013-03-15 2014-09-18 Nugen Technologies, Inc. Sequential sequencing
CA2929596C (en) 2013-11-13 2022-07-05 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
JP6803327B2 (ja) 2014-08-06 2020-12-23 ニューゲン テクノロジーズ, インコーポレイテッド 標的化されたシークエンシングからのデジタル測定値
WO2018176007A1 (en) * 2017-03-23 2018-09-27 BioSpyder Technologies, Inc. Modulation of targets in cellular pathways identified by resolution of stochastic gene expression
CN107922970B (zh) 2015-08-06 2021-09-28 豪夫迈·罗氏有限公司 通过单探针引物延伸的靶标富集
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
MX2018005858A (es) 2015-11-11 2019-02-20 Resolution Bioscience Inc Construccion de alta eficacia de bibliotecas de adn.
WO2017210469A2 (en) 2016-06-01 2017-12-07 F. Hoffman-La Roche Ag Immuno-pete
CN106048009B (zh) * 2016-06-03 2020-02-18 人和未来生物科技(长沙)有限公司 一种用于超低频基因突变检测的标签接头及其应用
KR101969905B1 (ko) * 2016-06-20 2019-04-17 한국표준과학연구원 염기서열분석을 위한 라이브러리용 프라이머 세트 및 라이브러리 제조방법
WO2018039463A1 (en) * 2016-08-25 2018-03-01 Resolution Bioscience, Inc. Methods for the detection of genomic copy changes in dna samples
US10190155B2 (en) 2016-10-14 2019-01-29 Nugen Technologies, Inc. Molecular tag attachment and transfer
WO2018162538A1 (en) 2017-03-08 2018-09-13 F. Hoffmann-La Roche Ag Primer extension target enrichment and improvements thereto including simultaneous enrichment of dna and rna
WO2019078909A2 (en) * 2017-10-16 2019-04-25 The Regents Of The University Of California PREPARATION OF EFFECTIVE SCREENING LIBRARY
US11099202B2 (en) 2017-10-20 2021-08-24 Tecan Genomics, Inc. Reagent delivery system
EP3524695B1 (en) * 2018-02-13 2022-07-20 Personal Genomics S.r.l. Method for the enrichment of genomic regions
AU2019321683A1 (en) * 2018-08-17 2021-01-21 Dana-Farber Cancer Institute, Inc. DNA amplification method for probe generation
CN110699426B (zh) * 2019-01-02 2022-01-28 上海臻迪基因科技有限公司 基因目标区域富集方法及试剂盒
US12059674B2 (en) 2020-02-03 2024-08-13 Tecan Genomics, Inc. Reagent storage system
CN113593636B (zh) * 2020-04-30 2024-05-03 深圳市真迈生物科技有限公司 测序结果分析方法、系统及计算机可读存储介质和电子设备
WO2023066255A1 (zh) * 2021-10-18 2023-04-27 深圳市真迈生物科技有限公司 测序方法、测序数据处理方法、设备和计算机设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014039556A1 (en) * 2012-09-04 2014-03-13 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation

Family Cites Families (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4925065A (en) 1987-01-02 1990-05-15 Helena Laboratories Corporation Dispensing apparatus
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
CA2013317A1 (en) 1989-04-17 1990-10-17 Fred T. Oakes Diagnostic kit, primer composition and their use for replication or detection of nucleic acids
WO1992007951A1 (en) 1990-10-19 1992-05-14 Yoke Wah Kow Quantitation of aldehyde-containing lesions in nucleic acids
US5518900A (en) 1993-01-15 1996-05-21 Molecular Tool, Inc. Method for generating single-stranded DNA molecules
EP0635023B1 (en) 1992-03-05 2002-02-06 Isis Pharmaceuticals, Inc. Covalently cross-linked oligonucleotides
CA2140081C (en) 1994-01-13 2008-04-01 Dean L. Engelhardt Process, construct and conjugate for producing multiple nucleic acid copies
US6110709A (en) 1994-03-18 2000-08-29 The General Hospital Corporation Cleaved amplified modified polymorphic sequence detection methods
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
CA2223104A1 (en) 1995-06-07 1996-12-19 Jonathan P. Duvick Pcr-based cdna subtractive cloning method
AU708821B2 (en) 1995-07-11 1999-08-12 Forfas Glycosylase mediated detection of nucleotide sequences at candidate loci
US6190865B1 (en) 1995-09-27 2001-02-20 Epicentre Technologies Corporation Method for characterizing nucleic acid molecules
GB9600384D0 (en) 1996-01-09 1996-03-13 Nyfotek As Dna glycosylases
WO1998006736A1 (en) 1996-08-14 1998-02-19 Life Technologies, Inc. Stable compositions for nucleic acid amplification and sequencing
US6449562B1 (en) 1996-10-10 2002-09-10 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and method
IL120337A0 (en) 1997-02-27 1997-06-10 Gesher Israel Advanced Biotecs Method for joining DNA fragments
AU6846698A (en) 1997-04-01 1998-10-22 Glaxo Group Limited Method of nucleic acid amplification
US5972618A (en) 1997-08-28 1999-10-26 Bloch; Will Detection of mutations in nucleic acids by chemical cleavage
AU9660698A (en) 1997-08-29 1999-03-16 Osvaldo J. Lopez Dna methyltransferase genotyping
WO1999022030A1 (en) 1997-10-28 1999-05-06 The Regents Of The University Of California Dna polymorphism identity determination using flow cytometry
US6365346B1 (en) 1998-02-18 2002-04-02 Dade Behring Inc. Quantitative determination of nucleic acid amplification products
DE69804143T2 (de) 1998-04-22 2002-08-01 Enterprise Ireland (Trading As Bioresearch Ireland), Dublin Verfahren zur charakterisierung von nukleinsäuremolekulen, das die erzeugung von verlängerbaren aufwärtsgelegenen dns-fragmenten, die durch spaltung der nukleinsäure an einer abasischen stelle entsteht, umfasst
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
GB9817055D0 (en) 1998-08-05 1998-09-30 Medical Res Council Reverse transcription and amplification processes and primers therefore
US6232067B1 (en) 1998-08-17 2001-05-15 The Perkin-Elmer Corporation Adapter directed expression analysis
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
CA2357601A1 (en) 1998-12-30 2000-07-06 Dana-Farber Cancer Institute, Inc. Mutation scanning array, and methods of use thereof
US7074556B2 (en) 1999-03-02 2006-07-11 Invitrogen Corporation cDNA synthesis improvements
JP2002538837A (ja) 1999-03-12 2002-11-19 アマシャム バイオサイエンス ユーケイ リミテッド 遺伝分析
AU4739600A (en) 1999-05-17 2000-12-05 Mcgill University Method for subtracting cdnas by suppressing the synthesis of specifically targeted mrnas
US6225109B1 (en) 1999-05-27 2001-05-01 Orchid Biosciences, Inc. Genetic analysis device
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
BR0014182A (pt) 1999-09-13 2002-05-21 Nugen Technologies Inc Processos e composições para amplificação isotérmica linear de sequências polinucleotìdicas
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6617442B1 (en) 1999-09-30 2003-09-09 Isis Pharmaceuticals, Inc. Human Rnase H1 and oligonucleotide compositions thereof
US6958225B2 (en) 1999-10-27 2005-10-25 Affymetrix, Inc. Complexity management of genomic DNA
AU3163101A (en) 1999-12-21 2001-07-03 Vbc-Genomics Bioscience Research Gmbh Compound comprising a nucleic acid moiety and an organo-silane moiety
US7205129B1 (en) 2000-02-28 2007-04-17 Qiagen Gmbh Method for reducing artifacts in nucleic acid amplification
US6936702B2 (en) 2000-06-07 2005-08-30 Li-Cor, Inc. Charge-switch nucleotides
EP1356094B1 (en) 2000-06-26 2010-01-13 Nugen Technologies, Inc. Methods and compositions for transcription-based nucleic acid amplification
US20040166499A1 (en) 2000-10-05 2004-08-26 Yoshihide Hayashizaki Oligonucleotide linkers comprising a variable cohesive portion and method for the praparation of polynucleotide libraries by using said linkers
CA2423729A1 (en) 2000-10-06 2002-04-11 Nugen Technologies, Inc. Methods and probes for detection and/or quantification of nucleic acid sequences
IE20000887A1 (en) 2000-11-03 2002-12-11 Univ College Cork Nat Univ Ie Method for the amplification and optional characterisation of nucleic acids
CA2430329A1 (en) 2000-12-13 2002-06-20 Nugen Technologies, Inc. Methods and compositions for generation of multiple copies of nucleic acid sequences and methods of detection thereof
US6893820B1 (en) 2001-01-31 2005-05-17 The Ohio State University Research Foundation Detection of methylated CpG rich sequences diagnostic for malignant cells
EP1390537B1 (en) 2001-03-09 2013-11-13 Nugen Technologies, Inc. Methods and compositions for amplification of rna sequences
ATE361996T1 (de) 2001-03-09 2007-06-15 Nugen Technologies Inc Methoden und zusammensetzungen zur vervielfältigung von rna sequenzen
WO2002081753A1 (en) 2001-04-04 2002-10-17 Advanced Research & Technology Institute Method for identifying and characterizing individual dna molecules
FR2824335A1 (fr) 2001-05-04 2002-11-08 Bio Merieux Procede de marquage et de fragmentation d'adn
JP3967319B2 (ja) 2001-06-27 2007-08-29 エフ.ホフマン−ラ ロシュ アーゲー ポリヌクレオチド配列のインビトロ組換えのためのウォークスルー技術
JP2006500901A (ja) 2001-09-26 2006-01-12 エピジェンクス ファーマスーティカルズ、 インコーポレイテッド Dnaメチル化変化のアッセイ
JP2004148509A (ja) 2001-10-04 2004-05-27 Seiko Epson Corp 液体噴射ヘッド
DE60323067D1 (de) 2002-03-11 2008-10-02 Nugen Technologies Inc Verfahren zur erzeugung doppelsträngiger dna mit einem 3'-einzelstranganteil und verwendungen dieser komplexe zur rekombination
EP1490514A4 (en) 2002-03-29 2008-12-17 Nugen Technologies Inc THROUGH ISOTHERME SINGLE PRIMER NUCLEIC ACID AMPLIFICATION IMPROVED DETECTION AND QUANTIFICATION OF ANALYTES
US6887709B2 (en) 2002-05-09 2005-05-03 Lifescan, Inc. Devices, systems and methods for the containment and use of liquid solutions
CA2486283A1 (en) 2002-05-17 2004-02-05 Nugen Technologies, Inc. Methods for fragmentation, labeling and immobilization of nucleic acids
US7108976B2 (en) 2002-06-17 2006-09-19 Affymetrix, Inc. Complexity management of genomic DNA by locus specific amplification
US7704687B2 (en) 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
US7414117B2 (en) 2002-12-26 2008-08-19 Ngk Insulators, Ltd. Nucleotide derivative and DNA microarray
EP2159285B1 (en) 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
WO2004092331A2 (en) 2003-04-08 2004-10-28 Li-Cor, Inc. Composition and method for nucleic acid sequencing
CA2521084A1 (en) 2003-04-14 2004-10-28 Nugen Technologies, Inc. Global amplification using a randomly primed composite primer
WO2005038427A2 (en) * 2003-06-05 2005-04-28 Medical Gene Center Ltd. Rapid identification of viruses of the upper respiratory tract infection including sars causing coronus viruses
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
WO2005065321A2 (en) 2003-12-29 2005-07-21 Nugen Technologies, Inc. Methods for analysis of nucleic acid methylation status and methods for fragmentation, labeling and immobilization of nucleic acids
US7462452B2 (en) 2004-04-30 2008-12-09 Pacific Biosciences Of California, Inc. Field-switch sequencing
US20060024711A1 (en) 2004-07-02 2006-02-02 Helicos Biosciences Corporation Methods for nucleic acid amplification and sequence determination
US7361468B2 (en) 2004-07-02 2008-04-22 Affymetrix, Inc. Methods for genotyping polymorphisms in humans
US7276720B2 (en) 2004-07-19 2007-10-02 Helicos Biosciences Corporation Apparatus and methods for analyzing samples
US20060024678A1 (en) 2004-07-28 2006-02-02 Helicos Biosciences Corporation Use of single-stranded nucleic acid binding proteins in sequencing
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
WO2006044078A2 (en) 2004-09-17 2006-04-27 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
EP1817572A2 (en) 2004-11-16 2007-08-15 Helicos Biosciences Corporation An optical train and method for tirf single molecule detection and analysis
EP1841879A4 (en) 2005-01-25 2009-05-27 Population Genetics Technologi ISOTHERMAL DNA AMPLIFICATION
US7462468B1 (en) 2005-01-28 2008-12-09 Pacific Biosciences Of California, Inc. DNA intercalating agents and methods of use
EP1844328A4 (en) 2005-01-31 2009-09-16 Pacific Biosciences California USE OF REVERSIBLE EXTENSION TERMINATOR IN NUCLEIC ACID SEQUENCING
US20060286566A1 (en) 2005-02-03 2006-12-21 Helicos Biosciences Corporation Detecting apparent mutations in nucleic acid sequences
WO2006086668A2 (en) 2005-02-09 2006-08-17 Epicentre Technologies Compositions and methods employing 5'-phosphate-dependent nucleic acid exonucleases
ATE510930T1 (de) 2005-08-02 2011-06-15 Rubicon Genomics Inc Zusammensetzungen und verfahren zur bearbeitung und amplifikation von dna mit verwendung mehrerer enzyme in einer einzigen reaktion
US20090137415A1 (en) 2005-08-05 2009-05-28 Euclid Diagnostics Llc SUBTRACTIVE SEPARATION AND AMPLIFICATION OF NON-RIBOSOMAL TRANSCRIBED RNA (nrRNA)
WO2007030759A2 (en) 2005-09-07 2007-03-15 Nugen Technologies, Inc. Improved nucleic acid amplification procedure
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP1957667A1 (en) 2005-11-15 2008-08-20 Solexa Ltd. Method of target enrichment
EP2010657A2 (en) 2006-04-24 2009-01-07 Nimblegen Systems, Inc. Use of microarrays for genomic representation selection
US20080269476A1 (en) 2006-04-26 2008-10-30 Helicos Biosciences Corporation Molecules and methods for nucleic acid sequencing
WO2007136717A1 (en) 2006-05-16 2007-11-29 Nugen Technologies, Inc. Nucleic acid separation and purification method based on reversible charge interactions
WO2008005459A2 (en) 2006-06-30 2008-01-10 Nugen Technologies, Inc. Methods for fragmentation and labeling of nucleic acids
US9328378B2 (en) 2006-07-31 2016-05-03 Illumina Cambridge Limited Method of library preparation avoiding the formation of adaptor dimers
WO2008033442A2 (en) 2006-09-12 2008-03-20 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for performing low background multiplex nucleic acid amplification reactions
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2121983A2 (en) 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
US8506908B2 (en) 2007-03-09 2013-08-13 Vantix Holdings Limited Electrochemical detection system
WO2008137661A1 (en) 2007-05-03 2008-11-13 Helicos Biosciences Corporation Methods and compositions for sequencing a nucleic acid
US9248076B2 (en) 2007-05-16 2016-02-02 Mystic Pharmaceuticals, Inc. Dose dispensing containers
EP2155855B1 (en) 2007-06-06 2016-10-12 Pacific Biosciences of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
CL2008001682A1 (es) * 2007-06-08 2008-12-12 Monsanto Technology Llc Metodos para el mejoramiento de plantas mediante el uso de informacion directa de secuencias de acidos nucleicos.
US7901889B2 (en) 2007-07-26 2011-03-08 Pacific Biosciences Of California, Inc. Molecular redundant sequencing
EP2053132A1 (en) 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
WO2009102896A2 (en) 2008-02-12 2009-08-20 Nugen Technologies, Inc. Isothermal nucleic acid amplification methods and compositions
GB0804690D0 (en) 2008-03-13 2008-04-16 Netherlands Cancer Inst The Method
WO2009117698A2 (en) 2008-03-21 2009-09-24 Nugen Technologies, Inc. Methods of rna amplification in the presence of dna
CA2991818C (en) 2008-03-28 2022-10-11 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US8236499B2 (en) 2008-03-28 2012-08-07 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
US20100120034A1 (en) 2008-07-03 2010-05-13 Life Technologies Corporation Methylation analysis of mate pairs
JP5221248B2 (ja) 2008-08-26 2013-06-26 株式会社日立ハイテクノロジーズ 高発現遺伝子由来のcDNAクローンの含有率を低減させたcDNAライブラリーの作製方法
EP2334802A4 (en) 2008-09-09 2012-01-25 Life Technologies Corp METHODS OF GENERATING SPECIFIC LIBRARIES OF GENES
WO2010039991A2 (en) 2008-10-02 2010-04-08 The Texas A&M University System Method of generating informative dna templates for high-throughput sequencing applications
EP2367937B1 (en) 2008-12-04 2013-04-17 Keygene N.V. Method for the reduction of repetitive sequences in adapter-ligated restriction fragments
GB2465986A (en) 2008-12-04 2010-06-09 Angeletti P Ist Richerche Bio Method of generating diversity in polynucleotide sequences
CA2750547C (en) 2009-01-22 2018-07-03 Quanta Biosciences Methods for enrichment of selected rna molecules
WO2010091246A2 (en) 2009-02-06 2010-08-12 Northwestern University Burstable liquid packaging and uses thereof
US8691509B2 (en) 2009-04-02 2014-04-08 Fluidigm Corporation Multi-primer amplification method for barcoding of target nucleic acids
WO2010129937A2 (en) 2009-05-08 2010-11-11 Life Technologies Corporation Methods for detecting genetic variations in dna samples
EP2272976A1 (en) 2009-07-06 2011-01-12 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Method for differentiation of polynucleotide strands
GB0912909D0 (en) 2009-07-23 2009-08-26 Olink Genomics Ab Probes for specific analysis of nucleic acids
WO2011019964A1 (en) 2009-08-12 2011-02-17 Nugen Technologies, Inc. Methods, compositions, and kits for generating nucleic acid products substantially free of template nucleic acid
EP2475777A4 (en) 2009-09-11 2013-03-06 Nugen Technologies Inc COMPOSITIONS AND METHODS FOR COMPLETE TRANSCRIPTOMAL ANALYSIS
GB2487341A (en) 2009-11-02 2012-07-18 Nugen Technologies Inc Compositions and methods for targeted nucleic acid sequence selection and amplification
ITRM20100293A1 (it) 2010-05-31 2011-12-01 Consiglio Nazionale Ricerche Metodo per la preparazione e amplificazione di librerie rappresentative di cdna per il sequenziamento massivo, loro uso, kit e cartucce per kit di automazione
US20110319290A1 (en) 2010-06-08 2011-12-29 Nugen Technologies, Inc. Methods and Compositions for Multiplex Sequencing
GB201012748D0 (en) 2010-07-29 2010-09-15 Univ St Andrews Improved RACE
ES2595433T3 (es) 2010-09-21 2016-12-30 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
DK2630263T4 (da) 2010-10-22 2022-02-14 Cold Spring Harbor Laboratory Varital tælling af nucleinsyrer for at opnå information om antal genomiske kopier
CA2821299C (en) 2010-11-05 2019-02-12 Frank J. Steemers Linking sequence reads using paired code tags
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
WO2012103154A1 (en) 2011-01-24 2012-08-02 Nugen Technologies, Inc. Stem-loop composite rna-dna adaptor-primers: compositions and methods for library generation, amplification and other downstream manipulations
WO2012112804A1 (en) 2011-02-18 2012-08-23 Raindance Technoligies, Inc. Compositions and methods for molecular labeling
SG194745A1 (en) * 2011-05-20 2013-12-30 Fluidigm Corp Nucleic acid encoding reactions
GB2497838A (en) 2011-10-19 2013-06-26 Nugen Technologies Inc Compositions and methods for directional nucleic acid amplification and sequencing
WO2013059740A1 (en) 2011-10-21 2013-04-25 Foundation Medicine, Inc. Novel alk and ntrk1 fusion molecules and uses thereof
EP4372084A3 (en) 2012-01-26 2024-08-14 Tecan Genomics, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
WO2013130512A2 (en) 2012-02-27 2013-09-06 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
US9862995B2 (en) 2012-03-13 2018-01-09 Abhijit Ajit Patel Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
CA2874413A1 (en) 2012-05-21 2013-11-28 The Scripps Research Institute Methods of sample preparation
CN104619894B (zh) 2012-06-18 2017-06-06 纽亘技术公司 用于非期望核酸序列的阴性选择的组合物和方法
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
EP2885445A4 (en) * 2012-08-15 2016-04-13 Natera Inc METHOD AND COMPOSITIONS FOR CONTAMINATING REDUCTION OF GENETIC LIBRARIES
CA3043574C (en) * 2012-11-26 2023-09-19 The University Of Toledo Methods for standardized sequencing of nucleic acids and uses thereof
US20140274729A1 (en) 2013-03-15 2014-09-18 Nugen Technologies, Inc. Methods, compositions and kits for generation of stranded rna or dna libraries
US20140274738A1 (en) 2013-03-15 2014-09-18 Nugen Technologies, Inc. Sequential sequencing
GB2546833B (en) 2013-08-28 2018-04-18 Cellular Res Inc Microwell for single cell analysis comprising single cell and single bead oligonucleotide capture labels
US10149951B2 (en) 2013-10-15 2018-12-11 Mystic Pharmaceuticals, Inc. Controllable rate turbulating nozzle
CA2929596C (en) * 2013-11-13 2022-07-05 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
GB201320542D0 (en) 2013-11-21 2014-01-01 Randox Lab Ltd Assay fluid delivery system
WO2015131107A1 (en) 2014-02-28 2015-09-03 Nugen Technologies, Inc. Reduced representation bisulfite sequencing with diversity adaptors
JP6803327B2 (ja) 2014-08-06 2020-12-23 ニューゲン テクノロジーズ, インコーポレイテッド 標的化されたシークエンシングからのデジタル測定値
US9527077B2 (en) 2015-01-29 2016-12-27 David W. Wright Diagnostic cartridge, fluid storage and delivery apparatus therefor and methods of construction thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014039556A1 (en) * 2012-09-04 2014-03-13 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SEDA EMINAGA ET AL., CURR PROTOC MOL BIOL., vol. 103, JPN6019028433, July 2013 (2013-07-01), pages 17 - 1, ISSN: 0004081911 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020528741A (ja) * 2017-11-06 2020-10-01 イルミナ インコーポレイテッド 核酸インデックス付け技術
JP7091372B2 (ja) 2017-11-06 2022-06-27 イルミナ インコーポレイテッド 核酸インデックス付け技術

Also Published As

Publication number Publication date
CN107075581A (zh) 2017-08-18
EP3177740B1 (en) 2021-01-13
CA2957633A1 (en) 2016-02-11
EP3177740A1 (en) 2017-06-14
WO2016022833A1 (en) 2016-02-11
US20190005193A1 (en) 2019-01-03
SG11201700891SA (en) 2017-03-30
US20160203259A1 (en) 2016-07-14
JP6803327B2 (ja) 2020-12-23
EP3177740A4 (en) 2018-02-28
US10102337B2 (en) 2018-10-16
CN107075581B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
JP6803327B2 (ja) 標的化されたシークエンシングからのデジタル測定値
US11725241B2 (en) Compositions and methods for identification of a duplicate sequencing read
CN110191961B (zh) 制备经不对称标签化的测序文库的方法
AU2018214075B2 (en) Systems and methods for prenatal genetic analysis
JP2021168659A (ja) 次世代ゲノムウォーキングのための方法ならびに関連する組成物およびキット
EP3191604B1 (en) Methods and compositions for rapid nucleic acid library preparation
CN110546272B (zh) 将衔接子附接至样品核酸的方法
JP2016511007A (ja) 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット
CN110139931B (zh) 用于定相测序的方法和组合物
JP7539770B2 (ja) ゲノム再編成検出のための配列決定方法
JP6983906B2 (ja) ライブラリーの定量および定性
US20240336913A1 (en) Method for producing a population of symmetrically barcoded transposomes
WO2024112758A1 (en) High-throughput amplification of targeted nucleic acid sequences

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190724

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201130

R150 Certificate of patent or registration of utility model

Ref document number: 6803327

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250