JP7418402B2 - 単一のフローセルを使用した多重シークエンシング - Google Patents

単一のフローセルを使用した多重シークエンシング Download PDF

Info

Publication number
JP7418402B2
JP7418402B2 JP2021504285A JP2021504285A JP7418402B2 JP 7418402 B2 JP7418402 B2 JP 7418402B2 JP 2021504285 A JP2021504285 A JP 2021504285A JP 2021504285 A JP2021504285 A JP 2021504285A JP 7418402 B2 JP7418402 B2 JP 7418402B2
Authority
JP
Japan
Prior art keywords
sequencing
nucleic acid
libraries
acid molecules
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021504285A
Other languages
English (en)
Other versions
JP2021531794A (ja
Inventor
ティモシー ウィルソン,
ハルク テズカン,
ジョン スピノサ,
アレクサンダー ロバートソン,
ロヒス スリヴァス,
ニール ピーターマン,
ニコル ランバート,
ピーター ジョージ,
ラム ヤラマンチリ,
ケネス ネスミス,
Original Assignee
レクセント バイオ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by レクセント バイオ, インコーポレイテッド filed Critical レクセント バイオ, インコーポレイテッド
Publication of JP2021531794A publication Critical patent/JP2021531794A/ja
Priority to JP2023171965A priority Critical patent/JP2023171901A/ja
Application granted granted Critical
Publication of JP7418402B2 publication Critical patent/JP7418402B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/146Concentration of target or template
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions

Description

相互参照
本出願は、2018年7月26日に出願された米国仮特許出願第62/703,763号(これは、参照により本明細書に完全に組み込まれる)の利益を主張する。
発明の背景
ヒトゲノムをマッピングしたいという要望は、迅速な核酸シークエンシングのための技術への関心を生み出した。しかしながら、最初のヒトゲノムのシークエンシングは約10億ドルのコストがかかり、完了までに10年超を要した。核酸シークエンシングに関連する技術は進歩したが、大規模なゲノムプロジェクトは依然として高額である。例えば、全ゲノムシークエンシングは数千ドルのコストがかかる可能性があり、法外なコストをゲノミクス研究プロジェクトに課し得る。加えて、シークエンシングシステムの能力を効率的に利用することは依然として困難であり得る。
技術の発展にもかかわらず、全ゲノムシークエンシングは依然としてコストがかかる可能性がある。効率的および/またはハイスループットな全ゲノムシークエンシングアプローチの必要性を認識して、本開示は、核酸シークエンシングのための方法およびシステムを提供する。このようなシステムおよび方法は、単一のフローセルを使用して、偏りのないおよび/または偏りのあるシークエンシングを実施して、核酸分子のライブラリーを生成し得る。
ゲノムの特定の領域をバイアスする方法は、サンプル数に基づくシークエンシングのコストを削減しながら、特定の疾患の評価または管理(例えば、診断、予後、処置選択、処置モニタリング、再発のモニタリング)に対して比較的大きな重要性を有する領域のシークエンシングアウトプットの信頼性を増強するために用いられ得る。しかしながら、このバイアスの増加はまた、シークエンシングされるサンプルの複雑さを減少させ得、シークエンサーがゲノムの個々の塩基を呼び出すことが困難になり得る。この問題を克服するために、Phi X 174バクテリオファージの十分に特性評価されたより小さなコントロールゲノムを、シークエンシングランの全体的な複雑さを増加させるために、目的の偏りのあるサンプルと一緒に利用可能なごく一部の全リードとしてランし得る。しかしながら、このバクテリオファージコントロールを使用することにより、利用可能な全シークエンシングリードのごく一部は、このコントロールゲノムのシークエンシングの実施に向けて失われる可能性がある。
本開示は、ユーザが、最適なシークエンシングラン品質に必要なシークエンシング複雑さを維持しながら、この喪失したシークエンシング能力を回復し得る方法を提供する。偏りのあるサンプル(複数可)と一緒にシークエンシングされた偏りのないサンプル(複数可)は、ユーザが、コントロールゲノムの処理で典型的に喪失する能力を使用することを可能にし得る。これは、並行して複数のアッセイをランする能力をユーザに提供し得るので、シークエンシングの効率および/またはスループットを改善し、それにより、シークエンシングランの成功に必要なサンプル複雑さを維持しながら、全体的なシークエンシングコストおよび時間を節約する。
加えて、市販のシークエンサーのアベイラビリティは、これらのシークエンシング機器で経済的にランされ得るアッセイに制約を加え得る。例えば、より高いシークエンシングアウトプットのために設計されたモデルは、単一のランで多数の検体を多重化せずに偏りのあるシークエンシング用途でランするためには過度にコストがかかる可能性があるが、偏りのないシークエンシングラン当たりのコストを大幅に削減し得る。偏りのあるおよび偏りのない検体の両方を単一のシークエンシングランに組み合わせる能力は、より高出力の機器をより多用途的にし得、その結果、検体当たりのランコストを削減しながら幅広い用途でそれらを使用し得る。
本開示の態様は、シークエンシングのためのサンプルの複雑さを増加させるための方法であって、
所望の程度の複雑さとは異なる第1の程度の複雑さを有する第1の核酸サンプルを提供すること;
第1の程度の複雑さとは異なり、所望の程度の複雑さとは異なる第2の程度の複雑さを有する第2の核酸サンプルを提供すること;
第1の核酸サンプルの少なくとも一部および第2の核酸サンプルの少なくとも一部をプールし、それにより、所望の程度の複雑さを有するプールされた核酸サンプルを生成すること;ならびに
プールされた核酸サンプルの少なくとも一部をシークエンシングすること
を含む、方法を提供する。
一部の実施形態では、シークエンシングすることは、全ゲノムシークエンシング(WGS)を含む。一部の実施形態では、シークエンシングすることは、大規模並列シークエンシングを含む。一部の実施形態では、シークエンシングすることは、フローセル当たり少なくとも約10億個のリードのアウトプットを含むシークエンシングプラットフォームでシークエンシングすることを含む。一部の実施形態では、シークエンシングすることは、フローセル当たり少なくとも約15億個のリードのアウトプットを含むシークエンシングプラットフォームでシークエンシングすることを含む。一部の実施形態では、シークエンシングすることは、フローセル当たり少なくとも約20億個のリードのアウトプットを含むシークエンシングプラットフォームでシークエンシングすることを含む。
本開示の別の態様は、核酸分子をシークエンシングするための方法であって、
第1の複数の核酸分子を処理して、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成すること;
第2の複数の核酸分子を処理して、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成すること;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成すること;ならびに
シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングして、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成すること
を含む、方法を提供する。
一部の実施形態では、偏りのないシークエンシングは全ゲノムシークエンシング(WGS)を含む。一部の実施形態では、偏りのないシークエンシングは約0.1倍以下、0.5倍以下、約1倍以下、約2倍以下、約3倍以下、約4倍以下、約5倍以下、約6倍以下、約7倍以下、約8倍以下、約9倍以下、約10倍以下、約12倍以下、約14倍以下、約16倍以下、約18倍以下、約20倍以下、約22倍以下、約24倍以下、約26倍以下、約28倍以下、または約30倍以下の深度で実施される。一部の実施形態では、偏りのあるシークエンシングは、複数の遺伝子座を含む標的捕捉パネルの標的シークエンシングを含む。一部の実施形態では、標的シークエンシングは標的メチル-seqを含む。一部の実施形態では、偏りのないシークエンシングはメチル化シークエンシングを含む。一部の実施形態では、メチル化シークエンシングは、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)またはTet支援バイサルファイトシークエンシング(TAB-Seq)を含む。一部の実施形態では、第2の複数のシークエンシングリードを生成することは、コントロールライブラリーとして第1の複数のライブラリーの少なくとも一部を使用することを含む。一部の実施形態では、方法は、第3の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することをさらに含み、第3の複数のライブラリーは、第1の複数のシークエンシングリードまたは第2の複数のシークエンシングリードを生成するためのコントロールライブラリーを含む。一部の実施形態では、第1の複数の核酸分子および第2の複数の核酸分子はDNA分子を含む。一部の実施形態では、第1の複数の核酸分子および第2の複数の核酸分子はRNA分子を含む。一部の実施形態では、シークエンシングプラットフォームはIllumina(商標)シークエンサーである。
本開示の別の態様は、核酸分子をシークエンシングするための方法であって、
第1の複数の核酸分子を処理して、第1の偏りのあるシークエンシングを実施するための第1の複数のライブラリーを生成すること;
第2の複数の核酸分子を処理して、第2の偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成すること;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成すること;ならびに
シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングして、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成すること
を含む、方法を提供する。
一部の実施形態では、第1の偏りのあるシークエンシングは、第1の複数の遺伝子座を含む第1の標的捕捉パネルの標的シークエンシングを含み、第2の偏りのあるシークエンシングは、第2の複数の遺伝子座を含む第2の標的捕捉パネルの標的シークエンシングを含む。
本開示の別の態様は、核酸分子をシークエンシングするための方法であって、
第1の複数の核酸分子を処理して、第1の偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成すること;
第2の複数の核酸分子を処理して、第2の偏りのないシークエンシングを実施するための第2の複数のライブラリーを生成すること;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成すること;ならびに
シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングして、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成すること
を含む、方法を提供する。
一部の実施形態では、第1の偏りのないシークエンシングは全ゲノムシークエンシング(WGS)を含み、第2の偏りのないシークエンシングはメチル化シークエンシングを含む。一部の実施形態では、メチル化シークエンシングは、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)またはTet支援バイサルファイトシークエンシング(TAB-Seq)を含む。一部の実施形態では、偏りのないシークエンシングは約0.1倍以下、0.5倍以下、約1倍以下、約2倍以下、約3倍以下、約4倍以下、約5倍以下、約6倍以下、約7倍以下、約8倍以下、約9倍以下、約10倍以下、約12倍以下、約14倍以下、約16倍以下、約18倍以下、約20倍以下、約22倍以下、約24倍以下、約26倍以下、約28倍以下、または約30倍以下の深度で実施される。
一部の実施形態では、核酸分子はサンプルから抽出される。一部の実施形態では、サンプルは生物学的サンプルである。
一部の実施形態では、第1の複数の核酸分子および第2の複数の核酸分子は、同じ初期生物学的サンプルから生成される。
本開示の別の態様は、核酸分子をシークエンシングするためのシステムであって、
1つまたはそれより多くのコンピュータプロセッサを含むコントローラ;および
コントローラに作動可能に結合した支持体
を含み;
1つまたはそれより多くのコンピュータプロセッサは、
第1の複数の核酸分子を処理して、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成することを指示し;
第2の複数の核酸分子を処理して、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することを指示し;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示し;
プールされた複数のライブラリーから、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成し;ならびに、
プールされた複数のライブラリーから、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成するように個々にまたは集合的にプログラムされている、システムを提供する。
一部の実施形態では、偏りのないシークエンシングは全ゲノムシークエンシング(WGS)またはメチル化シークエンシングを含む。一部の実施形態では、メチル化シークエンシングは、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)またはTet支援バイサルファイトシークエンシング(TAB-Seq)を含む。一部の実施形態では、偏りのあるシークエンシングは、複数の遺伝子座を含む標的捕捉パネルの標的シークエンシングを含む。一部の実施形態では、標的シークエンシングは標的メチル-seqを含む。
本開示の別の態様は、核酸分子をシークエンシングするためのシステムであって、
1つまたはそれより多くのコンピュータプロセッサを含むコントローラ;および
コントローラに作動可能に結合した支持体
を含み;
1つまたはそれより多くのコンピュータプロセッサは、
第1の複数の核酸分子を処理して、第1の偏りのあるシークエンシングを実施するための第1の複数のライブラリーを生成することを指示し;
第2の複数の核酸分子を処理して、第2の偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することを指示し;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示し;
プールされた複数のライブラリーから、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成し;ならびに、
プールされた複数のライブラリーから、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成するように個々にまたは集合的にプログラムされている、システムを提供する。
一部の実施形態では、第1の偏りのあるシークエンシングは、第1の複数の遺伝子座を含む第1の標的捕捉パネルの標的シークエンシングを含み、第2の偏りのあるシークエンシングは、第2の複数の遺伝子座を含む第2の標的捕捉パネルの標的シークエンシングを含む。
本開示の別の態様は、核酸分子をシークエンシングするためのシステムであって、
1つまたはそれより多くのコンピュータプロセッサを含むコントローラ;および
コントローラに作動可能に結合した支持体
を含み;
1つまたはそれより多くのコンピュータプロセッサは、
第1の複数の核酸分子を処理して、第1の偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成することを指示し;
第2の複数の核酸分子を処理して、第2の偏りのないシークエンシングを実施するための第2の複数のライブラリーを生成することを指示し;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示し;
プールされた複数のライブラリーから、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成し;ならびに、
プールされた複数のライブラリーから、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成するように個々にまたは集合的にプログラムされている、システムを提供する。
一部の実施形態では、第1の偏りのないシークエンシングまたは第2の偏りのないシークエンシングは全ゲノムシークエンシング(WGS)またはメチル化シークエンシングを含む。一部の実施形態では、メチル化シークエンシングは、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)またはTet支援バイサルファイトシークエンシング(TAB-Seq)を含む。
本開示の別の態様は、コンピュータプロセッサにより実行される際の、核酸分子をシークエンシングするための方法を実装する機械実行可能コードを含む非一時的コンピュータ可読媒体であって、方法は、
第1の複数の核酸分子を処理して、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成することを指示すること、
第2の複数の核酸分子を処理して、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することを指示すること;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示すること;
プールされた複数のライブラリーから、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成すること;ならびに、
プールされた複数のライブラリーから、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成すること
を含む、非一時的コンピュータ可読媒体を提供する。
本開示の別の態様は、コンピュータプロセッサにより実行される際の、核酸分子をシークエンシングするための方法を実装する機械実行可能コードを含む非一時的コンピュータ可読媒体であって、方法は、
第1の複数の核酸分子を処理して、第1の偏りのあるシークエンシングを実施するための第1の複数のライブラリーを生成することを指示すること、
第2の複数の核酸分子を処理して、第2の偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することを指示すること;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示すること;
プールされた複数のライブラリーから、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成すること;ならびに、
プールされた複数のライブラリーから、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成すること
を含む、非一時的コンピュータ可読媒体を提供する。
本開示の別の態様は、コンピュータプロセッサにより実行される際の、核酸分子をシークエンシングするための方法を実装する機械実行可能コードを含む非一時的コンピュータ可読媒体であって、方法は、
第1の複数の核酸分子を処理して、第1の偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成することを指示すること、
第2の複数の核酸分子を処理して、第2の偏りのないシークエンシングを実施するための第2の複数のライブラリーを生成することを指示すること;
第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示すること;
プールされた複数のライブラリーから、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成すること;ならびに、
プールされた複数のライブラリーから、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成すること
を含む、非一時的コンピュータ可読媒体を提供する。
本開示のさらなる態様および利点は、本開示の単に例示的な実施形態が示され記載されている以下の詳細な説明から当業者に容易に明らかになる。理解されるように、本開示は他のおよび異なる実施形態が可能であり、そのいくつかの詳細は、様々な明白な態様で改変が可能であり、これらはすべて、本開示から逸脱するものではない。したがって、図面および説明は、限定的ではなく例示的な性質のものであるとみなされるべきである。
参照による援用
本明細書で言及されるすべての刊行物、特許および特許出願は、個々の刊行物、特許または特許出願がそれぞれ、参照により組み込まれると具体的かつ個々に示されているのと同じ程度に、参照により本明細書に組み込まれる。参照により組み込まれる刊行物、特許および特許出願が、本明細書に含まれる本開示と矛盾する程度において、本明細書は、いかなるこのような矛盾材料にも優先しおよび/またはその上位にあることを意図する。
本発明の新規の特徴は、添付の特許請求の範囲に具体的に記載されている。本発明の特徴および利点のより良い理解は、本発明の原理が利用される例示的な実施形態を説明する以下の詳細な説明および添付の図面を参照することにより得られる。
図1は、本明細書で提供される方法またはシステムを実装するようにプログラムされたかまたは別様に構成されたコンピュータシステムを示す;
図2は、開示される実施形態にしたがって、偏りのないおよび偏りのあるシークエンシングを使用して核酸分子をシークエンシングする方法の例を示す;
図3は、開示される実施形態にしたがって、偏りのあるシークエンシングを使用して核酸分子をシークエンシングする方法の例を示す;
図4は、開示される実施形態にしたがって、偏りのないシークエンシングを使用して核酸分子をシークエンシングする方法の例を示す;
図5は、開示される実施形態にしたがって、コントロールライブラリーと共に偏りのあるおよび偏りのないシークエンシングを使用して核酸分子をシークエンシングする方法の例を示す;ならびに
図6は、開示される実施形態にしたがって、偏りのあるおよび/または偏りのないシークエンシングのために調製された核酸分子から得られたシークエンシングリードを元の核酸分子と相関させ得る方法の例を示す。
発明の詳細な説明
本発明の様々な実施形態が本明細書に示され記載されているが、このような実施形態がほんの一例として提供されていることは当業者には明らかである。本発明から逸脱せずに多数の変形、変更および置換を当業者に想起させ得る。本明細書に記載される本発明の実施形態の様々な代替物が用いられ得ることを理解すべきである。
本明細書で使用される場合、「核酸」または「ポリヌクレオチド」という用語は、一般に、核酸サブユニットまたはヌクレオチドを含む分子を指す。核酸は、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)またはそれらのバリアントから選択されるヌクレオチドを含み得る。ヌクレオチドは、一般に、ヌクレオシドおよび少なくとも1、2、3、4、5、6、7、8、9、10個またはそれより多いリン酸(PO)基を含む。ヌクレオチドは、核酸塩基、五炭糖(リボースまたはデオキシリボースのいずれか)およびリン酸基を含み得る。
リボヌクレオチドは、糖がリボースであるヌクレオチドである。デオキシリボヌクレオチドは、糖がデオキシリボースであるヌクレオチドである。ヌクレオチドは、ヌクレオシド一リン酸またはヌクレオシドポリリン酸であり得る。ヌクレオチドは、デオキシリボヌクレオシドポリリン酸、例えば、デオキシアデノシン三リン酸(dATP)、デオキシシチジン三リン酸(dCTP)、デオキシグアノシン三リン酸(dGTP)、ウリジン三リン酸(dUTP)およびデオキシチミジン三リン酸(dTTP)dNTPから選択され得るデオキシリボヌクレオシド三リン酸(dNTP)などであり得、これらは、検出可能なタグ、例えば発光タグまたはマーカー(例えば、フルオロフォア)を含む。ヌクレオチドは、成長中の核酸鎖に組み込まれ得る任意のサブユニットを含み得る。このようなサブユニットは、A、C、G、TもしくはUであり得るか、または相補的A、C、G、TもしくはUに特異的な、もしくはプリン(すなわち、AもしくはGまたはそれらのバリアント)もしくはピリミジン(すなわち、C、TもしくはUまたはそれらのバリアント)に相補的な任意の他のサブユニットであり得る。いくつかの例では、核酸は、デオキシリボ核酸(DNA)、リボ核酸(RNA)またはそれらの誘導体もしくはバリアントである。核酸は、一本鎖または二本鎖であり得る。いくつかの例では、核酸分子は環状である。
本明細書で使用される場合、「核酸分子」、「核酸配列」、「核酸断片」、「オリゴヌクレオチド」および「ポリヌクレオチド」という用語は、一般に、様々な長さを有し得るポリヌクレオチド、例えばデオキシリボヌクレオチドもしくはリボヌクレオチド(RNA)のいずれかまたはそれらの類似体を指す。核酸分子は、少なくとも約10塩基、20塩基、30塩基、40塩基、50塩基、100塩基、200塩基、300塩基、400塩基、500塩基、1キロ塩基(kb)、2kb、3kb、4kb、5kb、10kb、50kbまたはそれを上回る長さを有し得る。オリゴヌクレオチドは、典型的には、4種のヌクレオチド塩基:アデニン(A);シトシン(C);グアニン(G);およびチミン(T)(ポリヌクレオチドがRNAである場合のチミン(T)についてはウラシル(U))の特定の配列から構成される。したがって、「オリゴヌクレオチド配列」という用語は、ポリヌクレオチド分子のアルファベット表記であるか;あるいはこの用語は、ポリヌクレオチド分子それ自体に適用され得る。このアルファベット表記は、中央処理装置を有するコンピュータ中のデータベースにインプットされ得、バイオインフォマティクス用途、例えば機能的ゲノミクスおよび相同性検索に使用され得る。オリゴヌクレオチドは、非標準ヌクレオチド(複数可)、ヌクレオチド類似体(複数可)および/または改変ヌクレオチドを含み得る。
本明細書で使用される場合、「サンプル」という用語は、一般に、生物学的サンプルを指す。生物学的サンプルの例としては、核酸分子、アミノ酸、ポリペプチド、タンパク質、炭水化物、脂肪またはウイルスが挙げられる。いくつかの場合では、サンプルは標的核酸分子を含有する。例では、生物学的サンプルは、核酸分子(複数可)を含む核酸サンプルである。いくつかの例では、生物学的サンプルは、標的核酸分子(複数可)を含む核酸サンプルである。標的核酸分子は無細胞的であり得るか、または無細胞核酸分子、例えば無細胞DNAもしくは無細胞RNAであり得る。標的核酸分子は、ヒト、哺乳動物、非ヒト哺乳動物、類人猿、サル、チンパンジー、爬虫類、両生類または鳥類供給源を含む様々な供給源に由来し得る。さらに、サンプルは、限定されないが、血液、血清、血漿、硝子体、痰、尿、涙、汗、唾液、精液、粘膜排出物、粘液、髄液、羊水、リンパ液などを含む、無細胞配列を含有する様々な動物の体液から抽出され得る。無細胞ポリヌクレオチドは、(妊娠被験体から採取された液体を介して)胎児起源であり得るか、または被験体それ自体の組織に由来し得る。
本明細書で使用される場合、「被験体」という用語は、一般に、処理または分析を受けている生物学的サンプルを有する個体を指す。被験体は、動物または植物であり得る。被験体は、哺乳動物、例えばヒト、イヌ、ネコ、ウマ、ブタまたは齧歯類であり得る。被験体は、例えば、1種もしくは複数種のがん、1種もしくは複数種の感染症、1種もしくは複数種の遺伝的障害または1種もしくは複数種の腫瘍またはそれらの任意の組み合わせなどの疾患を有するまたは有すると疑われる患者であり得る。1種または複数種の腫瘍を有するまたは有すると疑われる被験体について、腫瘍は、1つまたはそれより多くのタイプのものであり得る。
「増幅する」、「増幅」および「核酸増幅」という用語は互換的に使用され、一般に、核酸のコピーを生成することを指す。例えば、DNAの「増幅」は、一般に、DNA分子のコピーを生成することを指す。また、核酸の増幅は、線形的、指数関数的またはそれらの組み合わせであり得る。増幅は、エマルジョンベースであり得るか、または非エマルジョンベースであり得る。核酸増幅方法の非限定的な例としては、逆転写、プライマー伸長、ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、ヘリカーゼ依存性増幅、非対称増幅、ローリングサークル増幅および多重置換増幅(MDA)が挙げられる。PCRが使用される場合、任意の形態のPCRが使用され得、非限定的な例としては、リアルタイムPCR、対立遺伝子特異的PCR、アセンブリPCR、非対称PCR、デジタルPCR、エマルジョンPCR、ダイヤルアウトPCR、ヘリカーゼ依存性PCR、ネステッドPCR、ホットスタートPCR、インバースPCR、メチル化特異的PCR、ミニプライマーPCR、マルチプレックスPCR、ネステッドPCR、オーバーラップエクステンションPCR、熱非対称インターレースPCRおよびタッチダウンPCRが挙げられる。また、増幅は、増幅に参加するかまたはそれを容易にする様々な成分(例えば、プライマー(複数可)、テンプレート、ヌクレオチド、ポリメラーゼ、緩衝液成分、補因子など)を含む反応混合物中で行われ得る。いくつかの場合では、反応混合物は緩衝液を含む。このような緩衝液の非限定的な例としては、マグネシウムイオン緩衝液、マンガンイオン緩衝液およびイソクエン酸緩衝液が挙げられる。このような緩衝液のさらなる例はまた、Tabor,Sら、C.C.PNAS,1989,86,4076-4080ならびに米国特許第5,409,811号および米国特許第5,674,716号(これらはそれぞれ、その全体が参照により本明細書に組み込まれる)に記載されている。
本明細書で使用される場合、「シークエンシング」という用語は、一般に、核酸分子の配列を生成または同定することを指す。シークエンシングは、単一分子シークエンシングまたは合成によるシークエンシングであり得る。シークエンシングは、フローセルなどの支持体上に固定されたテンプレート核酸分子を使用して実施され得る大規模並列アレイシークエンシング(例えば、Illumina(商標)シークエンシング)であり得る。例えば、シークエンシングは、第1世代シークエンシング法、例えばマクサム・ギルバートもしくはサンガーシークエンシングまたはハイスループットシークエンシング(例えば、次世代シークエンシングまたはNGS)法を含み得る。ハイスループットシークエンシング法は、少なくとも約10,000、100,000、100万、1000万、1億、10億個またはそれより多いポリヌクレオチド分子を同時に(または実質的に同時に)シークエンシングし得る。シークエンシング方法としては、限定されないが、パイロシークエンシング、合成によるシークエンシング、単一分子シークエンシング、ナノポアシークエンシング、半導体シークエンシング、ライゲーションによるシークエンシング、ハイブリダイゼーションによるシークエンシング、デジタル遺伝子発現(Helicos)、大規模並列シークエンシング、例えばHelicos,Clonal Single Molecule Array(Solexa/Illumina)、PacBio、SOLiD、Ion TorrentまたはNanoporeプラットフォームを使用したシークエンシングが挙げられ得る。
本明細書で使用される場合、「支持体」という用語は、一般に、固体支持体、例えばスライド、ビーズ、樹脂、チップ、アレイ、マトリックス、膜、ナノポアまたはゲルを指す。固体支持体は、例えば、平坦な基板(例えば、ガラス、プラスチック、シリコンなど)上のビーズ、または基板のウェル内のビーズであり得る。基板は、ビーズを所望の位置(例えば、検出器と作動可能に通信する場所)に保持するための表面特性、例えばテクスチャ、パターン、微細構造コーティング、界面活性剤またはそれらの任意の組み合わせを有し得る。ビーズベースの支持体の検出器は、ビーズのサイズとは無関係に、実質的に同じ読み取り速度を維持するように構成され得る。支持体は、フローセルまたはオープン基板であり得る。さらに、支持体は、生物学的支持体、非生物学的支持体、有機支持体、無機支持体またはそれらの任意の組み合わせを含み得る。支持体は、検出器と光通信し得るか、検出器と物理的に接触し得るか、検出器から一定距離だけ離され得るか、またはそれらの任意の組み合わせであり得る。支持体は、複数の独立して処理可能な位置を有し得る。核酸分子は、複数の独立して処理可能な位置の所定の独立して処理可能な位置で支持体に固定され得る。支持体への複数の核酸分子のそれぞれの固定は、アダプターの使用により支援され得る。支持体は、検出器に光学的に結合され得る。支持体への固定は、アダプターにより支援され得る。
本明細書で使用される場合、「フローセル」という用語は、一般に、物質がポンピングされ得る小さな流体チャネルを含有する支持体を指す。このような物質は、ポリメラーゼ、核酸分子および緩衝液であり得る。いくつかの例では、支持体は官能化され得る。「フローセル」はまた、一般に、反応が行われ得るチャンバーと、試薬をチャンバーに送達するための入口部と、チャンバーから試薬を除去するための出口部とを有する容器を指し得る。一部の実施形態では、チャンバーは、チャンバー中で(例えば、チャンバーと流体接触する表面上で)起こる反応の検出のために構成される。例えば、チャンバーは、チャンバー中のアレイ、光学的に標識された分子などの光学的検出を可能にする1つまたはそれより多くの透明表面を含み得る。フローセルの例としては、限定されないが、核酸シークエンシング装置で使用されているもの、例えばIllumina,Inc.(San Diego,CA)により市販されているGenome Analyzer(登録商標)、MiSeq(登録商標)、NextSeq(登録商標)、HiSeq(登録商標)もしくはNovaSeq(商標)プラットフォームのための;またはLife Technologies(Carlsbad,CA)により市販されているSOLiD(商標)もしくはIon Torrent(商標)シークエンシングプラットフォームのためのフローセルが挙げられる。
本明細書で使用される場合、「検出器」という用語は、一般に、信号を検出し得る光学的および/または電子的部品を一般に含むデバイスを指す。
本明細書で使用される場合、「全ゲノムシークエンシング(WGS)」という用語は、一般に、生物のゲノム全体の配列が決定され得るプロセスを指す。このような生物は、ヒト、動物、ウイルスまたは細菌であり得る。
シークエンシングカバレッジは、一般に、既知の参照塩基に一致するリードの平均数を表す。シークエンシングカバレッジ要件は、用途により変動し得る。いくつかの例では、カバレッジの深度は、約0.1倍、0.5倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍または約10倍より大きくて良い。いくつかの例では、カバレッジの深度は、約10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍または約100倍より大きくて良い。
本明細書で使用される場合、「標的シークエンシング」という用語は、一般に、遺伝子またはゲノムの領域のサブセットをシークエンシングするプロセスを指す。例えば、遺伝子またはゲノム領域のサブセットに対応する複数の核酸分子は、シークエンシングの前に単離、富化および/または増幅され得る。いくつかの例では、エクソーム、目的の特定の遺伝子、遺伝子内の標的またはミトコンドリアDNAがシークエンシングされる。例えば、目的の特定の遺伝子、遺伝子内の標的またはミトコンドリアDNAに対応する複数の核酸分子は、シークエンシングの前に単離、富化および/または増幅され得る。
本明細書で使用される場合、「標的捕捉パネル」という用語は、一般に、特定の疾患または表現型との関連性を有することが公知であるまたは疑われる遺伝子またはゲノム領域(例えば、遺伝子座)の選択セットを含有するパネルを指す。
本明細書で使用される場合、「遺伝子座」という用語は、一般に、染色体またはゲノム核酸分子の任意の領域上の位置であって、正式な連鎖解析または分子遺伝学的研究の目的で別個の遺伝子単位であるとみなされる位置を指す。
本明細書で使用される場合、「バイサルファイトシークエンシング」という用語は、一般に、亜硫酸水素塩による核酸分子の処理を含むシークエンシング方法(例えば、メチル化シトシン(5-メチルシトシン)残基をインタクトなままにしながら、DNA分子の非メチル化シトシン残基をウラシルに選択的に変換すること)を指すバイサルファイトシークエンシングは、(例えば、一塩基分解能で)核酸分子中のメチル化パターンを検出するために使用され得る。
本明細書で使用される場合、「コントロールライブラリー」という用語は、一般に、核酸分子のサンプルを処理して複数のシークエンシングリードを生成するために使用される核酸分子のライブラリーを指す。いくつかの例では、コントロールライブラリーは、偏りのないシークエンシングを使用して生成される。いくつかの例では、コントロールライブラリーは、偏りのあるシークエンシングを使用して生成される。
本明細書で使用される場合、「ポリメラーゼ」という用語は、一般に、重合反応を触媒することができる任意の酵素を指す。ポリメラーゼの例としては、限定されないが、核酸ポリメラーゼが挙げられる。ポリメラーゼは天然に存在するものであり得るか、または合成され得る。いくつかの場合では、ポリメラーゼは、比較的高い処理能力を有する。例示的なポリメラーゼは、Φ29ポリメラーゼまたはその誘導体である。ポリメラーゼは重合酵素であり得る。いくつかの場合では、転写酵素またはリガーゼが使用される(すなわち、結合の形成を触媒する酵素)。ポリメラーゼの例としては、DNAポリメラーゼ、RNAポリメラーゼ、熱安定性ポリメラーゼ、野生型ポリメラーゼ、改変ポリメラーゼ、大腸菌DNAポリメラーゼI、T7 DNAポリメラーゼ、バクテリオファージT4 DNAポリメラーゼ、Φ29(phi29)DNAポリメラーゼ、Taqポリメラーゼ、Tthポリメラーゼ、Tliポリメラーゼ、Pfuポリメラーゼ、Pwoポリメラーゼ、VENTポリメラーゼ、DEEPVENTポリメラーゼ、EX-Taqポリメラーゼ、LA-Taqポリメラーゼ、Ssoポリメラーゼ、Pocポリメラーゼ、Pabポリメラーゼ、Mthポリメラーゼ、ES4ポリメラーゼ、Truポリメラーゼ、Tacポリメラーゼ、Tneポリメラーゼ、Tmaポリメラーゼ、Teaポリメラーゼ、Tihポリメラーゼ、Tfiポリメラーゼ、プラチナTaqポリメラーゼ、Tbrポリメラーゼ、Tflポリメラーゼ、Pfutuboポリメラーゼ、Pyrobestポリメラーゼ、Pwoポリメラーゼ、KODポリメラーゼ、Bstポリメラーゼ、Sacポリメラーゼ、クレノウ断片、3’-5’エキソヌクレアーゼ活性を有するポリメラーゼ、ならびにそれらのバリアント、改変産物および誘導体が挙げられる。いくつかの場合では、ポリメラーゼは、単一サブユニットポリメラーゼである。ポリメラーゼは、高い処理能力、すなわち、核酸テンプレートを放出せずにヌクレオチドを核酸テンプレートに連続的に組み込む能力を有し得る。いくつかの場合では、ポリメラーゼは、例えば、ジデオキシヌクレオチド三リン酸を受け入れるように改変されたポリメラーゼ、例えば667Y変異を有するTaqポリメラーゼである。いくつかの場合では、ポリメラーゼは、核酸シークエンシングに有用であり得る改変ヌクレオチド結合を有するポリメラーゼであり、非限定的な例としては、ThermoSequenasポリメラーゼ(GE Life Sciences)、AmpliTaq FS(ThermoFisher)ポリメラーゼおよびシークエンシング Polポリメラーゼ(Jena Bioscience)が挙げられる。いくつかの場合では、ポリメラーゼは、例えば、ジデオキシヌクレオチドに対する識別力を有するように遺伝子操作されており、例えば、Sequenase DNAポリメラーゼ(ThermoFisher)である。
偏りのあるサンプルの複雑さ
サンプルに基づくシークエンシングライブラリーをバイアスすると、目的の特定領域周辺において信頼が得られ得るが、いくつかの場合では、バイアスすることは、サンプルをシークエンシングするためにシークエンサーが使用するアルゴリズムの問題をもたらし得る。例えば、いくつかのIlluminaシークエンシング技術では、初期シークエンシングサイクル(例えば、シークエンシングの最初から5番目のサイクル、シークエンシングの最初の25サイクルなど)を中心に設計された特定の調整済みフィルタがある。いくつかの例では、シークエンサー上のコンピュータが、初期サイクル(例えば、最初の5サイクル内)において過度に多くの同じ塩基を検出する場合、それは、シークエンシングランのクラッシュをもたらし得る。このようなものとして、いくつかの例では、偏りのあるサンプルがシークエンサーで主にランされ、初期(例えば、最初の5サイクル)の塩基が過度に類似する場合(フローセルの大部分が同じ塩基である場合)、それは、そのフローセル中の個々の塩基を同定する際に矛盾を生じ得る。しかしながら、複雑さを追加することにより、この問題に対処し、情報消失を防止し得る。
いくつかの例では、この情報消失に対処するために、phiX参照ゲノムなどの標準コントロールを偏りのあるサンプルと一緒にランし得る。標準コントロールの追加は、フローセルの単調性を解消するために使用され得る。このようにして、追加された複雑さは、大量のフローセルにわたって同じ塩基が生じ、シークエンシングリードの決定において問題を引き起こすことを防止し得る。特に、コントロールを利用することにより、phiXゲノムなどの異なる塩基を追加し得、目的のサンプルのシークエンシング中にイメージングプロセスの単調性を解消する。そして、これは、シークエンシングアルゴリズムが継続して機能して、目的の標的ゲノム領域周辺のディープシークエンシング情報を生成することを可能にし得る。
しかしながら、phiXコントロールの使用の考えられる欠点は、フローセル上のphiXコントロール専用の空間の喪失を別にすれば、生成され得るシークエンシングデータの量である。phiXコントロールの使用は、複雑さを増加させて目的の特定領域のディープシークエンシングを保証するように機能し得るが、フローセル上の領域の喪失は、特定のサンプルをシークエンシングする効率を減少させ、それによりそのコストを増加させ得、および/または目的の偏りのないサンプルをシークエンシングする能力の低下に相当し得る。
本明細書に記載される方法およびシステムでは、偏りのあるおよび偏りのないライブラリーを組み合わせて、サンプルの所望のラン深度も提供しながら、ある程度の複雑さを生成し得る。偏りのあるおよび偏りのないサンプルを組み合わせることにより、複雑さを増加させるために使用される偏りのないサンプル専用のシークエンサー領域は、望ましいシークエンシング結果をもたらし得る。このようにして、所望の複雑さを達成して、偏りのないサンプルの望ましいシークエンシング結果も生成しながら、所望の深度への偏りのあるサンプルのシークエンシングを可能にし得る。
いくつかの例では、複雑さは、シークエンシングライブラリー内のいくつかのユニークな分子に関連し得る。いくつかの例では、複雑さは、シークエンシングライブラリー内の分子の多様性に関連し得る。フローセル上に存在する各分子の各鎖内では、例えば、保存された領域があり得、より具体的には、読み取られる初期塩基、例えば、その分子に沿って読み取られる約75塩基、および最初の5~20塩基は高度に保存されている可能性があり、その結果、イメージングカメラに対して同様に照らす場合に多数のクラスタが失われる可能性がある。例えば、過度に多い分子が照らされる場合、サンプルをイメージングするカメラは、サンプル内の特定の分子を識別することができない可能性があり、これらはすべて、カメラにとって同じものに見える可能性がある。加えて、アッセイに応じて、どの程度のさらなる多様性を追加する必要があるかに関する様々なガイドラインが存在し得る。例えば、偏りのあるライブラリーの標準的なシークエンシングランでは、例えばphiXゲノムを使用することにより5~10%の多様性をシークエンシングランに追加することを推奨するガイドラインが存在し得る。メチル化ベースのシークエンシング、メチルseqなどの他の用途では、ユーザは、phiXゲノムの使用により、20~30%の多様性を追加する必要があり得る。したがって、多様性を導入するために必要な容量は、ランされているアッセイに応じて変動し得、また、サンプルと、分析されている分子内にどの程度の保存が存在するかに依存し得る。
シークエンサーが大量の利用可能なデータを有し得るいくつかの例では、1つより多くの偏りのあるサンプルおよび/または1つより多くの偏りのないサンプルが、サンプルの組み合わせプールに組み込まれ得る。一部の実施形態では、偏りのあるおよび偏りのないサンプルのセットを一緒にランすることにより、十分な複雑さをフローセル内に生成して、偏りのあるおよび偏りのないサンプルの両方の周辺の所望の深度も得ながら、シークエンサーがそのランを成功裏に完了することを可能にし得る。このようにして、所望の複雑さが達成されるだけではなく、無視可能なシークエンシング(例えば、コントロールバクテリオファージのシークエンシング)に対するフローセル上の領域の喪失を伴わずに、2つまたはそれより多くのタイプのシークエンシングライブラリーからデータを得ることができる。
方法
本開示は、核酸分子のプールされたライブラリーを使用することにより、核酸分子をシークエンシングするための方法を提供する。シークエンシングライブラリーを調製する場合、可能な限り合理的にまたは実用的に高い複雑さレベルを得ることが重要であり得る。ライブラリー複雑さは、有限シークエンシングによりサンプリングされたライブラリー中のユニークな分子の数を指し得る。いくつかの例では、シークエンシングライブラリーの調製の前におよびその間に使用され得る特定の方法は、サンプル複雑さを減少させ得る。例えば、サンプル複雑さは、重複を増加させることにより減少され得る。一部の実施形態では、PCRおよび他のバイアスする方法は、サンプル複雑さを減少させ得る。
いくつかの場合では、核酸分子の少なくとも2つのライブラリーが使用される。核酸分子の各ライブラリーは、偏りのないまたは偏りのあるシークエンシングのいずれかを実施するために処理され得る。いくつかの場合では、偏りのないシークエンシングライブラリーは、全ゲノムアプローチを使用して生成され得る。いくつかの場合では、偏りのないシークエンシングライブラリーは、ショットガンシークエンシングアプローチを使用して生成され得る。いくつかの場合では、偏りのないシークエンシングライブラリーは、ヒトサンプルを採取することにより生成され得、ゲノムの特定の標的領域とは無関係なシークエンシングのためのDNAを調製し得る。
いくつかの場合では、偏りのあるシークエンシングライブラリーは、ゲノム中の特定の領域を特異的にターゲティングすることにより生成され得る。例えば、さらなるシークエンシング深度が、特定の変異(例えば、一塩基多型(SNP)、コピー数多型(CNV)、挿入もしくは欠失(indel,)または融合)の評価における信頼性を増加させるために有益である特定の実施形態では、偏りのあるライブラリーが生成され得る。一部の実施形態では、偏りのあるライブラリーは、最初に偏りのないライブラリーを生成し、次いで標的プルダウンを使用して生成された偏りのないライブラリーをバイアスすることにより生成され得る。いくつかの場合では、標的特異的プライマーが目的の領域をプルダウンし得、非標的領域が破棄され、それにより、偏りのあるライブラリーを生成し得る。一部の実施形態では、偏りのあるライブラリーは、アンプリコンベースのポリメラーゼ連鎖反応(PCR)アプローチを使用して生成され得る。この場合、目的のサンプルを採取し得、PCRベースのアプローチを目的の領域に使用し、それにより、偏りのあるライブラリーを生成し得る。
別個のライブラリーが生成されたら、ライブラリーは一緒にプールされ得る。このライブラリーのプールを実施する場合、考慮され得る1つの検討事項は質量である。質量を検討する場合、偏りのあるおよび偏りのないサンプルの両方をカバーするために十分なリードがあるかを検討することが重要であり得る。一部の実施形態では、質量は、同じ濃度、例えば同じ数の分子に対してサンプルを正規化することにより検討され得る。例えば、同じまたは類似の濃度を有するいくつかの偏りのあるサンプルを考慮して、プールが個々の偏りのあるサンプルと同じまたは類似の濃度を有する偏りのあるサンプルのプールが生成され得る。同じまたは類似の濃度でサンプルをプールして、所望の濃度を有するプールされたサンプルを生成することに加えて、サンプルはまた、サンプルの十分なリードを保証するためにプールされ得る。特に、偏りのないおよび偏りのあるライブラリーがプールされる場合、各ライブラリーからの寄与率は、各偏りのあるサンプルおよび各偏りのないサンプルのための十分なシークエンシングリードを保証するように設計され得る。
一部の実施形態では、偏りのないサンプル対偏りのあるサンプルのパーセンテージは、用途に応じて柔軟であり得る。いくつかのバイアス標的パネルセットでは、より多くのリードが偏りのあるサンプルに割り当てられる必要があり得るように、偏りのあるサンプルのより大きなパネルが提供され得る。この場合、より少ないリードが偏りのないサンプルに割り当てられるように、偏りのないショットガンサンプルはより低い深度でランされ得る。反対に、一部の実施形態では、トータルシークエンシングランに割り当てられるリードのパーセンテージが10%程度しか構成し得ないように、小さな標的とされた偏りのあるパネルが提供され得、それにより、より深い偏りのないアプローチのために90%が利用可能になる。
一部の実施形態では、プールされたライブラリーの成分に起因する寄与率は調整可能であり得る。加えて、いくつかの例では、2つまたはそれより多い固定した偏りのあるプールが、それぞれ2つの異なるパネルセットと共に提供され得る。例では、偏りのないサンプルは、2つの固定した偏りのあるプールに沿ってランされ得る。いくつかの例では、2つの固定した偏りのあるプールは、偏りのないプールを必要とせずに一緒にランされ得る。いくつかの例では、2つの固定した偏りのないプールは、偏りのあるプールからのさらなる寄与を伴わずに、2つの異なるパネルセットと共に提供され得る。このようにして、様々なサンプルタイプにわたっておよびその中で適切な/所望のシークエンシング深度を達成するために、異なる用途が、サンプルおよび用途に基づいて様々なパーセンテージで組み合わされたプールを使用し得る。
いくつかの場合では、核酸分子の各ライブラリーは、核酸分子の他のライブラリーと同じタイプのシークエンシングを実施するために処理され得る。いくつかの場合では、核酸分子の各ライブラリーは、核酸分子の少なくとも1つの他のライブラリーに対して異なるタイプのシークエンシングを実施するために処理され得る。これは、全ゲノムシークエンシングの効率およびコストに関連する問題に対処し得る。
本開示の方法は、2つまたはそれより多い核酸ライブラリーをプールすることを含み得る。いくつかの場合では、フローセル上で十分に複雑さを達成するために、シークエンシング能力の使用を最大化するために、またはそれらの組み合わせのために、少なくとも約2、3、4、5、6、7、8、9、10、20、30、40、50または50個より多いライブラリーがプールされ得る。
本開示の方法を用いてプールされ得るライブラリーの非限定的な例としては、WGSライブラリー、標的ライブラリー、メチル化-Seqライブラリー、RNA-seqライブラリー、偏りのあるRNAライブラリーおよびそれらの任意の組み合わせが挙げられる。いくつかの場合では、WGSライブラリーは、標的ライブラリーと共にプールされる。いくつかの場合では、WGSライブラリーは、メチル化-seqライブラリーと共にプールされる。いくつかの場合では、RNA-seqライブラリーは、偏りのあるRNAライブラリーと共にプールされる。いくつかの場合では、WGSライブラリーは、RNA-seqライブラリーと共にプールされる。いくつかの場合では、RNA-seqライブラリーは、メチル-seqライブラリーと共にプールされる。
プールされた偏りのあるおよび偏りのないライブラリーのシークエンシング
態様では、核酸分子をシークエンシングするための方法が本明細書に開示される。前記方法は、第1の複数の核酸分子を処理することを含み得る。これは、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成し得る。前記方法は、第2の複数の核酸分子を処理することを含み得る。これは、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成し得る。前記方法は、第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを含み得る。前記方法は、シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングし得る。これは、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成し得る。
一部の実施形態では、第1および第2の複数のライブラリーをプールすることは、第1および第2の複数のライブラリーの少なくとも1つと比べて、プールされた複数のライブラリーの複雑さを増加させ得る。一部の実施形態では、第1および第2の複数のライブラリーをプールすることは、第1および第2の複数のライブラリーの少なくとも1つと比べて、プールされた複数のライブラリーの複雑さを約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、175%、200%、250%または250%より多く増加させ得る。
一部の実施形態では、第1および第2の複数の核酸分子は、同じサンプルから供給され得る。一部の実施形態では、第1および第2の複数の核酸分子は、同じ患者由来のサンプルから供給され得る。一部の実施形態では、第1および第2の複数の核酸分子は、同じ家族からの患者由来のサンプルから供給され得る。一部の実施形態では、第1および第2の複数の核酸分子は、同じ人種または民族からの患者由来のサンプルから供給され得る。一部の実施形態では、第1および第2の複数の核酸分子は、同じ性または性別の患者由来のサンプルから供給され得る。
第1および第2の複数の核酸分子が同じサンプルに由来する一部の実施形態では、サンプルの一部は、偏りのあるライブラリー内で第1の複数の核酸分子へと処理され得、サンプルの第2の部分は、偏りのないライブラリー内で第2の複数の核酸分子へと処理され得る。このアプローチでは、第1および第2の複数の核酸分子の部分はシークエンサー上で組み合わされ得、シークエンシングされ得る。
一部の実施形態では、単一の偏りのないライブラリーは、各偏りのあるライブラリーのシークエンシングのためのコントロールとして使用され得る。一部の実施形態では、複数の偏りのあるライブラリーは、コントロール偏りのないライブラリーと一緒にシークエンシングされ得る。一部の実施形態では、一般的なシークエンシングコントロールは、偏りのあるサンプルと同じまたは類似の工程を受けた既知のサンプルからコントロールを生成することにより提供され得る。特に、既知のサンプルの工程が公知であれば、既知のサンプルから得られた情報も十分に特性評価され得るので、phiXなどの十分に特性評価されたコントロールの使用は比較的有益ではない可能性がある。さらに、一部の実施形態では、偏りのないサンプルが偏りのあるサンプルのコントロールであり得、および/または偏りのあるサンプルが偏りのないサンプルのコントロールであり得るように、偏りのないおよび偏りのあるサンプルのプールされた混合物は、各サンプルのコントロールと共にシークエンシングされ得る。
いくつかの例では、第1の複数の核酸分子の処理は、必要に応じて、核酸分子の断片化を伴う。いくつかの場合では、例えば、被験体から得られた無細胞核酸については、処理は断片化を伴わなくてもよい。第1の複数の核酸分子の断片化は、物理的方法、酵素的方法または化学的方法により行われ得る。断片化の物理的方法のいくつかの例としては、限定されないが、音響剪断または超音波処理が挙げられる。酵素的方法のいくつかの例としては、限定されないが、非特異的エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応が挙げられる。いくつかの例では、第1の複数の核酸分子の処理は、第1の複数の核酸分子の断片のサイジングを伴う。第1の複数の核酸分子の断片の好ましいサイズは、約50塩基未満、約100塩基未満、約200塩基未満、約400塩基未満、約600塩基未満、約800塩基未満、約1000塩基未満、約50塩基もしくはそれよりも多く、約100塩基もしくはそれよりも多く、約200塩基もしくはそれよりも多く、約400塩基もしくはそれよりも多く、約600塩基もしくはそれよりも多く、約800塩基もしくはそれよりも多く、約10塩基~約1000塩基、約20塩基~約800塩基、約30塩基~約600塩基、約40塩基~約400塩基、約50塩基~約200塩基または約40塩基~約100であり得る。一部の実施形態では、第1の複数の核酸分子の断片の好ましいサイズはまた、およそ1,000塩基;10,000塩基;100,000塩基;1,000,000塩基;または1,000,000塩基より長い塩基長を有し得る。
いくつかの例では、第1の複数の核酸分子はDNAである。第1の複数の核酸分子の処理は、5’末端の平滑末端化およびリン酸化を伴い得る。5’末端の平滑末端化およびリン酸化は、少なくとも1つの酵素を使用して達成され得る。これらの酵素は、T4ポリヌクレオチドキナーゼ、T4 DNAポリメラーゼまたはクレノウ大断片であり得る。第1の複数の核酸分子の処理は、3’末端のA-テーリングを伴い得る。3’末端のA-テーリングは、酵素を使用し得る。これらの酵素は、Taqポリメラーゼまたはクレノウ断片であり得る。第1の複数の核酸分子の処理は、多重化を伴い得る。第1の複数の核酸分子の処理は、タグ付けを伴い得る。タグ付けは、トランスポザーゼ酵素を使用して核酸分子を同時に断片化およびタグ付けすることを伴い得る。
いくつかの例では、第1の複数の核酸分子はRNAである。第1の複数の核酸分子の処理は、DNAアダプターとのライゲーションを伴い得る。DNAアダプターは、ブロック3’末端を有するアデニル化DNAアダプターであり得る。ライゲーションは、トランケート型T4 RNAリガーゼ2を使用して行われ得る。第1の複数の核酸分子の処理は、アダプターの追加を伴い得る。このアダプターは5’RNAアダプターであり得る。第1の複数の核酸分子の処理は、プライマーのハイブリダイゼーションを伴い得る。このプライマーは逆転写プライマーであり得る。第1の複数の核酸分子の処理は、相補的DNA(cDNA)合成に基づくものであり得る。この合成は、限定されないが、ランダムプライマーもしくはオリゴdTプライマーの使用またはアダプターの結合を伴い得る。第1の複数の核酸分子の処理は、限定されないが、プライマーを使用してcDNA合成を開始させることを伴い得る。次いで、これは、アダプター配列をcDNA分子に追加するテンプレートスイッチングを伴い得る。
第1の複数の核酸分子の処理は、限定されないが、増幅の減少を伴い得る。第1の複数の核酸分子の処理は、限定されないが、重複リードを減少させることを伴い得る。第1の複数の核酸分子の処理は、限定されないが、インデックス付きアダプターの複数の組み合わせを使用することを伴い得る。第1の複数の核酸分子の処理は、限定されないが、バッチ効果を軽減することを伴い得る。第1の複数の核酸分子の処理は、限定されないが、日ごとのサンプル処理における変動性を減少させることを伴い得る。これは、反応条件、試薬バッチ、ピペッティング精度およびヒューマンエラーの日ごとの変動性を減少させることを伴い得る。
いくつかの例では、第2の複数の核酸分子の処理は、核酸分子の断片化を伴う。第2の複数の核酸分子の断片化は、物理的方法、酵素的方法または化学的方法により行われ得る。断片化の物理的方法のいくつかの例としては、限定されないが、音響剪断または超音波処理が挙げられる。酵素的方法のいくつかの例としては、限定されないが、非特異的エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応が挙げられる。いくつかの例では、第2の複数の核酸分子の処理は、第2の複数の核酸分子の断片のサイジングを伴う。第2の複数の核酸分子の断片の好ましいサイズは、約50塩基未満、約100塩基未満、約200塩基未満、約400塩基未満、約600塩基未満、約800塩基未満、約1000塩基未満、約50塩基もしくはそれよりも多く、約100塩基もしくはそれよりも多く、約200塩基もしくはそれよりも多く、約400塩基もしくはそれよりも多く、約600塩基もしくはそれよりも多く、約800塩基もしくはそれよりも多く、約10塩基~約1000塩基、約20塩基~約800塩基、約30塩基~約600塩基、約40塩基~約400塩基、約50塩基~約200塩基または約40塩基~約100であり得る。
いくつかの例では、第2の複数の核酸分子はDNAである。第2の複数の核酸分子の処理は、5’末端の平滑末端化およびリン酸化を伴い得る。5’末端の平滑末端化およびリン酸化は、少なくとも1つの酵素を使用して達成され得る。これらの酵素は、T4ポリヌクレオチドキナーゼ、T4 DNAポリメラーゼまたはクレノウ大断片であり得る。第2の複数の核酸分子の処理は、3’末端のA-テーリングを伴い得る。3’末端のA-テーリングは、酵素を使用し得る。これらの酵素は、Taqポリメラーゼまたはクレノウ断片であり得る。第2の複数の核酸分子の処理は、多重化を伴い得る。第2の複数の核酸分子の処理は、タグ付けを伴い得る。タグ付けは、トランスポザーゼ酵素を使用して核酸分子を同時に断片化およびタグ付けすることを伴い得る。
いくつかの例では、第2の複数の核酸分子はRNAである。第2の複数の核酸分子の処理は、DNAアダプターとのライゲーションを伴い得る。DNAアダプターは、ブロック3’末端を有するアデニル化DNAアダプターであり得る。ライゲーションは、トランケート型T4 RNAリガーゼ2を使用して行われ得る。第2の複数の核酸分子の処理は、アダプターの追加を伴い得る。このアダプターは5’RNAアダプターであり得る。第2の複数の核酸分子の処理は、プライマーのハイブリダイゼーションを伴い得る。このプライマーは逆転写プライマーであり得る。第2の複数の核酸分子の処理は、cDNA合成に基づくものであり得る。この合成は、限定されないが、ランダムプライマーもしくはオリゴdTプライマーの使用またはアダプターの結合を伴い得る。第2の複数の核酸分子の処理は、限定されないが、プライマーを使用してcDNA合成を開始させることを伴い得る。次いで、これは、アダプター配列をcDNA分子に追加するテンプレートスイッチングを伴い得る。
第2の複数の核酸分子の処理は、限定されないが、増幅を増加させることを伴い得る。第2の複数の核酸分子の処理は、限定されないが、重複リードを増加させることを伴い得る。第2の複数の核酸分子の処理は、限定されないが、インデックス付きアダプターの最小の組み合わせを使用することを伴い得る。第2の複数の核酸分子の処理は、限定されないが、バッチ効果を強調することを伴い得る。第2の複数の核酸分子の処理は、限定されないが、日ごとのサンプル処理における変動性を増加させることを伴い得る。これは、反応条件、試薬バッチ、ピペッティング精度およびヒューマンエラーの日ごとの変動性を増加させることを伴い得る。
いくつかの例では、第1の複数のライブラリーおよび第2の複数のライブラリーはプールされる。プールされた複数のライブラリーが生成され得る。プールすることは、限定されないが、混合することを伴い得る。
いくつかの例では、プールされた複数のライブラリーのシークエンシングは、限定されないが、全ゲノムシークエンシング(WGS)、デノボシークエンシング、メイトペアシークエンシング、染色体免疫沈降シークエンシング(ChIP-seq)、RNA免疫沈降シークエンシング(RIP-seq)、架橋および免疫沈降シークエンシング(CLIP-seq)を伴う。シークエンシングは、限定されないが、フローセルシークエンシングを伴い得る。シークエンシングは、限定されないが、パターン化フローセルシークエンシングを伴い得る。
偏りのないシークエンシングは、全ゲノムシークエンシング(WGS)、デノボシークエンシング、メイトペアシークエンシング、染色体免疫沈降シークエンシング(ChIP-seq)、RNA免疫沈降シークエンシング(RIP-seq)、架橋および免疫沈降シークエンシング(CLIP-seq)ならびにRNAシークエンシング(RNA-Seq)を含み得る。偏りのないシークエンシングは、限定されないが、フローセルシークエンシングを伴い得る。偏りのないシークエンシングは、限定されないが、パターン化フローセルシークエンシングを伴い得る。
偏りのあるシークエンシングは、全ゲノムシークエンシング(WGS)、デノボシークエンシング、メイトペアシークエンシング、染色体免疫沈降シークエンシング(ChIP-seq)、RNA免疫沈降シークエンシング(RIP-seq)、架橋および免疫沈降シークエンシング(CLIP-seq)を含み得る。偏りのあるシークエンシングは、限定されないが、フローセルシークエンシングを伴い得る。偏りのあるシークエンシングは、限定されないが、パターン化フローセルシークエンシングを伴い得る。
シークエンシング(例えば、偏りのある、偏りのないまたはその両方)は、約0.1倍以下、0.5倍以下、約1倍以下、約2倍以下、約3倍以下、約4倍以下、約5倍以下、約6倍以下、約7倍以下、約8倍以下、約9倍以下、約10倍以下、約15倍以下、約20倍以下、約30倍以下、約40倍以下、約50倍以下、約60倍以下、約70倍以下、約80倍以下、約90倍以下、約100倍以下、約200倍以下、約300倍以下、約400倍以下、約500倍以下、約600倍以下、約700倍以下、約800倍以下、約900倍以下、約1000倍以下、少なくとも約0.1倍、少なくとも約0.5倍、少なくとも約1倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約15倍、少なくとも約20倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約60倍、少なくとも約70倍、少なくとも約80倍以下、少なくとも約90倍、少なくとも約100倍、少なくとも約200倍、少なくとも約300倍、少なくとも約400倍、少なくとも約500倍、少なくとも約600倍、少なくとも約700倍、少なくとも約800倍、少なくとも約900倍、少なくとも約1000倍、少なくとも約2000倍、少なくとも約3000倍、少なくとも約4000倍、少なくとも約5000倍、少なくとも約6000倍、少なくとも約7000倍、少なくとも約8000倍、少なくとも約9000倍、または少なくとも約10,000倍の深度で実施され得る。
一部の実施形態では、偏りのあるシークエンシングは第1の深度で実施され得、偏りのないシークエンシングは第2の深度で実施され得る。一部の実施形態では、第1の深度は、第2の深度と同じまたは実質的に類似であり得る。一部の実施形態では、第1の深度は、第2の深度を超え得る。一部の実施形態では、第2の深度は、第1の深度を超え得る。
一部の実施形態では、第1のライブラリーのシークエンシングは第1の深度で実施され得、第2のライブラリーのシークエンシングは第2の深度で実施され得る。一部の実施形態では、第1の深度は、第2の深度と同じまたは実質的に類似であり得る。一部の実施形態では、第1の深度は、第2の深度を超え得る。一部の実施形態では、第2の深度は、第1の深度を超え得る。一部の実施形態では、複数のライブラリーがシークエンシングされ得、複数のライブラリーの1つまたはそれよりも多くは異なる深度でシークエンシングされる。
偏りのあるシークエンシングは、複数の遺伝子座を含む標的捕捉パネルの標的シークエンシングを含み得る。例えば、偏りのあるシークエンシングは、標的メチル-seqを含み得る。標的シークエンシングは、(i)ハイブリダイゼーション捕捉アプローチ、(ii)微小液滴PCT液滴ライブラリー、(iii)カスタム設計液滴ライブラリーおよび(iv)アンプリコンシークエンシングの少なくとも1つを含み得る。
偏りのないシークエンシングは、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)、Tet支援バイサルファイトシークエンシング(TAB-Seq)などを含み得る。亜硫酸水素ナトリウムによる核酸分子の処理は、ウラシルへの非メチル化シトシンの化学的変換をもたらし得、メチル化シトシンは保護され得る。
前記方法は、第2の複数のシークエンシングリードを生成することをさらに含み得る。第2の複数のシークエンシングリードは、コントロールライブラリーとして第1の複数のライブラリーの少なくとも一部を使用することを含み得る。
前記方法は、第3の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することをさらに含み得る。第3の複数のライブラリーは、第1の複数のシークエンシングリードまたは第2の複数のシークエンシングリードを生成するためのコントロールライブラリーを含み得る。
いくつかの例では、第1の複数の核酸分子および第2の複数の核酸分子は、DNA分子を含む。いくつかの例では、第1の複数の核酸分子および第2の複数の核酸分子は、RNA分子を含む。いくつかの例では、第1の複数の核酸分子および第2の複数の核酸分子は、DNAおよびRNA分子の組み合わせを含む。
核酸のシークエンシングは、次世代シークエンシングなどの任意の適切な方法を使用して実施され得る。一部の実施形態では、核酸のシークエンシングは、連鎖停止シークエンシング、ハイブリダイゼーションシークエンシング、Illuminaシークエンシング、イオントレント半導体シークエンシング、質量分光測光シークエンシング(mass spectrophotometry sequencing)、大規模並列シグネチャシークエンシング(MPSS)、マクサム・ギルバートシークエンシング、ナノポアシークエンシング、ポロニーシークエンシング、パイロシークエンシング、ショットガンシークエンシング、単一分子リアルタイム(SMRT)シークエンシング、SOLiDシークエンシング、ユニバーサルシークエンシングまたはそれらの任意の組み合わせを使用して実施され得る。一部の実施形態では、シークエンシングはデジタルPCRを含み得る。いくつかの例では、シークエンシングプラットフォームは、Illumina(商標)シークエンサーである。一部の実施形態では、シークエンシングプラットフォームは、例えば、フローセル当たり約20億個より多いリードのアウトプット範囲を含む。一部の実施形態では、シークエンシングプラットフォームはNovaSeq(商標)である。
プールされた別個の偏りのあるライブラリーのシークエンシング
態様では、核酸分子をシークエンシングするための方法が本明細書に開示される。前記方法は、第1の複数の核酸分子を処理することを含み得る。これは、第1の偏りのあるシークエンシングを実施するための第1の複数のライブラリーを生成し得る。前記方法は、第2の複数の核酸分子を処理することを含み得る。これは、第2の偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成し得る。前記方法は、第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを含み得る。前記方法は、シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングし得る。これは、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成し得る。
いくつかの例では、第1および第2の複数の核酸分子の処理は、核酸分子の断片化を伴う。第1および第2の複数の核酸分子の断片化は、物理的方法、酵素的方法または化学的方法により行われ得る。断片化の物理的方法のいくつかの例としては、限定されないが、音響剪断または超音波処理が挙げられる。酵素的方法のいくつかの例としては、限定されないが、非特異的エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応が挙げられる。いくつかの例では、第1および第2の複数の核酸分子の処理は、第1の複数の核酸分子の断片のサイジングを伴う。第1の複数の核酸分子の断片の好ましいサイズは、約50塩基未満、約100塩基未満、約200塩基未満、約400塩基未満、約600塩基未満、約800塩基未満、約1000塩基未満、約50塩基もしくはそれよりも多く、約100塩基もしくはそれよりも多く、約200塩基もしくはそれよりも多く、約400塩基もしくはそれよりも多く、約600塩基もしくはそれよりも多く、約800塩基もしくはそれよりも多く、約10塩基~約1000塩基、約20塩基~約800塩基、約30塩基~約600塩基、約40塩基~約400塩基、約50塩基~約200塩基または約40塩基~約100であり得る。
いくつかの例では、第1および第2の複数の核酸分子はDNAである。第1および第2の複数の核酸分子の処理は、5’末端の平滑末端化およびリン酸化を伴い得る。5’末端の平滑末端化およびリン酸化は、少なくとも1つの酵素を使用して達成され得る。これらの酵素は、T4ポリヌクレオチドキナーゼ、T4 DNAポリメラーゼまたはクレノウ大断片であり得る。第1および第2の複数の核酸分子の処理は、3’末端のA-テーリングを伴い得る。3’末端のA-テーリングは、酵素を使用し得る。これらの酵素は、Taqポリメラーゼまたはクレノウ断片であり得る。第1および第2の複数の核酸分子の処理は、多重化を伴い得る。第1および第2の複数の核酸分子の処理は、タグ付けを伴い得る。タグ付けは、トランスポザーゼ酵素を使用して核酸分子を同時に断片化およびタグ付けすることを伴い得る。
いくつかの例では、第1および第2の複数の核酸分子はRNAである。第1および第2の複数の核酸分子の処理は、DNAアダプターとのライゲーションを伴い得る。DNAアダプターは、ブロック3’末端を有するアデニル化DNAアダプターであり得る。ライゲーションは、トランケート型T4 RNAリガーゼ2を使用して行われ得る。第1および第2の複数の核酸分子の処理は、アダプターの追加を伴い得る。このアダプターは5’RNAアダプターであり得る。第1および第2の複数の核酸分子の処理は、プライマーのハイブリダイゼーションを伴い得る。このプライマーは逆転写プライマーであり得る。第1および第2の複数の核酸分子の処理は、cDNA合成に基づくものであり得る。この合成は、限定されないが、ランダムプライマーもしくはオリゴdTプライマーの使用またはアダプターの結合を伴い得る。第1および第2の複数の核酸分子の処理は、限定されないが、プライマーを使用してcDNA合成を開始させることを伴い得る。次いで、これは、アダプター配列をcDNA分子に追加するテンプレートスイッチングを伴い得る。
第1および第2の複数の核酸分子の処理は、限定されないが、増幅を増加させることを伴い得る。第1および第2の複数の核酸分子の処理は、限定されないが、重複リードを増加させることを伴い得る。第1および第2の複数の核酸分子の処理は、限定されないが、インデックス付きアダプターの最小の組み合わせを使用することを伴い得る。第1および第2の複数の核酸分子の処理は、限定されないが、バッチ効果を強調することを伴い得る。第1および第2の複数の核酸分子の処理は、限定されないが、日ごとのサンプル処理における変動性の増加を伴い得る。これは、反応条件、試薬バッチ、ピペッティング精度およびヒューマンエラーの日ごとの変動性の増加を伴い得る。
いくつかの例では、第1の複数のライブラリーおよび第2の複数のライブラリーはプールされる。プールされた複数のライブラリーが生成され得る。プールすることは、限定されないが、混合することを伴い得る。
いくつかの例では、プールされた複数のライブラリーのシークエンシングは、限定されないが、全ゲノムシークエンシング(WGS)、デノボシークエンシング、メイトペアシークエンシング、染色体免疫沈降シークエンシング(ChIP-seq)、RNA免疫沈降シークエンシング(RIP-seq)、架橋および免疫沈降シークエンシング(CLIP-seq)を伴う。シークエンシングは、限定されないが、フローセルシークエンシングを伴い得る。シークエンシングは、限定されないが、パターン化フローセルシークエンシングを伴い得る。
いくつかの例では、第1の偏りのあるシークエンシングは、第1の複数の遺伝子座を含む第1の標的捕捉パネルの標的シークエンシングを含み得る。例えば、第1の偏りのあるシークエンシングは、標的メチル-seqを含み得る。標的シークエンシングは、(i)ハイブリダイゼーション捕捉アプローチ、(ii)微小液滴PCT液滴ライブラリー、(iii)カスタム設計液滴ライブラリーおよび(iv)アンプリコンシークエンシングの少なくとも1つを含み得る。いくつかの例では、第2の偏りのあるシークエンシングは、第2の複数の遺伝子座を含む第2の標的捕捉パネルの標的シークエンシングを含み得る。例えば、第2の偏りのあるシークエンシングは、標的メチル-seqを含み得る。標的シークエンシングは、(i)ハイブリダイゼーション捕捉アプローチ、(ii)微小液滴PCT液滴ライブラリー、(iii)カスタム設計液滴ライブラリーおよび(iv)アンプリコンシークエンシングの少なくとも1つを含み得る。
プールされた別個の偏りのないライブラリーのシークエンシング
態様では、核酸分子をシークエンシングするための方法が本明細書に開示される。前記方法は、第1の複数の核酸分子を処理することを含み得る。これは、第1の偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成し得る。前記方法は、第2の複数の核酸分子を処理することを含み得る。これは、第2の偏りのないシークエンシングを実施するための第2の複数のライブラリーを生成し得る。前記方法は、第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを含み得る。前記方法は、シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングし得る。これは、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成し得る。
いくつかの例では、第1および第2の複数の核酸分子の処理は、必要に応じて、核酸分子の断片化を伴う。いくつかの場合では、例えば、被験体から得られた無細胞核酸については、処理は断片化を伴わなくてもよい。第1および第2の複数の核酸分子の断片化は、物理的方法、酵素的方法または化学的方法により行われ得る。断片化の物理的方法のいくつかの例としては、限定されないが、音響剪断または超音波処理が挙げられる。酵素的方法のいくつかの例としては、限定されないが、非特異的エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応が挙げられる。いくつかの例では、第1および第2の複数の核酸分子の処理は、第1の複数の核酸分子の断片のサイジングを伴う。第1の複数の核酸分子の断片の好ましいサイズは、約50塩基未満、約100塩基未満、約200塩基未満、約400塩基未満、約600塩基未満、約800塩基未満、約1000塩基未満、約50塩基もしくはそれよりも多く、約100塩基もしくはそれよりも多く、約200塩基もしくはそれよりも多く、約400塩基もしくはそれよりも多く、約600塩基もしくはそれよりも多く、約800塩基もしくはそれよりも多く、約10塩基~約1000塩基、約20塩基~約800塩基、約30塩基~約600塩基、約40塩基~約400塩基、約50塩基~約200塩基または約40塩基~約100であり得る。一部の実施形態では、第1の複数の核酸分子の断片の好ましいサイズはまた、およそ1,000塩基;10,000塩基;100,000塩基;1,000,000塩基;または1,000,000塩基より長い塩基長を有し得る。
いくつかの例では、第1および第2の複数の核酸分子はDNAである。第1および第2の複数の核酸分子の処理は、5’末端の平滑末端化およびリン酸化を伴い得る。5’末端の平滑末端化およびリン酸化は、少なくとも1つの酵素を使用して達成され得る。これらの酵素は、T4ポリヌクレオチドキナーゼ、T4 DNAポリメラーゼまたはクレノウ大断片であり得る。第1および第2の複数の核酸分子の処理は、3’末端のA-テーリングを伴い得る。3’末端のA-テーリングは、酵素を使用し得る。これらの酵素は、Taqポリメラーゼまたはクレノウ断片であり得る。第1および第2の複数の核酸分子の処理は、多重化を伴い得る。第1および第2の複数の核酸分子の処理は、タグ付けを伴い得る。タグ付けは、トランスポザーゼ酵素を使用して核酸分子を同時に断片化およびタグ付けすることを伴い得る。
いくつかの例では、第1および第2の複数の核酸分子はRNAである。第1および第2の複数の核酸分子の処理は、DNAアダプターとのライゲーションを伴い得る。DNAアダプターは、ブロック3’末端を有するアデニル化DNAアダプターであり得る。ライゲーションは、トランケート型T4 RNAリガーゼ2を使用して行われ得る。第1および第2の複数の核酸分子の処理は、アダプターの追加を伴い得る。このアダプターは5’RNAアダプターであり得る。第1および第2の複数の核酸分子の処理は、プライマーのハイブリダイゼーションを伴い得る。このプライマーは逆転写プライマーであり得る。第1および第2の複数の核酸分子の処理は、cDNA合成に基づくものであり得る。この合成は、限定されないが、ランダムプライマーもしくはオリゴdTプライマーの使用またはアダプターの結合を伴い得る。第1および第2の複数の核酸分子の処理は、限定されないが、プライマーを使用してcDNA合成を開始させることを伴い得る。次いで、これは、アダプター配列をcDNA分子に追加するテンプレートスイッチングを伴い得る。
第1の複数の核酸分子の処理は、限定されないが、増幅の減少を伴い得る。第1の複数の核酸分子の処理は、限定されないが、重複リードを減少させること(例えば、コンセンサス配列を生成すること)またはリード中の塩基エラーを検出/修正することを伴い得る。第1の複数の核酸分子の処理は、限定されないが、インデックス付きアダプターの複数の組み合わせを使用することを伴い得る。第1の複数の核酸分子の処理は、限定されないが、バッチ効果を軽減することを伴い得る。第1の複数の核酸分子の処理は、限定されないが、日ごとのサンプル処理における変動性を減少させることを伴い得る。これは、反応条件、試薬バッチ、ピペッティング精度およびヒューマンエラーの日ごとの変動性を減少させることを伴い得る。
いくつかの例では、第1の偏りのないシークエンシングは、全ゲノムシークエンシングを含む。いくつかの例では、第1の偏りのないシークエンシングは、RNAシークエンシングを含む。いくつかの例では、第1の偏りのないシークエンシングは、全ゲノムシークエンシングおよびRNAシークエンシングを含む。いくつかの例では、第1の偏りのないシークエンシングは、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)、Tet支援バイサルファイトシークエンシング(TAB-Seq)などを含む。いくつかの例では、第2の偏りのないシークエンシングは、RNAシークエンシングを含む。いくつかの例では、第2の偏りのないシークエンシングは、全ゲノムシークエンシングおよびRNAシークエンシングを含む。いくつかの例では、第2の偏りのないシークエンシングは、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)、Tet支援バイサルファイトシークエンシング(TAB-Seq)などを含む。
偏りのないシークエンシングは、約0.1倍以下、0.5倍以下、約1倍以下、約2倍以下、約3倍以下、約4倍以下、約5倍以下、約6倍以下、約7倍以下、約8倍以下、約9倍以下、約10倍以下、約15倍以下、約20倍以下、約30倍以下、約40倍以下、約50倍以下、約60倍以下、約70倍以下、約80倍以下、約90倍以下、約100倍以下、約200倍以下、約300倍以下、約400倍以下、約500倍以下、約600倍以下、約700倍以下、約800倍以下、約900倍以下、約1000倍以下、少なくとも約0.1倍、少なくとも約0.5倍、少なくとも約1倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約15倍、少なくとも約20倍、少なくとも約30倍、少なくとも約40倍、少なくとも約50倍、少なくとも約60倍、少なくとも約70倍、少なくとも約80倍以下、少なくとも約90倍、少なくとも約100倍、少なくとも約200倍、少なくとも約300倍、少なくとも約400倍、少なくとも約500倍、少なくとも約600倍、少なくとも約700倍、少なくとも約800倍、少なくとも約900倍、少なくとも約1000倍、少なくとも約2000倍、少なくとも約3000倍、少なくとも約4000倍、少なくとも約5000倍、少なくとも約6000倍、少なくとも約7000倍、少なくとも約8000倍、少なくとも約9000倍、または少なくとも約10,000倍の深度で実施され得る。
いくつかの例では、本明細書に記載される方法において使用される核酸分子は、サンプルから抽出される。サンプルは、生物学的サンプルであり得る。
システム
別の態様では、核酸分子をシークエンシングするためのシステムが本明細書に開示される。システムはコントローラを含み得る。システムはまた、コントローラに作動可能に結合した支持体を含み得る。コントローラは、1つまたはそれより多くのコンピュータプロセッサを含み得る。1つまたはそれより多くのコンピュータプロセッサは、第1の複数の核酸分子を処理して、第1の複数のライブラリーを生成することを指示するように個々にまたは集合的にプログラムされ得る。これは、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成し得る。コンピュータプロセッサは、第2の複数の核酸分子を処理して、第2の複数のライブラリーを生成することを指示するように個々にまたは集合的にプログラムされ得る。これは、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成し得る。コンピュータプロセッサは、第1の複数のライブラリーおよび第2の複数のライブラリーをプールすることを指示するように個々にまたは集合的にプログラムされ得る。これは、プールされた複数のライブラリーを生成し得る。このプールされた複数のライブラリーは、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成するために使用され得る。このプールされた複数のライブラリーはまた、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成するために使用され得る。
別の態様では、核酸分子をシークエンシングするためのシステムが本明細書に開示される。システムはコントローラを含み得る。システムはまた、コントローラに作動可能に結合した支持体を含み得る。コントローラは、1つまたはそれより多くのコンピュータプロセッサを含み得る。1つまたはそれより多くのコンピュータプロセッサは、第1の複数の核酸分子を処理して、第1の複数のライブラリーを生成することを指示するように個々にまたは集合的にプログラムされ得る。これは、第1の偏りのあるシークエンシングを実施するための第1の複数のライブラリーを生成し得る。コンピュータプロセッサは、第2の複数の核酸分子を処理して、第2の複数のライブラリーを生成することを指示するように個々にまたは集合的にプログラムされ得る。これは、第2の偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成し得る。コンピュータプロセッサは、第1の複数のライブラリーおよび第2の複数のライブラリーをプールすることを指示するように個々にまたは集合的にプログラムされ得る。これは、プールされた複数のライブラリーを生成し得る。このプールされた複数のライブラリーは、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成するために使用され得る。このプールされた複数のライブラリーはまた、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成するために使用され得る。
別の態様では、核酸分子をシークエンシングするためのシステムが本明細書に開示される。システムはコントローラを含み得る。システムはまた、コントローラに作動可能に結合した支持体を含み得る。コントローラは、1つまたはそれより多くのコンピュータプロセッサを含み得る。1つまたはそれより多くのコンピュータプロセッサは、第1の複数の核酸分子を処理して、第1の複数のライブラリーを生成することを指示するように個々にまたは集合的にプログラムされ得る。これは、第1の偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成し得る。コンピュータプロセッサは、第2の複数の核酸分子を処理して、第2の複数のライブラリーを生成することを指示するように個々にまたは集合的にプログラムされ得る。これは、第2の偏りのないシークエンシングを実施するための第2の複数のライブラリーを生成し得る。コンピュータプロセッサは、第1の複数のライブラリーおよび第2の複数のライブラリーをプールすることを指示するように個々にまたは集合的にプログラムされ得る。これは、プールされた複数のライブラリーを生成し得る。このプールされた複数のライブラリーは、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成するために使用され得る。このプールされた複数のライブラリーはまた、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成するために使用され得る。
ソフトウェア
態様では、機械実行可能コードを含み得る非一時的コンピュータ可読媒体が本明細書に記載される。コンピュータプロセッサにより実行される際の、機械実行可能コードは、核酸分子をシークエンシングするための方法を実装し得る。実装される方法は、第1の複数の核酸分子を処理して、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成することを含み得る。実装される方法は、第2の複数の核酸分子を処理して、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することを含み得る。実装される方法は、第1の複数のライブラリーおよび第2の複数のライブラリーをプールし得る。実装される方法は、プールされた複数のライブラリーを生成し得る。実装される方法は、シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングし得る。実装される方法は、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成し得る。
態様では、機械実行可能コードを含み得る非一時的コンピュータ可読媒体が本明細書に記載される。コンピュータプロセッサにより実行される際の、機械実行可能コードは、核酸分子をシークエンシングするための方法を実装し得る。実装される方法は、第1の複数の核酸分子を処理し得る。実装される方法は、第1の偏りのあるシークエンシングを実施するための第1の複数のライブラリーを生成し得る。実装される方法は、第2の複数の核酸分子を処理し得る。実装される方法は、第2の偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成し得る。実装される方法は、第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成し得る。実装される方法は、シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングし得る。実装される方法は、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成し得る。
態様では、機械実行可能コードを含み得る非一時的コンピュータ可読媒体が本明細書に記載される。1つまたはそれより多くのコンピュータプロセッサにより実行される際の、機械実行可能コードは、核酸分子をシークエンシングするための方法を実装し得る。実装される方法は、第1の複数の核酸分子を処理し得る。実装される方法は、第1の偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成し得る。実装される方法は、第2の複数の核酸分子を処理し得る。実装される方法は、第2の偏りのないシークエンシングを実施するための第2の複数のライブラリーを生成し得る。実装される方法は、第1の複数のライブラリーおよび第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成し得る。実装される方法は、シークエンシングプラットフォームの単一のフローセルを使用して、プールされた複数のライブラリーをシークエンシングし得る。実装される方法は、第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成し得る。
コンピュータシステム
本開示は、本開示の方法を実装するようにプログラムされたコンピュータシステムを提供する。図1は、核酸配列および配列分析を実施するなど、本開示の方法またはシステムを実装するようにプログラムされたかまたは別様に構成されたコンピュータシステム101を示す。
コンピュータシステム101は、シングルコアもしくはマルチコアプロセッサ、または並列処理のための複数のプロセッサであり得る中央処理装置(CPU、また本明細書では「プロセッサ」および「コンピュータプロセッサ」)105を含み得る。コンピュータシステム101はまた、メモリまたはメモリ位置110(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)と、電子記憶装置115(例えば、ハードディスク)と、他のシステムと通信するための通信インターフェース120(例えば、ネットワークアダプター)と、周辺デバイス125、例えばキャッシュ、他のメモリ、データストレージおよび/または電子ディスプレイアダプターとを含む。メモリ110、記憶装置115、インターフェース120および周辺デバイス125は、マザーボードなどの通信バス(実線)を介してCPU 105と通信する。記憶装置115は、データを格納するためのデータ記憶装置(またはデータリポジトリ)であり得る。コンピュータシステム101は、通信インターフェース120の支援により、コンピュータネットワーク(「ネットワーク」)130に作動可能に結合され得る。ネットワーク130は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信するイントラネットおよび/もしくはエクストラネットであり得る。いくつかの場合では、ネットワーク130は、電気通信および/またはデータネットワークである。ネットワーク130は、クラウドコンピューティングなどの分散コンピューティングを可能にし得るコンピュータサーバ(複数可)を含み得る。いくつかの場合では、ネットワーク130は、コンピュータシステム101の支援により、コンピュータシステム101に結合されたデバイスがクライアントまたはサーバとして動作することを可能にし得るピアツーピアネットワークを実装し得る。
CPU 105は、プログラムまたはソフトウェアで具体化され得る一連の機械可読命令を実行し得る。命令は、メモリ110などのメモリ位置に格納され得る。命令は、CPU 105に指示され得、続いて、これは、本開示の方法を実装するようにCPU 105をプログラムまたは別様に構成し得る。CPU 105により実施される操作の例は、フェッチ、デコード、実行およびライトバックを含み得る。
CPU 105は、集積回路などの回路の一部であり得る。システム101の他の構成要素(複数可)が回路に含められ得る。いくつかの場合では、回路は、特定用途向け集積回路(ASIC)である。
記憶装置115は、ファイル、例えばドライバ、ライブラリーおよび保存プログラムを格納し得る。記憶装置115は、ユーザデータ、例えばユーザ選択およびユーザプログラムを格納し得る。いくつかの場合では、コンピュータシステム101は、コンピュータシステム101の外部にある、例えばイントラネットまたはインターネットを介してコンピュータシステム101と通信するリモートサーバ上に位置するさらなるデータ記憶装置(複数可)を含み得る。
コンピュータシステム101は、ネットワーク130を介してリモートコンピュータシステムと通信し得る。例えば、コンピュータシステム101は、ユーザのリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルPC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))またはパーソナルデジタルアシスタントが挙げられる。ユーザは、ネットワーク130を介してコンピュータシステム101にアクセスし得る。
本明細書に記載される方法は、コンピュータシステム101の電子記憶位置に、例えばメモリ110または電子記憶装置115などに格納された機械(例えば、コンピュータプロセッサ)実行可能コードにより実装され得る。機械実行可能または機械可読コードは、ソフトウェアの形式で提供され得る。使用中、コードは、プロセッサ105により実行され得る。いくつかの場合では、コードは記憶装置115から取り出され得、プロセッサ105による準備ができたアクセスのためにメモリ110に格納され得る。いくつかの場合では、電子記憶装置115は除外され得、機械実行可能命令はメモリ110に格納される。
コードは、コードを実行するように適合されたプロセッサを有する機械と共に使用するためにプリコンパイルおよび構成され得るか、またはランタイム中にコンパイルされ得る。コードは、プリコンパイルまたはコンパイル方式でコードを実行することを可能にするように選択され得るプログラミング言語で供給され得る。
コンピュータシステム101などの本明細書で提供されるシステムおよび方法の態様は、プログラミングで具体化され得る。技術の様々な態様は、典型的には、機械可読媒体のタイプで行われるまたは具体化される機械(またはプロセッサ)実行可能コードおよび/または関連データの形式の「プロダクト」または「製品」と考えられ得る。機械実行可能コードは、電子記憶装置、例えばメモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクに格納され得る。「記憶」タイプ媒体は、コンピュータ、プロセッサなどの有形メモリ、またはソフトウェアプログラミングのためにいつでも非一時的記憶域を提供し得るそれらの関連モジュール、例えば様々な半導体メモリ、テープドライブ、ディスクドライブなどのいずれかまたはすべてを含み得る。ソフトウェアの全部または一部は、インターネットまたは様々な他の電気通信ネットワークを介して通信され得る。このような通信は、例えば、あるコンピュータまたはプロセッサから別のものへの、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのロードを可能にし得る。したがって、ソフトウェア要素を保持し得る別のタイプの媒体は、例えば、ローカルデバイス間の物理的インターフェースを越えて、有線および光固定電話ネットワークを通じて、ならびに様々なエアリンクにわたって使用される光波、電波および電磁波を含む。例えば、有線または無線リンク、光リンクなどのこのような波を運搬する物理的要素もまた、ソフトウェアを保持する媒体と考えられ得る。本明細書で使用される場合、非一時的有形「記憶」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のためにプロセッサへの命令の提供に関与する任意の媒体を指す。
したがって、コンピュータ実行可能コードなどの機械可読媒体は、限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含む多くの形態をとり得る。不揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば図面に示されているデータベースなどを実装するために使用され得る、例えば、任意のコンピュータ(複数可)中の記憶デバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、このようなコンピュータプラットフォームのダイナミックメモリ、例えばメインメモリが挙げられる。有形伝送媒体としては、同軸ケーブル;コンピュータシステム内にバスを含むワイヤを含む銅線および光ファイバーが挙げられる。搬送波伝送媒体は、電気信号もしくは電磁信号または音響波または光波、例えば無線周波数(RF)および赤外線(IR)データ通信中に生成されるものの形態をとり得る。したがって、コンピュータ可読媒体の一般的な形態としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリチップもしくはカートリッジ、データまたは命令を転送する搬送波、このような搬送波を転送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取り得る任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、実行のために一連の命令をプロセッサに運搬することに関与し得る。
コンピュータシステム101は、例えば、核酸シークエンシングの結果(例えば、シークエンスリード、コンセンサス配列など)を提供するためのユーザインターフェース(UI)140を含む電子ディスプレイ135を含み得るかまたはそれと通信し得る。UIの例としては、限定されないが、グラフィカルユーザインターフェース(GUI)およびWebベースのユーザインターフェースが挙げられる。
本開示の方法およびシステムは、アルゴリズムにより実装され得る。アルゴリズムは、中央処理装置105による実行の際にソフトウェアにより実装され得る。アルゴリズムは、例えば、本開示の方法およびシステムを実装し得る。
実施例1:偏りのない/偏りのあるシークエンシングを使用してDNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してDNAをシークエンシングする方法を提供する(図2)。DNAを組織または細胞から抽出する。抽出されたDNAを2つのサンプル(第1のサンプル202および第2のサンプル203)に分割する。
次いで、第1のサンプル中のDNAを操作204で処理する。第1のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたDNA断片をサイジングする。第1のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第1のライブラリーに変換する。この時点まで、第1のサンプル中のDNAの断片化、サイジングおよびライゲーションのバイアスを軽減するための措置を取った。
次いで、第2のサンプル中のDNAを操作205で処理する。第2のサンプル中のDNAを断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたDNA断片をサイジングする。第2のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第2のライブラリーに変換する。この時点まで、第2のサンプル中のDNAの断片化、サイジングおよびライゲーションのバイアスを強調する(exaggerate)ための措置を取った。
第1のライブラリーおよび第2のライブラリーをプールして、プールされたライブラリーを生成する(図6)。具体的には、第1のライブラリー602の処理されたDNA 603を、第2のライブラリー604の処理されたDNA 605と共にプールする。フローセル607に入れる前に、第1のライブラリー602および第2のライブラリー602のプールを行う。第1のライブラリーのDNAおよび第2のライブラリーのDNAのアダプターは、フローセル608中のチャネルの表面と相互作用する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、第1のサンプル610のDNAおよび第2のサンプル609のDNAに相関させる。
実施例2:偏りのある/偏りのあるシークエンシングを使用してDNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してDNAをシークエンシングする方法を提供する(図3)。DNAを組織または細胞から抽出する。抽出されたDNAを2つのサンプル(第1のサンプル302および第2のサンプル303)に分割する。
次いで、第1のサンプル中のDNAを操作304で処理する。第1のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたDNA断片をサイジングする。第1のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第1のライブラリーに変換する。
次いで、第2のサンプル中のDNAを操作305で処理する。第2のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたDNA断片をサイジングする。第2のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第2のライブラリーに変換する。この時点まで、第2のサンプル中のDNAの断片化、サイジングおよびライゲーションのバイアスを強調するための措置を取った。
第1のライブラリーおよび第2のライブラリーをプールして、プールされたライブラリーを生成する(図6)。具体的には、第1のライブラリー602の処理されたDNA 603を、第2のライブラリー604の処理されたDNA 605と共にプールする。フローセル607に入れる前に、第1のライブラリー602および第2のライブラリー602のプールを行う。第1のライブラリーのDNAおよび第2のライブラリーのDNAのアダプターは、フローセル608中のチャネルの表面と相互作用する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、第1のサンプル610のDNAおよび第2のサンプル609のDNAに相関させる。
実施例3:偏りのない/偏りのないシークエンシングを使用してDNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してDNAをシークエンシングする方法を提供する(図4)。DNAを組織または細胞から抽出する。抽出されたDNAを2つのサンプル(第1のサンプル402および第2のサンプル403)に分割する。
次いで、第1のサンプル中のDNAを操作404で処理する。第1のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたDNA断片をサイジングする。第1のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第1のライブラリーに変換する。この時点まで、第1のサンプル中のDNAの断片化、サイジングおよびライゲーションのバイアスを軽減するための措置を取った。
次いで、第2のサンプル中のDNAを操作405で処理する。第2のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたDNA断片をサイジングする。第2のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第2のライブラリーに変換する。
第1のライブラリーおよび第2のライブラリーをプールして、プールされたライブラリーを生成する(図6)。具体的には、第1のライブラリー602の処理されたDNA 603を、第2のライブラリー604の処理されたDNA 605と共にプールする。フローセル607に入れる前に、第1のライブラリー602および第2のライブラリー602のプールを行う。第1のライブラリーのDNAおよび第2のライブラリーのDNAのアダプターは、フローセル608中のチャネルの表面と相互作用する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、第1のサンプル610のDNAおよび第2のサンプル609のDNAに相関させる。
実施例4:偏りのない/偏りのあるシークエンシングを使用してRNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してRNAをシークエンシングする方法を提供する(図2)。RNAを組織または細胞から抽出する。抽出されたRNAを2つのサンプル(第1のサンプル202および第2のサンプル203)に分割する。
次いで、第1のサンプル中のRNAを操作204で処理する。第1のサンプル中のRNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたRNA断片をサイジングする。第1のサンプルのサイジングされたRNA断片を、逆転写を使用してcDNAに変換して第1のライブラリーを生成する。この時点まで、第1のサンプル中のRNAの断片化およびcDNA合成のバイアスを軽減するための措置を取った。
次いで、第2のサンプル中のRNAを操作205で処理する。第2のサンプル中のRNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたRNA断片をサイジングする。第2のサンプルのサイジングされたRNA断片を、逆転写を使用してcDNAに変換して第2のライブラリーを生成する。この時点まで、第2のサンプル中のRNAの断片化およびcDNA合成のバイアスを強調するための措置を取った。
第1のライブラリーおよび第2のライブラリーをプールして、プールされたライブラリーを生成する(図6)。具体的には、第1のライブラリー602の処理されたRNA 603を、第2のライブラリー604の処理されたRNA 605と共にプールする。フローセル607に入れる前に、第1のライブラリー602および第2のライブラリー602のプールを行う。第1のライブラリーのcDNAおよび第2のライブラリーのcDNAは、フローセル608中のチャネルの表面と相互作用する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、第1のサンプル610のRNAおよび第2のサンプル609のRNAに相関させる。
実施例5:偏りのある/偏りのあるシークエンシングを使用してRNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してRNAをシークエンシングする方法を提供する(図3)。RNAを組織または細胞から抽出する。抽出されたRNAを2つのサンプル(第1のサンプル302および第2のサンプル303)に分割する。
次いで、第1のサンプル中のRNAを操作304で処理する。第1のサンプル中のRNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたRNA断片をサイジングする。第1のサンプルのサイジングされたRNA断片を、逆転写を使用してcDNAに変換して第1のライブラリーを生成する。
次いで、第2のサンプル中のRNAを操作305で処理する。第2のサンプル中のRNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたRNA断片をサイジングする。第2のサンプルのサイジングされたRNA断片を、逆転写を使用してcDNAに変換して第2のライブラリーを生成する。この時点まで、第2のサンプル中のRNAの断片化およびcDNA合成のバイアスを強調するための措置を取った。
第1のライブラリーおよび第2のライブラリーをプールして、プールされたライブラリーを生成する(図6)。具体的には、第1のライブラリー602の処理されたRNA 603を、第2のライブラリー604の処理されたRNA 605と共にプールする。フローセル607に入れる前に、第1のライブラリー602および第2のライブラリー602のプールを行う。第1のライブラリーのcDNAおよび第2のライブラリーのcDNAは、フローセル608中のチャネルの表面と相互作用する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばシングルリードまたはペアエンドシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、第1のサンプル610のRNAおよび第2のサンプル609のRNAに相関させる。
実施例6:偏りのない/偏りのないシークエンシングを使用してRNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してRNAをシークエンシングする方法を提供する(図4)。RNAを組織または細胞から抽出する。抽出されたRNAを2つのサンプル(第1のサンプル402および第2のサンプル403)に分割する。
次いで、第1のサンプル中のRNAを操作404で処理する。第1のサンプル中のRNAを断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたRNA断片をサイジングする。第1のサンプルのサイジングされたRNA断片を、逆転写を使用してcDNAに変換して第1のライブラリーを生成する。この時点まで、第1のサンプル中のRNAの断片化およびcDNA合成のバイアスを軽減するための措置を取った。
次いで、第2のサンプル中のRNAを操作405で処理する。第2のサンプル中のRNAを断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたRNA断片をサイジングする。第2のサンプルのサイジングされたRNA断片を、逆転写を使用してcDNAに変換して第2のライブラリーを生成する。
第1のライブラリーおよび第2のライブラリーをプールして、プールされたライブラリーを生成する(図6)。具体的には、第1のライブラリー602の処理されたRNA 603を、第2のライブラリー604の処理されたRNA 605と共にプールする。フローセル607に入れる前に、第1のライブラリー602および第2のライブラリー602のプールを行う。第1のライブラリーのcDNAおよび第2のライブラリーのcDNAは、フローセル608中のチャネルの表面と相互作用する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、第1のサンプル610のRNAおよび第2のサンプル609のRNAに相関させる。
実施例7:偏りのない/偏りのある/偏りのないシークエンシングを使用してDNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してDNAをシークエンシングする方法を提供する(図5)。DNAを組織または細胞から抽出する。抽出されたDNAを3つのサンプル(第1のサンプル502、第2のサンプル503および第3のサンプル504)に分割する。
次いで、第1のサンプル中のDNAを操作505で処理する。第1のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたDNA断片をサイジングする。第1のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第1のライブラリーに変換する。この時点まで、第1のサンプル中のDNAの断片化、サイジングおよびライゲーションのバイアスを軽減するための措置を取った。
次いで、第2のサンプル中のDNAを操作506で処理する。第2のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたDNA断片をサイジングする。第2のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第2のライブラリーに変換する。この時点まで、第2のサンプル中のDNAの断片化、サイジングおよびライゲーションのバイアスを強調するための措置を取った。
次いで、第3のサンプル中のDNAを操作507で処理する。第3のサンプル中のDNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第3のサンプルの得られたDNA断片をサイジングする。第3のサンプルのサイジングされたDNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第3のライブラリーに変換する。この時点まで、第3のサンプル中のDNAの断片化、サイジングおよびライゲーションのバイアスを強調または軽減するための措置を取った。
次いで、第1のライブラリー、第2のライブラリーおよび第3のライブラリーを操作508でプールして、プールされたライブラリーを生成する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリード509を生成する。次いで、シークエンシングリードを、第1のサンプルのDNA、第2のサンプルのDNAおよび第3のサンプルのDNAに相関させる。
実施例8:偏りのない/偏りのある/偏りのないシークエンシングを使用してRNAをシークエンシングする方法
一例では、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用してRNAをシークエンシングする方法が存在する(図5)。RNAを生物学的サンプルから抽出する。抽出されたRNAを3つのサンプル(第1のサンプル502、第2のサンプル503および第3のサンプル504)に分割する。
次いで、第1のサンプル中のRNAを操作505で処理する。第1のサンプル中のRNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第1のサンプルの得られたRNA断片をサイジングする。第1のサンプルのサイジングされたRNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第1のライブラリーに変換する。この時点まで、第1のサンプル中のRNAの断片化、サイジングおよびライゲーションのバイアスを軽減するための措置を取った。
次いで、第2のサンプル中のRNAを操作506で処理する。第2のサンプル中のRNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第2のサンプルの得られたRNA断片をサイジングする。第2のサンプルのサイジングされたRNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第2のライブラリーに変換する。この時点まで、第2のサンプル中のRNAの断片化、サイジングおよびライゲーションのバイアスを強調するための措置を取った。
次いで、第3のサンプル中のRNAを操作507で処理する。第3のサンプル中のRNAを必要に応じて断片化に供する。いくつかの断片化方法は、物理的方法(音響剪断または超音波処理)、酵素的方法(エンドヌクレアーゼカクテルまたはトランスポザーゼタグ付け反応)または化学的方法である。第3のサンプルの得られたRNA断片をサイジングする。第3のサンプルのサイジングされたRNA断片を、次世代シークエンシングプラットフォームのフローセルの表面と相互作用するように設計された特定の配列を含有するシークエンシングアダプターへのライゲーションにより、第3のライブラリーに変換する。この時点まで、第3のサンプル中のRNAの断片化、サイジングおよびライゲーションのバイアスを強調または軽減するための措置を取った。
次いで、第1のライブラリー、第2のライブラリーおよび第3のライブラリーを操作508でプールして、プールされたライブラリーを生成する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリード509を生成する。次いで、シークエンシングリードを、第1のサンプルのRNA、第2のサンプルのRNAおよび第3のサンプルのRNAに相関させる。
実施例9:RNAの偏りのあるおよびDNAの偏りのないシークエンシングを使用してDNAおよびRNAをシークエンシングする方法
例では、本開示は、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用して、DNAおよびRNAをシークエンシングする方法を提供する。RNAを生物学的サンプルから抽出する。DNAを生物学的サンプルから抽出する。生物学的サンプルは、無細胞核酸、組織、細胞またはそれらの任意の組み合わせを含み得る。
抽出されたRNAを処理して、標的RNAライブラリーなどの偏りのあるRNAライブラリーを生成する。抽出されたDNAを処理して、WGSライブラリーなどの偏りのないDNAライブラリーを生成する。NGSシークエンシングプラットフォームでランするために、例えば、フローセル上の配列とハイブリダイズするように設計された配列を追加することにより、両ライブラリーを調製する。
偏りのあるRNAライブラリーおよび偏りのないDNAライブラリーをプールして、プールされたライブラリーを生成する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、偏りのあるライブラリーのRNAおよび偏りのないライブラリーのDNAに相関させる。
実施例10:DNAの偏りのあるおよびRNAの偏りのないシークエンシングを使用してDNAおよびRNAをシークエンシングする方法
一例では、偏りのないおよび偏りのあるシークエンシングを実施するために調製されたライブラリーを使用して、DNAおよびRNAをシークエンシングする方法が存在する。RNAを生物学的サンプルから抽出する。DNAを生物学的サンプルから抽出する。生物学的サンプルは、無細胞核酸、組織、細胞またはそれらの任意の組み合わせを含み得る。
抽出されたRNAを処理して、RNA-seqライブラリーなどの偏りのないRNAライブラリーを生成する。抽出されたDNAを処理して、標的ライブラリーなどの偏りのあるDNAライブラリーを生成する。NGSシークエンシングプラットフォームでランするために、例えば、フローセル上の配列とハイブリダイズするように設計された配列を追加することにより、両ライブラリーを調製する。
偏りのないRNAライブラリーおよび偏りのあるDNAライブラリーをプールして、プールされたライブラリーを生成する。プールされたライブラリーを、クラスタ生成を使用したクローン増幅に供する。次いで、プールされたライブラリーを、シークエンシング、例えばペアエンドまたはシングルリードシークエンシングに供して、シークエンシングリードを生成する。次いで、シークエンシングリードを、偏りのないライブラリーのRNAおよび偏りのあるライブラリーのDNAに相関させる。
本発明の好ましい実施形態を本明細書に示して説明したが、このような実施形態はほんの一例として提供されていることは当業者には明らかである。本発明は、本明細書内で提供される特定の実施例により限定されることを意図しない。上記本明細書を参照して本発明を説明したが、本明細書の実施形態の説明および例示は、限定的な意味で解釈されることを意図しない。本発明から逸脱せずに多数の変形、変更および置換が当業者には想起される。さらに、本発明のすべての態様は、様々な条件および変数に依存する本明細書に記載される特定の描写、構成または相対的比率に限定されないことが理解されよう。本発明の実施では、本明細書に記載される本発明の実施形態の様々な代替物が用いられ得ることを理解すべきである。したがって、本発明はまた、このような代替物、改変物、変形物または均等物をカバーすることが企図される。以下の特許請求の範囲は本発明の範囲を定義し、これらの特許請求の範囲内の方法および構造ならびにそれらの均等物は、それによりカバーされることを意図する。

Claims (21)

  1. 核酸分子をシークエンシングするための方法であって、
    第1の複数の核酸分子を処理して、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成すること;
    第2の複数の核酸分子を処理して、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することであって、前記偏りのあるシークエンシングが、複数の遺伝子座を含む標的捕捉パネルの標的シークエンシングを含む、前記第2の複数のライブラリーを生成すること
    前記第1の複数のライブラリーおよび前記第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成すること;ならびに
    シークエンシングプラットフォームの単一のフローセルを使用して、前記プールされた複数のライブラリーをシークエンシングして、前記第1の複数の核酸分子に対応する第1の複数のシークエンシングリードと、前記第2の複数の核酸分子に対応する第2の複数のシークエンシングリードとを生成すること
    を含む、方法。
  2. 前記偏りのないシークエンシングが全ゲノムシークエンシング(WGS)を含む、請求項に記載の方法。
  3. 前記偏りのないシークエンシングが約10倍以下の深度で実施される、請求項に記載の方法。
  4. 前記標的シークエンシングが、前記標的捕捉パネルのハイブリダイゼーション捕捉に続いてシークエンシングを行うことを含む、請求項1に記載の方法。
  5. 前記標的シークエンシングが標的メチル-seqを含む、請求項1~4のいずれか一項に記載の方法。
  6. 前記偏りのないシークエンシングがメチル化シークエンシングを含む、請求項に記載の方法。
  7. 前記メチル化シークエンシングが、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)またはTet支援バイサルファイトシークエンシング(TAB-Seq)を含む、請求項に記載の方法。
  8. 前記第2の複数のシークエンシングリードを生成することが、コントロールライブラリーとして前記第1の複数のライブラリーの少なくとも一部を使用することを含む、請求項に記載の方法。
  9. 第3の複数のライブラリーをプールして、前記プールされた複数のライブラリーを生成することをさらに含み、前記第3の複数のライブラリーが、前記第1の複数のシークエンシングリードまたは前記第2の複数のシークエンシングリードを生成するためのコントロールライブラリーを含む、請求項に記載の方法。
  10. 前記第1の複数の核酸分子および前記第2の複数の核酸分子がDNA分子を含む、請求項に記載の方法。
  11. 前記第1の複数の核酸分子および前記第2の複数の核酸分子がRNA分子を含む、請求項に記載の方法。
  12. 前記シークエンシングプラットフォームがIllumina(商標)シークエンサーである、請求項に記載の方法。
  13. 前記核酸分子がサンプルから抽出される、請求項1~12のいずれか一項に記載の方法。
  14. 前記サンプルが生物学的サンプルである、請求項13に記載の方法。
  15. 前記第1の複数の核酸分子および前記第2の複数の核酸分子が、同じサンプルから抽出される、請求項13または14に記載の方法。
  16. 核酸分子をシークエンシングするためのシステムであって、
    1つまたはそれより多くのコンピュータプロセッサを含むコントローラ;および
    前記コントローラに作動可能に結合した支持体
    を含み;
    前記1つまたはそれより多くのコンピュータプロセッサが、
    第1の複数の核酸分子を処理して、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成することを指示し;
    第2の複数の核酸分子を処理して、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することを指示することであって、前記偏りのあるシークエンシングが、複数の遺伝子座を含む標的捕捉パネルの標的シークエンシングを含む、前記第2の複数のライブラリーを生成することを指示し
    前記第1の複数のライブラリーおよび前記第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示し;
    前記プールされた複数のライブラリーから、前記第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成し;ならびに、
    前記プールされた複数のライブラリーから、前記第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成するように個々にまたは集合的にプログラムされている、システム。
  17. 前記偏りのないシークエンシングが全ゲノムシークエンシング(WGS)またはメチル化シークエンシングを含む、請求項16に記載のシステム。
  18. 前記メチル化シークエンシングが、バイサルファイトシークエンシング、全ゲノムバイサルファイトシークエンシング(WGBS)、APOBEC-seq、メチル-CpG結合ドメイン(MBD)タンパク質捕捉、メチル-DNA免疫沈降(MeDIP)、メチル化感受性制限酵素シークエンシング(MSRE/MRE-Seqまたはメチル-Seq)、酸化的バイサルファイトシークエンシング(oxBS-Seq)、還元表示バイサルファイトシークエンシング(RRBS)またはTet支援バイサルファイトシークエンシング(TAB-Seq)を含む、請求項17に記載のシステム。
  19. 前記標的シークエンシングが標的メチル-seqを含む、請求項16に記載のシステム。
  20. 前記標的シークエンシングが、前記標的捕捉パネルのハイブリダイゼーション捕捉に続いてシークエンシングを行うことを含む、請求項16~19のいずれか一項に記載の方法。
  21. コンピュータプロセッサにより実行される際の、核酸分子をシークエンシングするための方法を実装する機械実行可能コードを含む非一時的コンピュータ可読媒体であって、前記方法が、
    第1の複数の核酸分子を処理して、偏りのないシークエンシングを実施するための第1の複数のライブラリーを生成することを指示すること、
    第2の複数の核酸分子を処理して、偏りのあるシークエンシングを実施するための第2の複数のライブラリーを生成することを指示することであって、前記偏りのあるシークエンシングが、複数の遺伝子座を含む標的捕捉パネルの標的シークエンシングを含む、前記第2の複数のライブラリーを生成することを指示すること
    前記第1の複数のライブラリーおよび前記第2の複数のライブラリーをプールして、プールされた複数のライブラリーを生成することを指示すること;
    前記プールされた複数のライブラリーから、前記第1の複数の核酸分子に対応する第1の複数のシークエンシングリードを生成すること;ならびに、
    前記プールされた複数のライブラリーから、前記第2の複数の核酸分子に対応する第2の複数のシークエンシングリードを生成すること
    を含む、非一時的コンピュータ可読媒体。
JP2021504285A 2018-07-26 2019-07-25 単一のフローセルを使用した多重シークエンシング Active JP7418402B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023171965A JP2023171901A (ja) 2018-07-26 2023-10-03 単一のフローセルを使用した多重シークエンシング

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862703763P 2018-07-26 2018-07-26
US62/703,763 2018-07-26
PCT/US2019/043434 WO2020023744A1 (en) 2018-07-26 2019-07-25 Multiple sequencing using a single flow cell

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023171965A Division JP2023171901A (ja) 2018-07-26 2023-10-03 単一のフローセルを使用した多重シークエンシング

Publications (2)

Publication Number Publication Date
JP2021531794A JP2021531794A (ja) 2021-11-25
JP7418402B2 true JP7418402B2 (ja) 2024-01-19

Family

ID=69181146

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021504285A Active JP7418402B2 (ja) 2018-07-26 2019-07-25 単一のフローセルを使用した多重シークエンシング
JP2023171965A Pending JP2023171901A (ja) 2018-07-26 2023-10-03 単一のフローセルを使用した多重シークエンシング

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023171965A Pending JP2023171901A (ja) 2018-07-26 2023-10-03 単一のフローセルを使用した多重シークエンシング

Country Status (10)

Country Link
US (1) US20210164038A1 (ja)
EP (1) EP3827091A4 (ja)
JP (2) JP7418402B2 (ja)
CN (1) CN112752848A (ja)
AU (1) AU2019309870A1 (ja)
BR (1) BR112021001247A2 (ja)
CA (1) CA3106820A1 (ja)
IL (2) IL310622A (ja)
SG (1) SG11202100570YA (ja)
WO (1) WO2020023744A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021236328A1 (en) * 2020-05-22 2021-11-25 Novartis Ag Cdna library generation
AU2021333661A1 (en) 2020-08-25 2023-03-23 Seer, Inc. Compositions and methods for assaying proteins and nucleic acids
WO2023196324A1 (en) * 2022-04-08 2023-10-12 University Of Florida Research Foundation, Incorporated Instrument and methods involving high-throughput screening and directed evolution of molecular functions

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016022540A1 (en) 2014-08-04 2016-02-11 The Trustees Of The University Of Pennsylvania Transcriptome in vivo analysis ( tiva) and transcriptome in situ analysis (tisa)
US20160281166A1 (en) 2015-03-23 2016-09-29 Parabase Genomics, Inc. Methods and systems for screening diseases in subjects
JP2018512048A (ja) 2015-02-10 2018-05-10 ザ チャイニーズ ユニバーシティ オブ ホンコン 癌スクリーニング及び胎児分析のための変異検出

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2292788T3 (da) * 2005-06-23 2012-07-23 Keygene Nv Strategier til identifikation og detektion af polymorfismer med højt gennemløb
WO2012149171A1 (en) * 2011-04-27 2012-11-01 The Regents Of The University Of California Designing padlock probes for targeted genomic sequencing
EP3965111A1 (en) * 2013-08-30 2022-03-09 Personalis, Inc. Methods and systems for genomic analysis
US9745614B2 (en) * 2014-02-28 2017-08-29 Nugen Technologies, Inc. Reduced representation bisulfite sequencing with diversity adaptors
US20160046987A1 (en) * 2014-08-14 2016-02-18 Abbott Molecular Inc. Library generation for next-generation sequencing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016022540A1 (en) 2014-08-04 2016-02-11 The Trustees Of The University Of Pennsylvania Transcriptome in vivo analysis ( tiva) and transcriptome in situ analysis (tisa)
JP2018512048A (ja) 2015-02-10 2018-05-10 ザ チャイニーズ ユニバーシティ オブ ホンコン 癌スクリーニング及び胎児分析のための変異検出
US20160281166A1 (en) 2015-03-23 2016-09-29 Parabase Genomics, Inc. Methods and systems for screening diseases in subjects

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries,Genome Biology,Vol.12, article No.R18,2011年,p.1-14
Sequencing on the SOLiD 5500xl System - in depth characterization of the GC bias,Nucleus,Vol.8, No.4,2017年,p.370-380

Also Published As

Publication number Publication date
EP3827091A4 (en) 2022-04-27
EP3827091A1 (en) 2021-06-02
IL280359A (en) 2021-03-25
BR112021001247A2 (pt) 2021-04-27
SG11202100570YA (en) 2021-02-25
US20210164038A1 (en) 2021-06-03
CN112752848A (zh) 2021-05-04
AU2019309870A1 (en) 2021-02-18
IL310622A (en) 2024-04-01
JP2023171901A (ja) 2023-12-05
WO2020023744A1 (en) 2020-01-30
JP2021531794A (ja) 2021-11-25
CA3106820A1 (en) 2020-01-30

Similar Documents

Publication Publication Date Title
JP2023171901A (ja) 単一のフローセルを使用した多重シークエンシング
CA2889507C (en) Hla typing using selective amplification and sequencing
USRE49207E1 (en) Transposase-random priming DNA sample preparation
US11608518B2 (en) Methods for analyzing nucleic acids
US20100136516A1 (en) System and method for detection of HIV integrase variants
US20170175182A1 (en) Transposase-mediated barcoding of fragmented dna
CN109923215B (zh) 序列变体的检测
US20240141425A1 (en) Correcting for deamination-induced sequence errors
EP3880845B1 (en) Directional targeted sequencing
Aga et al. Genetic Polymorphism and Disease
JP2022544779A (ja) ポリヌクレオチド分子の集団を生成するための方法
US20220068433A1 (en) Computational detection of copy number variation at a locus in the absence of direct measurement of the locus
Remm et al. " 3 Primer Design for Large-Scale Multiplex PCR and Arrayed

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220712

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240109

R150 Certificate of patent or registration of utility model

Ref document number: 7418402

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150