JP2018501776A - 連続性を維持した転位 - Google Patents

連続性を維持した転位 Download PDF

Info

Publication number
JP2018501776A
JP2018501776A JP2017520884A JP2017520884A JP2018501776A JP 2018501776 A JP2018501776 A JP 2018501776A JP 2017520884 A JP2017520884 A JP 2017520884A JP 2017520884 A JP2017520884 A JP 2017520884A JP 2018501776 A JP2018501776 A JP 2018501776A
Authority
JP
Japan
Prior art keywords
nucleic acid
target nucleic
sequence
barcode
immobilized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017520884A
Other languages
English (en)
Other versions
JP6808617B2 (ja
Inventor
ジェイ スティーマーズ フランク
ジェイ スティーマーズ フランク
エル ガンダーソン ケヴィン
エル ガンダーソン ケヴィン
チャン ファン
チャン ファン
リチャード ベトリー ジェイソン
リチャード ベトリー ジェイソン
アントニー ゴームリー ニール
アントニー ゴームリー ニール
メウールマン ウーター
メウールマン ウーター
ウィアー ジャクリーン
ウィアー ジャクリーン
イオアノウ アヴグスタ
イオアノウ アヴグスタ
ジェンキンス ガレス
ジェンキンス ガレス
ジャクソン ロザモンド
ジャクソン ロザモンド
モレル ナタリー
モレル ナタリー
ケイ ポコロック ドミトリー
ケイ ポコロック ドミトリー
ジェイ ノルベルク スティーブン
ジェイ ノルベルク スティーブン
ホー モーリー
ホー モーリー
キア アミラーリ
キア アミラーリ
ガルィシン イゴール
ガルィシン イゴール
パントーハ リゴー
パントーハ リゴー
Original Assignee
イルミナ ケンブリッジ リミテッド
イルミナ ケンブリッジ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イルミナ ケンブリッジ リミテッド, イルミナ ケンブリッジ リミテッド filed Critical イルミナ ケンブリッジ リミテッド
Publication of JP2018501776A publication Critical patent/JP2018501776A/ja
Application granted granted Critical
Publication of JP6808617B2 publication Critical patent/JP6808617B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Glass Compositions (AREA)
  • Inorganic Insulating Materials (AREA)
  • Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)

Abstract

本明細書で提供する実施態様は、標的核酸のバーコード化DNAフラグメントの固定化ライブラリーを調製し、ゲノム変異を識別し、標的核酸の連続性情報、フェージング情報、及びメチル化状態を決定する方法及び組成物に関する。【選択図】図18

Description

関連出願
本願は、その全体が参照により本明細書に組み込まれる、2014年10月17日出願の米国仮特許出願第62/065,544号及び2015年5月5日出願の米国仮特許出願第62/157,396号の優先権を主張する。
本発明の実施形態は、核酸のシークエンシングに関する。具体的には、本明細書で提供する方法及び組成物の実施形態は、核酸鋳型の調製及び核酸鋳型からの配列データの取得に関する。
生体試料中に存在する特定の核酸配列の検出は、例えば、微生物の同定及び分類、感染症の診断、遺伝子異常の検出及び特徴付け、癌に関連した遺伝子変化の同定、疾患への遺伝的感受性の研究、並びに様々な種類の治療に対する反応の測定を行う方法として用いられてきた。生体試料中の特定の核酸配列を検出する一般的な技術は、核酸シークエンシングである。
核酸シークエンシング法は、Maxam及びGilbertが用いた化学分解法、及びSangerが用いた鎖伸長法から著しく発展してきた。今日、核酸の並列処理を全て1回のシークエンシングランで行うことを可能にする、いくつかのシークエンシング法が用いられている。従って、1回のシークエンシングランから生成される情報は、膨大なものとなる可能性がある。
1つの態様において、本明細書は、標的核酸のバーコード化DNAフラグメントのライブラリーを調製する方法について記載する。当該方法は、標的核酸を複数のトランスポソーム複合体と接触させることを含むものであり、各トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、トランスポゾンは転移鎖及び非転移鎖を含む。トランスポソーム複合体の少なくとも1つのトランスポゾンは、相補的な捕捉配列にハイブリダイズすることが可能なアダプター配列を含む。標的核酸を複数のフラグメントにフラグメント化し、標的核酸の連続性(contiguity)を維持しながらフラグメントの少なくとも1つの鎖の5’末端に複数の転移鎖を挿入する。標的核酸の複数のフラグメントを複数の固体支持体と接触させる。複数の固体支持体の各々は複数の固定化オリゴヌクレオチドを含み、各オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列を含み、複数の固体支持体中の各固体支持体からの第1のバーコード配列は、複数の固体支持体中の他の固体支持体からの第1のバーコード配列とは異なる。バーコード配列の情報を標的核酸のフラグメントに転移させ、それにより、同じ標的核酸の少なくとも2つのフラグメントが同一のバーコード情報を受け取るように、少なくとも1つの鎖が第1のバーコード配列で5’タグ化された、二本鎖フラグメントの固定化ライブラリーを作製する。
1つの態様において、本明細書は、標的核酸配列の連続性情報を決定する方法について記載する。当該方法は、標的核酸を複数のトランスポソーム複合体と接触させることを含むものであり、各トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、トランスポゾンは転移鎖及び非転移鎖を含み、トランスポソーム複合体のトランスポゾンの少なくとも1つは、相補的な捕捉配列にハイブリダイズすることが可能なアダプター配列を含む。標的核酸を複数のフラグメントにフラグメント化し、標的核酸の連続性を維持しながら複数の転移鎖を複数のフラグメントに挿入する。標的核酸の複数のフラグメントを複数の固体支持体と接触させる。複数の固体支持体の各々は複数の固定化オリゴヌクレオチドを含み、各オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列を含み、複数の固体支持体中の各固体支持体からの第1のバーコード配列は、複数の固体支持体中の他の固体支持体からの第1のバーコード配列とは異なる。バーコード配列情報を、同じ標的核酸の少なくとも2つのフラグメントが同一のバーコード情報を受け取るように、標的核酸フラグメントに転移させる。標的核酸フラグメントの配列及びバーコード配列を決定する。標的核酸の連続性情報を、バーコード配列を識別することにより決定する。いくつかの実施形態において、トランスポソーム複合体のトランスポザーゼを転位(transposition)後に除去し、続いて、トランスポゾンのアダプター配列を相補的な捕捉配列にハイブリダイズさせる。いくつかの実施形態において、トランスポザーゼをSDS処理により除去する。いくつかの実施形態において、トランスポザーゼをタンパク質分解酵素処理により除去する。
1つの態様において、本明細書は、標的核酸配列のフェージング情報及びメチル化状態を同時に測定する方法について記載する。当該方法は、標的核酸を複数のトランスポソーム複合体と接触させることを含むものであり、各トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、トランスポゾンは転移鎖及び非転移鎖を含み、トランスポソーム複合体のトランスポゾンの少なくとも1つは、相補的な捕捉配列にハイブリダイズすることが可能なアダプター配列を含む。標的核酸を複数のフラグメントにフラグメント化し、標的核酸の連続性を維持しながら複数の転移鎖を標的核酸フラグメントに挿入する。標的核酸の複数のフラグメントを複数の固体支持体と接触させ、複数の固体支持体の各々は複数の固定化オリゴヌクレオチドを含み、各オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列を含み、複数の固体支持体中の各固体支持体からの第1のバーコード配列は、複数の固体支持体中の他の固体支持体からの第1のバーコード配列とは異なる。バーコード配列情報を、同じ標的核酸の少なくとも2つのフラグメントが同一のバーコード情報を受け取るように、標的核酸フラグメントに転移させる。バーコードを含む標的核酸フラグメントを亜硫酸水素塩処理に付し、それにより、バーコードを含む亜硫酸水素塩処理標的核酸フラグメントを生成する。亜硫酸水素塩処理標的核酸フラグメントの配列及びバーコード配列を決定する。標的核酸の連続性情報を、バーコード配列を識別することにより決定する。
1つの態様において、本明細書は、タグ化DNAフラグメントの固定化ライブラリーを調製する方法について記載する。当該方法は、それに固定化されたトランスポソーム複合体を有する複数の固体支持体を提供することを含み、トランスポソーム複合体は多量体であり、同じトランスポソーム複合体のトランスポソーム単量体単位は互いに結合し、トランスポソーム単量体単位は第1のポリヌクレオチドに結合したトランスポザーゼを含み、第1のポリヌクレオチドは、(i)トランスポゾン末端配列を含む3’部分、及び(ii)第1のバーコードを含む第1のアダプターを含む。標的DNAを、標的DNAがトランスポソーム複合体によりフラグメント化され、第1のポリヌクレオチドの3’トランスポゾン末端配列がフラグメントの少なくとも1つの鎖の5’末端に転移する条件下で、複数の固体支持体に適用する。それにより、少なくとも1つの鎖が第1のバーコードで5’タグ付けされた二本鎖フラグメントの固定化ライブラリーを作製する。
1つの態様において、本明細書は、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを調製する方法について記載する。当該方法は、標的核酸を2つ又はそれ以上のフラグメントにフラグメント化することを含む。第1の共通アダプター配列を標的核酸のフラグメントの5’末端に組み込み、アダプター配列は、第1のプライマー結合配列及び親和性部分を含み、親和性部分は、結合ペアの1つのメンバーに存在する。標的核酸フラグメントを変性させる。標的核酸フラグメントを固体支持体に固定化する。固体支持体は、結合ペアの他のメンバーを含み、標的核酸の固定化は、結合ペアの結合により行う。固定化標的核酸フラグメントを亜硫酸水素塩処理に付す。第2の共通アダプター配列を亜硫酸水素塩処理した固定化標的核酸フラグメントに組み込み、第2の共通アダプターは、第2のプライマー結合部位を含む。固体支持体に固定化された亜硫酸水素塩処理固定化標的核酸フラグメントを増幅し、それにより、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを作製する。
1つの態様において、本明細書は、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを調製する方法について記載する。当該方法は、それに固定化された固定化トランスポソーム複合体を含む複数の固体支持体を提供することを含む。トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、トランスポゾンは、転移鎖及び非転移鎖を含む。転移鎖は、(i)トランスポザーゼ認識配列を含む3’末端の第1の部分及び(ii)第1のアダプター配列及び結合ペアの第1のメンバーを含む5’から第1の部分に位置する第2の部分を含む。結合ペアの第1のメンバーは、固体支持体上で結合ペアの第2のメンバーに結合し、それにより、トランスポゾンを固体支持体に固定化する。第1のアダプターはまた、第1のプライマー結合配列を含む。非転移鎖は、(i)トランスポザーゼ認識配列を含む5’末端の第1の部分及び(ii)3’末端の末端ヌクレオチドがブロックされている第2のアダプター配列を含む3’から第1の部分に位置する第2の部分を含む。第2のアダプターはまた、第2のプライマー結合配列を含む。標的核酸を、固定化トランスポソーム複合体を含む複数の固体支持体と接触させる。標的核酸を複数のフラグメントにフラグメント化し、複数の転移鎖をフラグメントの少なくとも1つの鎖の5’末端に挿入し、それにより、標的核酸フラグメントを固体支持体に固定化する。フラグメント化された標的核酸の3’末端を、DNAポリメラーゼで伸長させる。非転移鎖を、フラグメント化された標的核酸の3’末端にライゲートする。固定化標的核酸フラグメントを亜硫酸水素塩処理に付す。亜硫酸水素塩処理中に損傷を受けた固定化標的核酸フラグメントの3’末端を、固定化標的核酸フラグメントの3’末端がホモポリマーテイルを含むように、DNAポリメラーゼを用いて伸長させる。第2のアダプター配列を、亜硫酸水素塩処理中に損傷を受けた固定化標的核酸フラグメントの3’末端に導入する。固体支持体に固定化された亜硫酸水素塩処理標的核酸フラグメントを、第1及び第2のプライマーを用いて増幅し、それにより、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを作製する。
1つの態様において、本明細書は、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを調製する方法について記載する。当該方法は、標的核酸をトランスポソーム複合体と接触させることを含むものであり、トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含む。トランスポゾンは、転移鎖及び非転移鎖を含む。転移鎖は、(i)トランスポザーゼ認識配列を含む3’末端の第1の部分及び(ii)第1のアダプター配列及び結合ペアの第1のメンバーを含む5’から第1の部分に位置する第2の部分を含み、結合ペアの第1のメンバーは、結合ペアの第2のメンバーに結合する。非転移鎖は、(i)トランスポザーゼ認識配列を含む5’末端の第1の部分及び(ii)3’末端の末端ヌクレオチドがブロックされている第2のアダプター配列を含む3’から第1の部分に位置する第2の部分を含み、第2のアダプターは、第2のプライマー結合配列を含む。標的核酸を複数のフラグメントにフラグメント化し、複数の転移鎖をフラグメントの少なくとも1つの鎖の5’末端に挿入し、それにより、標的核酸フラグメントを固体支持体に固定化する。トランスポゾン末端を含む標的核酸フラグメントを結合ペアの第2のメンバーを含む複数の固体支持体に接触させ、結合ペアの第1のメンバーと結合ペアの第2のメンバーとの結合により、標的核酸を固体支持体に固定化する。フラグメント化された標的核酸の3’末端を、DNAポリメラーゼで伸長させる。非転移鎖を、フラグメント化された標的核酸の3’末端にライゲートする。固定化標的核酸フラグメントを亜硫酸水素塩処理に付す。亜硫酸水素塩処理中に損傷を受けた固定化標的核酸フラグメントの3’末端を、固定化標的核酸フラグメントの3’末端がホモポリマーテイルを含むように、DNAポリメラーゼを用いて伸長させる。第2のアダプター配列を、亜硫酸水素塩処理中に損傷を受けた固定化標的核酸フラグメントの3’末端に導入する。固体支持体に固定化された亜硫酸水素塩処理標的核酸フラグメントを、第1及び第2のプライマーを用いて増幅し、それにより、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを作製する。
いくつかの実施形態において、第2のアダプターの3’末端の末端ヌクレオチドを、ジデオキシヌクレオチド、リン酸基、チオリン酸基、及びアジド基からなる群から選択される1つのメンバーによりブロックする。
いくつかの実施形態において、親和性部分を結合ペアのメンバーとすることができる。いくつかのケースにおいて、修飾された核酸は、結合ペアの第1のメンバーを含んでいてもよく、捕捉プローブは、結合ペアの第2のメンバーを含んでいてもよい。いくつかのケースにおいて、捕捉プローブを固体表面に固定化してもよく、修飾された核酸は、結合ペアの第1のメンバーを含んでいてもよく、捕捉プローブは、結合ペアの第2のメンバーを含んでいてもよい。そのようなケースでは、結合ペアの第1及び第2のメンバーの結合により、修飾された標的核酸を固体表面に固定化する。結合ペアの例としては、これに限定されないが、ビオチン−アビジン、ビオチン−ストレプトアビジン、ビオチン−ニュートラアビジン、リガンド−受容体、ホルモン−受容体、レクチン−糖タンパク質、オリゴヌクレオチド−相補的オリゴヌクレオチド、及び抗原−抗体が挙げられる。
いくつかの実施形態において、第1の共通アダプター配列を、片側(one−sided)転位により標的核酸の5’末端フラグメントに組み込む。いくつかの実施形態において、第1の共通アダプター配列を、ライゲーションにより標的核酸の5’末端フラグメントに組み込む。いくつかの実施形態において、第2の共通アダプター配列を亜硫酸水素塩処理固定化標的核酸フラグメントに組み込むステップは、(i)固定化標的核酸フラグメントの3’末端を、ターミナルトランスフェラーゼを用いて伸長し、ホモポリマーテイルを含ませるステップ、(ii)一本鎖ホモポリマー部分を含むオリゴヌクレオチドと、第2の共通アダプター配列を含む二本鎖部分とをハイブリダイズさせるステップであって、一本鎖ホモポリマー部分がホモポリマーテイルに相補的である、ステップ、及び(iii)第2の共通アダプター配列を固定化標的核酸フラグメントにライゲートし、それにより、第2の共通アダプター配列を亜硫酸水素塩処理固定化標的核酸フラグメントに組み込むステップを含む。
いくつかの実施形態において、標的核酸は、単一の細胞に由来する。いくつかの実施形態において、標的核酸は、単一の細胞小器官に由来する。いくつかの実施形態において、標的核酸は、ゲノムDNAである。いくつかの実施形態において、標的核酸は、他の核酸と架橋する。いくつかの実施形態において、標的核酸は、ホルマリン固定パラフィン包埋(FFPE:formarin fixed paraffin embedded)サンプルに由来する。いくつかの実施形態において、標的核酸は、タンパク質と架橋する。いくつかの実施形態において、標的核酸は、DNAと架橋する。いくつかの実施形態において、標的核酸は、ヒストンに保護されたDNAである。いくつかの実施形態において、ヒストンを標的核酸から除去する。いくつかの実施形態において、標的核酸は、無細胞腫瘍DNAである。いくつかの実施形態において、無細胞腫瘍DNAは、胎盤液から得る。いくつかの実施形態において、無細胞腫瘍DNAは、血漿から得る。いくつかの実施形態において、血漿は、血漿用採取ゾーンを有する膜分離装置を用いて全血から採取する。いくつかの実施形態において、血漿用採取ゾーンは、固体支持体に固定化されたトランスポソーム複合体を含む。いくつかの実施形態において、標的核酸は、cDNAである。いくつかの実施形態において、固体支持体は、ビーズである。いくつかの実施形態において、複数の固体支持体は、複数のビーズであり、複数のビーズは、様々なサイズである。
いくつかの実施形態において、単一のバーコード配列が、各個々の固体支持体上の複数の固定化オリゴヌクレオチドに存在する。いくつかの実施形態において、異なるバーコード配列が、各個々の固体支持体上の複数の固定化オリゴヌクレオチドに存在する。いくつかの実施形態において、標的核酸フラグメントへのバーコード配列情報の転移は、ライゲーションによる。いくつかの実施形態において、標的核酸フラグメントへのバーコード配列情報の転移は、ポリメラーゼ伸長による。いくつかの実施形態において、標的核酸フラグメントへのバーコード配列情報の転移は、ライゲーション及びポリメラーゼ伸長の両方による。いくつかの実施形態において、ポリメラーゼ伸長は、ライゲートした固定化オリゴヌクレオチドを鋳型として用い、非ライゲートトランスポゾン鎖の3’末端をDNAポリメラーゼで伸長させることによる。いくつかの実施形態において、アダプター配列の少なくとも一部は、第2のバーコード配列をさらに含む。
いくつかの実施形態において、トランスポソーム複合体は、多量体であり、各単量体単位のトランスポゾンのアダプター配列は、同じトランスポソーム複合体の他の単量体単位とは異なる。いくつかの実施形態において、アダプター配列は、第1のプライマー結合配列をさらに含む。いくつかの実施形態において、第1のプライマー結合部位は、捕捉配列又は捕捉配列の相補体に対して、配列相同性を持たない。いくつかの実施形態において、固体支持体上の固定化オリゴヌクレオチドは、第2のプライマー結合配列をさらに含む。
いくつかの実施形態において、トランスポソーム複合体は、多量体であり、トランスポソーム単量体単位は、同じトランスポソーム複合体内で互いに結合する。いくつかの実施形態において、トランスポソーム単量体単位のトランスポザーゼは、同じトランスポソーム複合体の別のトランスポソーム単量体単位のトランスポザーゼに結合する。いくつかの実施形態において、トランスポソーム単量体単位のトランスポゾンは、同じトランスポソーム複合体の別のトランスポソーム単量体単位のトランスポゾンに結合する。いくつかの実施形態において、トランスポソーム単量体単位のトランスポザーゼは、同じトランスポソーム複合体の別のトランスポソーム単量体単位のトランスポザーゼに共有結合により結合する。いくつかの実施形態において、1つの単量体単位のトランスポザーゼは、同じトランスポソーム複合体の別のトランスポソーム単量体単位のトランスポザーゼにジスルフィド結合により結合する。いくつかの実施形態において、トランスポソーム単量体単位のトランスポゾンは、同じトランスポソーム複合体の別のトランスポソーム単量体単位のトランスポゾンに共有結合により結合する。
いくつかの実施形態において、標的核酸配列の連続性情報は、ハプロタイプ情報を示す。いくつかの実施形態において、標的核酸配列の連続性情報は、ゲノム変異を示す。いくつかの実施形態において、ゲノム変異は、欠損、転位(translocations)、染色体間の遺伝子融合、重複、及びパラログからなる群から選択される。いくつかの実施形態において、固体支持体に固定化されたオリゴヌクレオチドは、部分的二本鎖領域及び部分的一本鎖領域を含む。いくつかの実施形態において、オリゴヌクレオチドの部分的一本鎖領域は、第2のバーコード配列及び第2のプライマー結合配列を含む。いくつかの実施形態において、バーコードを含む標的核酸フラグメントを、標的核酸フラグメントの配列を決定する前に増幅する。いくつかの実施形態において、後続の増幅を、標的核酸フラグメントの配列を決定する前に、単一の反応区画で行う。いくつかの実施形態において、第3のバーコード配列を、増幅中に標的核酸フラグメントに導入する。
いくつかの実施形態において、上記方法は、バーコードを含む標的核酸フラグメントを、複数の第1のセットの反応区画から、バーコードを含む標的核酸フラグメントのプールにまとめるステップ、バーコードを含む標的核酸フラグメントの前記プールを複数の第2のセットの反応区画に再分配するステップ、及び標的核酸フラグメントを第2のセットの反応区画内でシークエンシング前に増幅することにより、第3のバーコードを標的核酸フラグメントに導入するステップをさらに含んでいてもよい。
いくつかの実施形態において、上記方法は、標的核酸をトランスポソーム複合体と接触させる前にプレフラグメント化するステップをさらに含んでいてもよい。いくつかの実施形態において、標的核酸のプレフラグメント化は、超音波処理及び制限消化からなる群から選択される方法により行われる。
トランスポソームをビーズ表面に結合させる方法の一例を示すフローチャートである。 図1の方法のステップを絵で示す図である。 ビーズ表面上でのタグメント化工程の一例を示す模式図である。 DNA収量の一例を、図3のビーズベースタグメント化工程からのクラスター数の観点から示すデータ表である。 図3のビーズベースタグメント化工程の再現性の別例を、均一なサイズの観点から示すデータ表である。 図6A及び6Bは、それぞれ、図5のインデックス付きサンプルのプール1の挿入サイズのプロット及びプール2の挿入サイズのプロットを示す図である。 リードの合計数及び図5に記載の実験のためにアラインしたリードの割合の再現性を示す棒グラフである。 図8A、8B、及び8Cは、それぞれ、エクソーム濃縮アッセイにおける、コントロールライブラリーでの挿入サイズのプロット、ビーズベースタグメント化ライブラリーでの挿入サイズのプロット、及びサマリーデータ表を示す図である。 図9A、9B、及び9Cは、それぞれ、エクソーム濃縮アッセイにおける、dups PF画分の棒グラフ、selected bases画分の棒グラフ、及びPCT usable bases on targetの棒グラフを示す図である。 ビーズ表面上でのトランスポソーム複合体の形成方法の一例を示すフローチャートである。 図10の方法のステップを絵で示す図である。 図10の方法のステップを絵で示す図である。 図10の方法のステップを絵で示す図である。 図13に示すトランスポソーム被覆ビーズを用いたタグメント化工程の模式図である。 固体支持体上でのトランスポソーム形成の例示的なスキームを示す図である。 固有インデックスを有する連結(contiguously linked)ライブラリー作製の例示的なスキームを示す図である。 固有インデックスを有する連結ライブラリー作製の例示的なスキームを示す図である。 CPT−DNAがビーズに巻き付いている、単一のクローンインデックス付きビーズ上での単一のCPT−DNAの捕捉を表わす図である。 CPT−DNAがビーズに巻き付いている、単一のクローンインデックス付きビーズ上での単一のCPT−DNAの捕捉を表わす図である。 固体表面に固定化したY−アダプターを、ライゲーション及びギャップ充填により標的DNAに結合させる例示的なスキームを示す図である。 CPT−DNAと固体支持体上の固定化オリゴヌクレオチドとのライゲーションの間に、前記Y−アダプターを作製する例示的なスキームを示す図である。 サイズ排除クロマトグラフィーによる連結ライブラリーからの遊離トランスポソームの除去を示す、アガロースゲル電気泳動を表わす図である。 特定のDNAフラグメントのショットガン配列ライブラリーを生成する例示的なスキームを示す図である。 クローンインデックス付きシークエンシングライブラリーからの配列情報をアセンブルする例示的なスキームを示す図である。 ビーズ上の捕捉プローブ密度の最適化の結果を示す図である。 分子内ハイブリダイゼーションによるビーズ上でのCPT−DNAのインデックス付きシークエンシングライブラリーの調製の実現性を試験した結果を示す図である。 クローンインデックス化の実現性を試験した結果を示す図である。 タグメント化後の鋳型核酸に対して隣接して(neighbouring)アラインされたリードの島内(intra)及び島間(intra)の特定の距離に対する、シークエンシングリードの頻度を示すグラフである。 図29A及び29Bは、固体支持体上の連続性情報を引き出す例示的なアプローチを示す図である。 単一の反応容器(ワンポット)におけるインデックス付きクローンビーズ転位の概略図及び転位結果を示す図である。 単一の反応容器(ワンポット)におけるインデックス付きクローンビーズ転位の概略図及び転位結果を示す図である。 5’又は3’ビオチン化オリゴヌクレオチドを用いたビーズ上でのクローントランスポソームの作製を示す概略図である。 ビーズ上のトランスポソームに対するライブラリーサイズを示す図である。 挿入サイズに対するトランスポソーム表面密度の影響を示す図である。 サイズ分布に対するインプットDNAの影響を示す図である。 ビーズベース及び溶液ベースのタグメント化反応を用いた島のサイズ及び分布を示す図である。 それぞれ固有インデックスを受け取った、いくつかの個々のDNA分子のクローンインデックス化を示す図である。 全血から血漿を分離する装置の略図である。 血漿を分離する装置及び分離された血漿のその後の使用を示す略図である。 血漿を分離する装置及び分離された血漿のその後の使用を示す略図である。 ゲノムの特定の領域を濃縮することによる標的フェージングの例示的なスキームを示す図である。 エクソン間のSNPを用いたエクソームフェージングの例示的なスキームを示す図である。 フェージング及びメチル化の同時検出の例示的なスキームを示す図である。 フェージング及びメチル化の同時検出の別の例示的なスキームを示す図である。 単一アッセイにおいて、種々のサイズのクローンインデックス付きビーズを用いて種々のサイズのライブラリーを生成する、例示的なスキームを示す図である。 異なる長さスケールのライブラリーで遺伝的変異を決定する例示的なスキームを示す図である。 染色体1における60kbヘテロ接合欠損の検出結果を示す図である。 染色体1における60kbヘテロ接合欠損の検出結果を示す図である。 本願の方法を用いた遺伝子融合検出の結果を示す図である。 本願の方法を用いた遺伝子欠損検出の結果を示す図である。 亜硫酸水素塩変換前後のME配列を示す図である。 亜硫酸水素塩変換効率の最適化の結果を示す図である。 亜硫酸水素塩変換後の結果をIVCプロット(各塩基当たりの強度対サイクル)で示す図である。 BSCの後のPCR後のインデックス付き結合ライブラリーのアガロースゲル電気泳動の画像を示す図である。 サイズ選択をしていない濃縮前の全ゲノムインデックス付き結合CPT−seqライブラリーのバイオアナライザートレースを示す図である。 濃縮後のライブラリーのアガロースゲル分析を示す図である。 標的化ハプロタイピングを染色体のHLA領域に適用した結果を示す図である。 ME交換(swapping)のいくつかの考え得るメカニズムを示す図である。 ME交換(swapping)のいくつかの考え得るメカニズムを示す図である。 Cysで置換することができる例示的なアミノ酸残基Asp468、Tyr407、Asp461、Lys459、Ser458、Gly462、Ala466、Met470を有するTn5トランスポザーゼの一部を示す図である。 システイン残基が2つの単量体単位間でジスルフィド結合を形成できるようにした、S458C、K459C、及びA466Cのアミノ酸置換を有するTn5トランスポザーゼの一部を示す図である。 アミン被覆ナノ粒子を用いた二量体トランスポザーゼ(dTnp)ナノ粒子(NP)バイオコンジュゲート(dTnp−NP)の作製及び使用の例示的なスキームを示す図である。 トランスポソーム二量体とアミン被覆固体支持体とのコンジュゲーションの例示的なスキームを示す図である。 トランスポゾン末端が結合したMuトランスポソーム複合体を示す図である。 疑似遺伝子のアセンブリ/フェージングのためのインデックス付き結合リードの略図、及びより短いフラグメントを用いた疑似遺伝子の変異識別の利点を示す図である。 交換された(swapped)インデックスの割合(%)として示す、4つの別個の実験からのインデックス交換(exchange)のプロットを示す図である。 Ts−Tn5滴定のフラグメントサイズの、Agilent BioAnalyzerによる分析を示す図である。 亜硫酸水素塩処理後の破損したライブラリーエレメントを回復させる酵素法を用いて、Epi−CPTSeqプロトコルのDNA収量を改善する、例示的なスキームを示す図である。 図68A〜68Cは、亜硫酸水素塩処理後の破損したライブラリーエレメントを回復させる酵素法を用いて、Epi−CPTSeqプロトコルのDNA収量を改善する、いくつかの例示的なスキームを示す図である。 ランダムプライマー伸長を用いた鋳型救出(rescue)の例示的なスキームを示す図である。 亜硫酸水素ナトリウム変換中のDNAライブラリーのフラグメント化を示す図である。左のパネルは、磁性ビーズ上にタグメント化されたDNAの一部を亜硫酸水素変換している最中のフラグメント化を示す。右のパネルは、CPT−seq及びEpi−CPT−seq(Me−CPT−seq)ライブラリーのバイオアナライザートレースを示す。 TdT媒介ssDNAライゲーション反応の例示的なスキーム及び結果を示す図である。 ライブラリーに結合した亜硫酸水素ナトリウム変換ビーズのTdT媒介回復のスキーム及び結果を示す図である。左のパネルは、TdT媒介ライゲーション反応を用いた損傷亜硫酸水素塩変換DNAライブラリーの救出の操作フローを示す。DNAライブラリー救出実験の結果を右のパネルに示す。 メチル−CPT−seqアッセイの結果を示す図である。 DNAのビーズベース亜硫酸水素塩変換の例示的なスキームを示す図である。 図75A及び75Bは、亜硫酸水素塩変換効率の最適化の結果を示す図である。
本発明の実施形態は、核酸のシークエンシングに関する。具体的には、本明細書で提供する方法及び組成物の実施形態は、核酸鋳型の調製及び核酸鋳型からの配列データの取得に関する。
1つの態様において、本発明は、タグメント化(フラグメント化及びタグ化)した標的核酸ライブラリーを構築するために、固体支持体上で標的核酸をタグメント化する方法に関する。1つの実施形態において、固体支持体は、ビーズである。1つの実施形態において、標的核酸は、DNAである。
1つの態様において、本発明は、標的核酸の連続性情報を引き出すことが可能な、固体支持体、トランスポザーゼに基づく方法の、方法及び組成物に関する。いくつかの実施形態において、組成物及び方法は、アセンブリ/フェージング情報を引き出すことができる。
1つの態様において、本発明は、連結した転位標的核酸を固体支持体上に捕捉することにより、連続性情報を引き出す方法及び組成物に関する。
1つの態様において、本明細書に開示する方法及び組成物は、ゲノム変異の分析に関する。例示的なゲノム変異としては、これに限定されないが、欠損、染色体間転位、重複、パラログ、染色体間遺伝子融合が挙げられる。いくつかの実施形態において、本明細書に開示する方法及び組成物は、ゲノム変異のフェージング情報の決定に関する。
1つの態様において、本明細書に開示する方法及び組成物は、標的核酸の特定の領域のフェージングに関する。1つの実施形態において、標的核酸は、DNAである。1つの実施形態において、標的核酸は、ゲノムDNAである。いくつかの実施形態において、標的核酸は、RNAである。いくつかの実施形態において、RNAは、mRNAである。いくつかの実施形態において、標的核酸は、相補的DNA(cDNA:complimentary DNA)である。いくつかの実施形態において、標的核酸は、単一の細胞に由来する。いくつかの実施形態において、標的核酸は、循環腫瘍細胞に由来する。いくつかの実施形態において、標的核酸は、無細胞DNAである。いくつかの実施形態において、標的核酸は、無細胞腫瘍DNAである。いくつかの実施形態において、標的核酸は、ホルマリン固定パラフィン包埋組織サンプルに由来する。いくつかの実施形態において、標的核酸は、架橋標的核酸である。いくつかの実施形態において、標的核酸は、タンパク質に架橋する。いくつかの実施形態において、標的核酸は、核酸に架橋する。いくつかの実施形態において、標的核酸は、ヒストンに保護されたDNAである。いくつかの実施形態において、ヒストンに保護されたDNAを、ヒストンに対する抗体を用いて細胞溶解物から沈殿させ、ヒストンを除去する。
いくつかの態様において、インデックス付きライブラリーは、クローンインデックス付きビーズを用いて、標的核酸から作製する。いくつかの実施形態において、タグメント化標的核酸は、トランスポザーゼが標的DNAに結合したままで、クローンインデックス付きビーズを用いて捕捉することができる。いくつかの実施形態において、特異的な捕捉プローブを用いて、標的核酸中の目的の特異的な領域を捕捉する。標的核酸の捕捉された領域は、種々のストリンジェンシーで洗浄し、任意選択的に増幅し、その後シークエンシングすることができる。いくつかの実施形態において、捕捉プローブは、ビオチン化してもよい。ビオチン化捕捉プローブがインデックス付き標的核酸の特異的な領域にハイブリダイズした複合体は、ストレプトアビジンビーズを用いて分離することができる。標的フェージングの例示的なスキームを図41に示す。
いくつかの態様において、本明細書に開示する組成物及び方法は、エクソームのフェージングに用いることができる。いくつかの実施形態において、エクソン、プロモーターを濃縮することができる。マーカー、例えば、エクソン領域間のヘテロ接合SNPは、特にエクソン間の距離が大きい場合に、エクソンのフェージングに役立つ可能性がある。例示的なエクソームのフェージングを図42に示す。いくつかの実施形態において、インデックス付き結合リードは、隣接しているエクソンのヘテロ接合SNPに同時に及ぶ(カバーする)ことができない。従って、2つ又はそれ以上のエクソンをフェージングすることは困難である。本明細書に開示する組成物及び方法はまた、エクソン間のヘテロ接合SNPを濃縮し、例えば、エクソン1をSNP1に、SNP2をエクソン2にフェージングする。従って、SNP1の使用を通じて、エクソン1及びエクソン2を、図42に示すようにフェージングすることができる。
1つの態様において、本明細書に開示する組成物及び方法は、フェージング及び同時のメチル化の検出に用いることができる。亜硫酸水素塩変換(BSC:bisulfite conversion)によるメチル化検出は、BSC反応がDNAに対して厳しい(harsh)ものであり、DNAをフラグメント化し、それにより連続性/フェージング情報を除去するため、困難である。また、本願に開示する方法は、従来のBSCアプローチで必要とされるのとは対照的に、更なる精製ステップを必要としないことにより、収率を改善するため、さらに利点がある。
1つの態様において、本明細書に開示する組成物及び方法を用いて、異なるサイズのライブラリーを1つのアッセイで調製することができる。いくつかの実施形態において、異なるサイズのクローンインデックス付きビーズを用いて、異なるサイズのライブラリーを調製することができる。図1は、トランスポザーゼをビーズ表面に結合させる方法100の一例のフローチャートを示す。トランスポザーゼは、トランスポゾンオリゴヌクレオチド、トランスポザーゼ、及び固相に加えてもよい任意の化学物質を用いて、ビーズ表面に結合させてもよい。1つの例において、トランスポソームを、ビオチン−ストレプトアビジン結合複合体を介してビーズ表面に結合させる。方法100は、これに限定されないが、以下のステップを含む。
1つの実施形態において、トランスポゾンは、シークエンシングプライマー結合部位を含んでいてもよい。シークエンス結合部位の例示的な配列としては、これに限定されないが、AATGATACGGCGACCACCGAGATCTACAC(P5配列)及びCAAGCAGAAGACGGCATACGAGAT(P7配列)が挙げられる。いくつかの実施形態において、トランスポゾンをビオチン化してもよい。
図1のステップ110において、P5及びP7ビオチン化トランスポゾンを生成する。トランスポゾンはまた、1つ又はそれ以上のインデックス配列(固有の識別子)を含んでいてもよい。例示的なインデックス配列としては、これに限定されないが、TAGATCGC、CTCTCTAT、TATCCTCT、AGAGTAGA、GTAAGGAG、ACTGCATA、AAGGAGTA、CTAAGCCTが挙げられる。別の例では、P5トランスポゾンのみ又はP7トランスポゾンのみをビオチン化する。さらに別の例では、トランスポゾンは、モザイク末端(ME:mosaic end)配列のみ、又はME配列に加えてP5及びP7配列ではない追加の配列を含む。この例では、P5及びP7配列は、後続のPCR増幅ステップで付加する。
図1のステップ115において、トランスポソームをアセンブルする。アセンブルしたトランスポソームは、P5及びP7トランスポソームの混合物である。P5及びP7トランスポソームの混合物は、図11及び12と関連してより詳細に説明する。
図1のステップ120において、P5/P7トランスポソーム混合物を、ビーズ表面に結合させる。この例では、ビーズは、ストレプトアビジン被覆ビーズであり、トランスポソームを、ビオチン−ストレプトアビジン結合複合体を介してビーズ表面に結合させる。ビーズは、種々のサイズであってもよい。1つの例において、ビーズは、2.8μmビーズであってもよい。別の例において、1μmビーズであってもよい。1μmビーズの懸濁液(例えば、1μL)は、体積当たり大きな表面積をトランスポソーム結合にもたらす。トランスポソーム結合に用いることができる表面積により、反応当たりのタグメント化生成物の数が増加する。
図2は、図1の方法100のステップ110、115、及び120を絵で示す。この例では、トランスポゾンを二本鎖で示す。別の例(図示しない)では、ヘアピン等の別の構造、即ち、二本鎖を形成することができる自己相補的な領域を有する単一のオリゴヌクレオチドを用いてもよい。
方法100のステップ110において、複数のビオチン化P5トランスポゾン210a及び複数のP7トランスポゾン210bを生成する。P5トランスポゾン210a及びP7トランスポゾン210bをビオチン化する。
方法100のステップ115において、P5トランスポゾン210a及びP7トランスポゾン210bをトランスポザーゼTn5 215と混合し、複数のアセンブルしたトランスポソーム220を形成する。
方法100のステップ120において、トランスポソーム220を、ビーズ225に結合させる。ビーズ225は、ストレプトアビジン被覆ビーズである。トランスポソーム220を、ビオチン−ストレプトアビジン結合複合体を介してビーズ225に結合させる。
1つの実施形態において、トランスポソームの混合物を、図10、11、12、及び13に示すように、ビーズ表面等の固体支持体上で形成してもよい。この例では、P5及びP7オリゴヌクレオチドを、トランスポソーム複合体のアセンブリ前に、初めにビーズ表面に結合させる。
図3は、ビーズ表面上におけるタグメント化工程300の例の模式図を示す。工程300において、トランスポソーム220が結合した図2のビーズ225を示す。DNA310の溶液をビーズ225の懸濁液に加える。DNA310がトランスポソーム220に接触すると、DNAがタグメント化(フラグメント化及びタグ化)され、トランスポソーム220を介してビーズ225に結合する。結合及びタグメント化されたDNA310をPCR増幅して、溶液中(ビーズを含まない)で増幅産物315のプールを生成してもよい。増幅産物315は、フローセル320の表面に転移させてもよい。クラスター生成プロトコル(例えば、ブリッジ増幅プロトコル、又はクラスター生成に使用することができる任意のその他の増幅プロトコル)を用いて、複数のクラスター325をフローセル320の表面上に生成してもよい。クラスター325は、タグメント化DNA310のクローン増幅産物である。これでクラスター325は、シークエンシングプロトコルの次のステップ用に準備できたことになる。
別の実施形態において、トランスポソームは、マイクロ遠心チューブの壁等の任意の固体表面に結合してもよい。
ビーズ表面上にトランスポソーム複合体の混合物を形成する別の実施形態において、オリゴヌクレオチドは、トランスポソームのアセンブリ前に、初めにビーズ表面に結合させる。図10は、ビーズ表面上でトランスポソーム複合体を形成する方法1000の一例のフローチャートを示す。方法1000は、これに限定されないが、以下のステップを含む。
ステップ1010において、P5及びP7オリゴヌクレオチドを、ビーズ表面に結合させる。1つの例において、P5及びP7オリゴヌクレオチドは、ビオチン化し、ビーズは、ストレプトアビジン被覆ビーズである。このステップはまた、図11の模式図1100に絵で示す。ここで、図11を参照すると、P5オリゴヌクレオチド1110及びP7オリゴヌクレオチド1115は、ビーズ1120の表面に結合する。この例においては、1つのP5オリゴヌクレオチド1110及び1つのP7オリゴヌクレオチド1115が、ビーズ1120の表面に結合しているが、任意の数のP5オリゴヌクレオチド1110及び/又はP7オリゴヌクレオチド1115が、複数のビーズ1120の表面に結合してもよい。1つの例において、P5オリゴヌクレオチド1110は、P5プライマー配列、インデックス配列(固有の識別子)、リード1シークエンシングプライマー配列、及びモザイク末端(ME)配列を含む。この例において、P7オリゴヌクレオチド1115は、P7プライマー配列、インデックス配列(固有の識別子)、リード2シークエンシングプライマー配列、及びME配列を含む。別の例(図示せず)において、インデックス配列は、P5オリゴヌクレオチド1110のみに存在する。さらに別の例(図示せず)において、インデックス配列は、P7オリゴヌクレオチド1115のみに存在する。さらに別の例(図示せず)において、インデックス配列は、P5オリゴヌクレオチド1110及びP7オリゴヌクレオチド1115のいずれにも存在しない。
ステップ1015において、相補的モザイク末端(ME’)オリゴヌクレオチドを、ビーズ結合P5及びP7オリゴヌクレオチドにハイブリダイズさせる。このステップはまた、図12の模式図1200に絵で示す。ここで、図12を参照すると、相補的ME配列(ME’)1125は、P5オリゴヌクレオチド1110及びP7オリゴヌクレオチド1115にハイブリダイズする。相補的ME配列(ME’)1125(例えば、相補的ME配列(ME’)1125a及び相補的ME配列(ME’)1125b)は、P5オリゴヌクレオチド1110及びP7オリゴヌクレオチド1115のME配列にそれぞれハイブリダイズする。相補的ME配列(ME’)1125は、典型的には、約15塩基長であり、5’末端でリン酸化されている。
ステップ1020において、トランスポザーゼ酵素をビーズ結合オリゴヌクレオチドに添加し、ビーズ結合トランスポソーム複合体の混合物を形成する。このステップはまた、図13の模式図1300に絵で示す。ここで図13を参照すると、トランスポザーゼ酵素が添加されて、複数のトランスポソーム複合体1310を形成する。この例において、トランスポソーム複合体1310は、トランスポザーゼ酵素、2つの表面結合オリゴヌクレオチド配列、及びそれらにハイブリダイズした相補的ME配列(ME’)1125を含む二本鎖構造である。例えば、トランスポソーム複合体1310aは、相補的ME配列(ME’)1125にハイブリダイズしたP5オリゴヌクレオチド1110及び相補的ME配列(ME’)1125にハイブリダイズしたP7オリゴヌクレオチド1115(即ち、P5:P7)を含み、トランスポソーム複合体1310bは、相補的ME配列(ME’)1125にハイブリダイズした2つのP5オリゴヌクレオチド1110(即ち、P5:P5)含み、トランスポソーム複合体1310cは、相補的ME配列(ME’)1125にハイブリダイズした2つのP7オリゴヌクレオチド1115(即ち、P7:P7)含む。P5:P5、P7:P7、及びP5:P7トランスポソーム複合体の割合は、例えば、25:25:50であってもよい。
図14は、図13のトランスポソーム被覆ビーズ1120を用いたタグメント化工程の例示的な模式図1400を示す。この例において、トランスポソーム複合体1310を有するビーズ1120を、タグメント化バッファー中のDNA1410の溶液に加え、タグメント化を生じさせ、DNAをビーズ1120の表面にトランスポソーム1310を介して結合させる。DNA1410の連続したタグメント化により、トランスポソーム1310間に複数のブリッジ分子1415が生じる。ブリッジ分子1415の長さは、ビーズ1120の表面におけるトランスポソーム複合体1310の密度に依存する可能性がある。1つの例において、ビーズ1120の表面上のトランスポソーム複合体1310の密度は、図10の方法100のステップ1010においてビーズ1120の表面に結合するP5及びP7オリゴヌクレオチドの量を変化させることにより調整してもよい。別の例において、ビーズ1120の表面上のトランスポソーム複合体1310の密度は、図10の方法1000のステップ1015において、P5及びP7オリゴヌクレオチドにハイブリダイズする相補的ME配列(ME’)の量を変化させることにより、調整してもよい。さらに別の例において、ビーズ1120の表面上のトランスポソーム複合体1310の密度は、図1の方法1000のステップ1020において加えるトランポザーゼ酵素の量を変化させることにより、調整してもよい。
ブリッジ分子1415の長さは、タグメント化反応で用いられた、トランスポソーム複合体1310が結合したビーズ1120の量に依存しない。同様に、タグメント化反応においてより多い又はより少ないDNA1410を加えることは、最終的なタグメント化産物のサイズを変えないが、反応の収率に影響を与える可能性がある。
1つの例において、ビーズ1120は、常磁性ビーズである。この例では、タグメント化反応の精製は、ビーズ1120を磁石で固定化し、洗浄することにより容易に行うことができる。従って、タグメント化及びその後のPCR増幅を、単一の反応区画(「ワンポット(one−pot)」)での反応で実施してもよい。
1つの態様において、本発明は、固体支持体上で標的核酸の連続性情報を引き出すことが可能なトランスポザーゼに基づく方法の、方法及び組成物に関する。いくつかの実施形態において、組成物及び方法は、アセンブリ/フェーズ情報を引き出すことができる。1つの実施形態において、固体支持体は、ビーズである。1つの実施形態において、標的核酸は、DNAである。1つの実施形態において、標的核酸は、ゲノムDNAである。いくつかの実施形態において、標的核酸は、RNAである。いくつかの実施形態において、RNAは、mRNAである。いくつかの実施形態において、標的核酸は、相補的DNA(cDNA)である。
いくつかの実施形態において、トランスポゾンを、ビーズ等の固体支持体に二量体として固定化し、その後トランスポザーゼをトランスポゾンに結合してトランスポソームを形成してもよい。
いくつかの実施形態において、固相化トランスポゾン及びトランスポザーゼの添加による、固相でのトランスポソームの形成に特に関連して、2つのトランスポゾンを、固体支持体において互いにごく近接して(好ましくは、一定の距離で)固定化してもよい。このアプローチには、いくつかの利点がある。1つ目としては、好ましくは、2つのトランスポゾンがトランスポソームを効率良く形成するのに最適なリンカー長及び方向で、2つのトランスポゾンが、常に同時に固定化されることになる。2つ目としては、トランスポソームの形成効率が、トランスポゾン密度の関数とはならないであろうことである。2つのトランスポゾンが、トランスポソームを形成するのに適切な方向及び両者間の距離で、常に利用できることになる。3つ目としては、表面上のランダムな固定化トランスポゾンにより、トランスポゾン間に種々の距離が形成され、それにより、1つの画分のみがトランスポソームを効率良く形成するのに最適な方向及び距離を有する。結果として、全てのトランスポゾンがトランスポソームに変換するのではなく、固相化非複合体化トランスポゾンが存在することになる。これらのトランスポゾンは、ME部分が二本鎖DNAであるため、転位の標的となり易い。これにより、転位効率の低下をもたらし、望ましくない副産物を形成する可能性がある。従って、続けて使用して、タグメント化及びシークエンシングを通じて連続性情報を導き出すことができる固体支持体上に、トランスポソームを調製してもよい。例示的なスキームを図15に示す。いくつかの実施形態において、トランスポゾンは、化学的結合以外の手法で固体支持体に固定化してもよい。固体支持体上にトランスポゾンを固定化する例示的な方法としては、これに限定されないが、ストレプトアビジン−ビオチン、マルトース−マルトース結合タンパク質、抗原−抗体、DNA−DNA又はDNA−RNAハイブリダイゼーション等の親和結合が挙げられる。
いくつかの実施形態において、トランスポソームは、プレアセンブルした後、固体支持体に固定化することができる。いくつかの実施形態において、トランスポゾンは、固有のインデックス、バーコード、及び増幅プライマー結合部位を含む。トランスポザーゼを、トランスポゾンを含む溶液に添加し、固体支持体上に固定化することが可能なトランスポソーム二量体を形成することができる。1つの実施形態において、各セットが固定化トランスポゾンに由来する同じインデックスを有し、それによりインデックス付きビーズを生成する、複数のビーズセットを生成することができる。図29Aに示すように、標的核酸を、インデックス付きビーズの各セットに添加することができる。
いくつかの実施形態において、標的核酸は、インデックス付きビーズの各セットに添加することができ、タグメント化及びその後のPCR増幅を別々に行ってもよい。
いくつかの実施形態において、標的核酸、インデックス付きビーズ、及びトランスポソームは、多くの液滴が、1つのビーズと1つ又はそれ以上のDNA分子及び十分なトランスポソームとを含むように、液滴内で組み合わせることができる。
いくつかの実施形態において、インデックス付きビーズをプールすることができ、プールに標的核酸を加えることができ、タグメント化及びその後のPCR増幅を単一の反応区画(「ワンポット」)で行ってもよい。
1つの態様において、本発明は、連結転位標的核酸を固体支持体上に捕捉することにより、連続性情報を引き出す方法及び組成物に関する。いくつかの実施形態において、連続性保存転位(CPT:contiguity preserving transposition)をDNA上で行うが、DNAは、無傷(intact)のままであり(CPT−DNA)、従って、連結ライブラリーを形成する。連続性情報は、トランスポザーゼを用いて標的核酸に隣接した鋳型核酸フラグメントの関連性(association)を維持することにより、保存することができる。CPT−DNAは、固体支持体、例えば、ビーズに固定化された、固有のインデックス又はバーコードを有する相補的オリゴヌクレオチドのハイブリダイゼーションにより捕捉することができる(図29B)。いくつかの実施形態において、固体支持体に固定化されたオリゴヌクレオチドは、バーコードに加えて、プライマー結合部位、固有分子インデックス(UMI:unique molecular indices)をさらに含んでいてもよい。
有利なことに、このようにトランスポソームを用いて、フラグメント化された核酸の物理的近接性を保つことにより、同じ起源の分子、例えば、染色体からのフラグメント化された核酸が、同じ固有のバーコード及びインデックス情報を固体支持体に固定化されたオリゴヌクレオチドから受け取る可能性が増える。これにより、固有のバーコードを有する連結シークエンシングライブラリーが得られることになる。連結シークエンシングライブラリーをシークエンスして、連続配列情報を引き出すことができる。
図16及び17は、固有のバーコード又はインデックスを有する連結ライブラリーを作製する本発明の上記態様の、例示的な実施形態の模式図を示す。例示的な方法は、CPT−DNAと、固有のインデックス及びバーコードを有する固体支持体上の固定化オリゴヌクレオチドとのライゲーション、及び鎖置換PCRを活用して、シークエンシングライブラリーを生成する。1つの実施形態において、クローンインデックス付きビーズは、ランダム又は特定のプライマー及びインデックス等の固定化DNA配列で生成してもよい。連結ライブラリーは、固定化オリゴヌクレオチドへのハイブリダイゼーションとその後のライゲーションにより、クローンインデックス付きビーズ上に捕捉することができる。分子内ハイブリダイゼーション捕捉は、分子間ハイブリダイゼーションよりもはるかに速いため、連続転位ライブラリーが、ビーズに「巻き付く(wrap around)」ことになる。図18及び19は、クローンインデックス付きビーズ上でのCPT−DNAの捕捉及び連続性情報の保存を示す。鎖置換PCRは、クローンビーズインデックス情報を個々の分子に転移することができる。従って、各連結ライブラリーは、特異的にインデックス付けされることになる。
いくつかの実施形態において、固体支持体に固定化されたオリゴヌクレオチドは、一方の鎖は固体支持体に固定化され、もう一方の鎖は、固定化された鎖に部分的に相補的であることによりY−アダプターとなるような、部分的二本鎖構造を含むことができる。いくつかの実施形態において、固体支持体に固定化されたY−アダプターは、ライゲーション及びギャップ充填により連結タグメント化DNAに結合する。図20に示す。
いくつかの実施形態において、Y−アダプターは、ビーズ等の固体支持体上のプローブ/インデックスを用いた、CPT−DNAのハイブリダイゼーション捕捉を通じて、形成される。図21は、このようなY−アダプターを作製する例示的なスキームを示す。これらのY−アダプターを使用することにより、潜在的に各フラグメントがシークエンシングライブラリーになる可能性があることを確かにする。これにより、シークエンシング当たりの適用範囲(coverage)が増加する。
いくつかの実施形態において、遊離トランスポソームを、CPT−DNAから分離してもよい。いくつかの実施形態において、遊離トランスポソームの分離は、サイズ排除クロマトグラフィーによる。1つの実施形態において、分離は、MicroSpin S−400 HR Columns(ペンシルバニア州ピッツバーグ、GE Healthcare Life Sciences社)により行ってもよい。図22は、遊離トランスポソームから分離したCPT−DNAのアガロースゲル電気泳動を示す。
ハイブリダイゼーションを通じた連結転位標的核酸の固体支持体上への捕捉には、いくつかの特有の利点がある。1つ目としては、方法は、ハイブリダイゼーションに基づくものであり、転位に基づくものではない。分子内ハイブリダイゼーション率>>分子間ハイブリダイゼーション率である。従って、単一の標的DNA分子の連続転位ライブラリーが固有インデックス付きビーズに巻き付く可能性は、2つ又はそれ以上の異なる単一の標的DNA分子が固有インデックス付きビーズに巻き付くのに比べてはるかに高い。2つ目としては、DNAの転位及び転位したDNAのバーコード化は、2つの別個のステップで生じる。3つ目としては、ビーズ上の活性化トランスポソームのアセンブリ及び固体表面上のトランスポゾンの表面密度の最適化に関連した課題を、回避することができる。4つ目としては、自己転位産物をカラム精製により除去することができる。5つ目としては、連結転位DNAがギャップを含むため、DNAがより柔軟であり、それ故、トランスポソームをビーズに固定化する方法に比べて、転位密度(挿入サイズ)への負荷が少ない。6つ目としては、方法に、組み合わせ(combinatorial)バーコードスキームを用いることができる。7つ目としては、インデックス付きオリゴをビーズに共有結合させるのが容易である。従って、インデックス交換の可能性が少ない。8つ目としては、タグメント化及びその後のPCR増幅を多重化してもよく、単一反応区画(「ワンポット」)反応で行うことができるため、各インデックス配列に対して個々の反応を行う必要がなくなる。
いくつかの実施形態において、転位の間に、複数の固有のバーコードを標的核酸全体にわたって挿入してもよい。いくつかの実施形態において、各バーコードは、間にフラグメント化部位が配置された第1のバーコード配列及び第2のバーコード配列を含む。第1のバーコード配列及び第2のバーコード配列は、互いにペアとなるように同定又は設計することができる。第1のバーコードと第2のバーコードとが関連するようにペアを作ることは、有益(informative)である可能性がある。有利なことに、ペアとなったバーコード配列を用いて、シークエンシングデータを鋳型核酸のライブラリーからアセンブルすることができる。例えば、第1のバーコード配列を含む第1の鋳型核酸、及び第1のバーコード配列とペアとなる第2のバーコード配列含む第2の鋳型核酸を同定することは、第1及び第2の鋳型核酸が、標的核酸の配列表示において互いに隣接した配列を表すことを意味する。このような方法を用いて、参照ゲノムを必要とすることなく、標的核酸の配列表示をデノボで(新たに)アセンブルすることができる。
1つの態様において、本発明は、特定のDNAフラグメントのショットガン配列ライブラリーを生成する方法及び組成物に関する。
1つの実施形態において、クローンビーズインデックス付きビーズを、固定化オリゴヌクレオチド配列:ランダム又は特異的なプライマー及び固有のインデックスで生成する。標的核酸を、クローンインデックス付きビーズに加える。いくつかの実施形態において、標的核酸は、DNAである。1つの実施形態において、標的DNAを変性させる。標的DNAは、固体表面(例えば、ビーズ)に固定化された固有のインデックスを含むプライマーにハイブリダイズし、続いて、同じインデックスを有する別のプライマーにハイブリダイズする。ビーズ上のプライマーは、DNAを増幅させる。1つ又はそれ以上の更なる増幅ラウンドを行ってもよい。1つの実施形態において、増幅は、3’ランダムn量体配列を有するビーズ固定化プライマーを用いて、全ゲノム増幅により行ってもよい。好ましい実施形態において、ランダムn量体は、増幅中のプライマー−プライマー相互作用を防ぐために、疑似相補的塩基(2−チオチミン、2−アミノdA、N4−エチルシトシン等)を含む(Hoshika,S;Chen,F;Leal,NA;Benner,SA,Angew.Chem.Int.Ed.49(32)5554−5557(2010))。図23は、特定のDNAフラグメントのショットガン配列ライブラリーを生成する例示的なスキームを示す。クローンインデックス付きシークエンシングライブラリー及び増幅産物のライブラリーを生成することができる。1つの実施形態において、このようなライブラリーは、転位により生成することができる。インデックス情報を指針として用いることにより、クローンインデックス付きライブラリーの配列情報を用いて、連続性情報をアセンブルすることができる。図24は、クローンインデックス付きシークエンシングライブラリーから配列情報をアセンブルする例示的なスキームを示す。
上記実施形態の方法には、いくつかの利点がある。ビーズ上での分子内増幅は、ビーズ間増幅よりもはるかに速い。従って、ビーズ上の生成物は、同じインデックスを有することになる。特定のDNAフラグメントのショットガンライブラリーを、作製することができる。ランダムプライマーは、ランダムな場所で鋳型を増幅するため、同じインデックスを有するショットガンライブラリーを特定の分子から生成することができ、インデックス付き配列を用いて配列情報をアセンブルすることができる。上記実施形態の方法の大きな利点は、反応を単一の反応(ワンポット反応)で多重化することができ、多くの個別のウェルを用いる必要がなくなることである。多くのインデックス付きクローンビーズを調製することができ、そのため、多くの異なるフラグメントを固有にラベルすることができ、同じゲノム領域に対して親対立遺伝子を識別することができる。多数のインデックスを用いることにより、父親のDNAコピー及び母親のDNAコピーが同じゲノム領域に対して同じインデックスを受け取る可能性は低い。当該方法は、内(intra)反応が間(inter)反応よりもはるかに速いという事実を利用するものであり、ビーズは、大きな物理的区画において実質的な仕切りを基本的に作り出す。
本発明の全ての上記態様のうちのいくつかの実施形態において、方法を、無細胞DNA(cfDNA:cell free DNA)アッセイにおいてcfDNAに用いてもよい。いくつかの実施形態において、cfDNAは、血漿、胎盤液から得る。
1つの実施形態において、血漿は、膜ベースの沈降支援血漿分離器を用いて無希釈の全血から得ることができる(Liu et al.Anal Chem.2013 Nov 5;85(21):10463−70)。1つの実施形態において、血漿分離器における血漿採取ゾーンは、トランスポソームを含む固体支持体を含んでいてもよい。トランスポソームを含む固体支持体は、血漿が全血から分離される時に、単離された血漿からcfDNAを捕捉してもよく、cfDNAの濃縮及び/又はDNAのタグメント化を行うことができる。いくつかの実施形態において、タグメント化は、固有のバーコードをさらに導入することにより、続いて分離(demultiplexing)を、ライブラリープールのシークエンシング後に行うことを可能にするであろう。
いくつかの実施形態において、分離器の採取ゾーンは、PCRマスターミックス(プライマー、ヌクレオチド、バッファー、金属)及びポリメラーゼを含んでいてもよい。1つの実施形態において、マスターミックスは、血漿が分離器から出てくる時に再構成されるように、乾燥状態であってもよい。いくつかの実施形態において、プライマーは、ランダムプライマーである。いくつかの実施形態において、プライマーは、特定の遺伝子に対する特異的プライマーであってもよい。cfDNAのPCR増幅の結果として、分離された血漿から直接ライブラリーを生成することになる。
いくつかの実施形態において、分離器の採取ゾーンは、RT−PCRマスターミックス(プライマー、ヌクレオチド、バッファー、金属)、逆転写酵素、及びポリメラーゼを含んでいてもよい。いくつかの実施形態において、プライマーは、ランダムプライマー又はオリゴdTプライマーである。いくつかの実施形態において、プライマーは、特定の遺伝子に対する特異的プライマーであってもよい。得られたcDNAは、シークエンシングに用いることができる。或いは、cDNAは、配列ライブラリー調製のために、固体支持体に固定化されたトランスポソームで処理してもよい。
いくつかの実施形態において、血漿分離器は、バーコード(1D又は2Dバーコード)を含んでいてもよい。いくつかの実施形態において、分離装置は、採血装置を有していてもよい。これにより、血液を血漿分離器及びライブラリー調製装置に直接送ることになる。いくつかの実施形態において、装置は、下流配列分析器を有していてもよい。いくつかの実施形態において、配列分析器は、単回使用シークエンサーである。いくつかの実施形態において、シークエンサーは、まとめてシークエンシングする前に、サンプルの列を作ることができる。或いは、シークエンサーは、サンプルがシークエンシング領域に送達される、ランダムアクセス機能を有していてもよい。
いくつかの実施形態において、血漿用採取ゾーンは、無細胞DNAが濃縮されるように、シリカ基質を含んでいてもよい。
フェージング及びメチル化の同時検出
5−メチルシトシン(5−Me−C)及び5−ヒドロキシメチルシトシン(5−ヒドロキシ−C)は、エピジェネティック(Epi)修飾としても知られ、細胞代謝、分化、及び癌増殖において重要な役割を果たす。本願の発明者らは、驚くべきことに、且つ予想外にも、フェージング及び同時のメチル化の検出が、本願の方法及び組成物を用いて可能であることを見出した。本願の方法は、ビーズ上でのCPTシークエンシング(CPT−seq)(インデックス付き連結ライブラリー)とDNAメチル化検出とを組み合わせることを可能にするものである。例えば、ビーズ上に生成された個々のライブラリーを亜硫酸水素塩で処理して、非メチル化CをUに変換するが、メチル化CはUに変換しないことにより、5−Me−Cの検出を可能にすることができる。ヘテロ接合SNPを用いた更なるフェージング分析を通じて、Epi−メチル化−フェージングブロックを複数のメガ塩基領域で確立することができる。
いくつかの実施形態において、分析されるDNAのサイズは、約100塩基〜約複数メガ塩基まで可能である。いくつかの実施形態において、分析されるDNAのサイズは、約100塩基、200塩基、300塩基、400塩基、500塩基、600塩基、700塩基、800塩基、900塩基、1000塩基、1200塩基、1300塩基、1500塩基、2000塩基、3000塩基、3500塩基、4000塩基、4500塩基、5000塩基、5500塩基、6000塩基、6500塩基、7000塩基、7500塩基、8000塩基、8500塩基、9000塩基、9500塩基、10,000塩基、10,500塩基、11,000塩基、11,500塩基、12,000塩基、12,500塩基、13,000塩基、14,000塩基、14,500塩基、15,000塩基、15,500塩基、16,000塩基、16,500塩基、17,000塩基、17,500塩基、18,000塩基、18,500塩基、19,000塩基、19,500塩基、20,000塩基、20,500塩基、21,000塩基、21,500塩基、22,000塩基、22,500塩基、23,000塩基、23,500塩基、24,000塩基、24,500塩基、25,000塩基、25,500塩基、26,000塩基、26,500塩基、27,000塩基、27,500塩基、28,000塩基、28,500塩基、29,500塩基、30,000塩基、30,500塩基、31,000塩基、31,500塩基、32,000塩基、33,000塩基、34,000塩基、35,000塩基、36,000塩基、37,000塩基、38,000塩基、39,000塩基、40,000塩基、42,000塩基、45,000塩基、50,000塩基、55,000塩基、60,000塩基、65,000塩基、70,000塩基、75,000塩基、80,000塩基、85,000塩基、90,000塩基、95,000塩基、100,000塩基、110,000塩基、120,000塩基、130,000塩基、140,000塩基、150,000塩基、160,000塩基、170,000塩基、180,000塩基、200,000塩基、225,000塩基、250,000塩基、300,000塩基、350,000塩基、400,000塩基、450,000塩基、500,000塩基、550,000塩基、600,000塩基、650,000塩基、700,000塩基、750,000塩基、800,000塩基、850,000塩基、900,000塩基、1,000,000塩基、1,250,000塩基、1,500,000塩基、2,000,000塩基、2,500,000塩基、3,000,000塩基、4,000,000塩基、5,000,000塩基、6,000,000塩基、7,000,000塩基、8,000,000塩基、9,000,000塩基、10,000,000塩基、15,000,000塩基、20,000,000塩基、30,000,000塩基、40,000,000塩基、50,000,000塩基、75,000,000塩基、100,000,000塩基、又はそれ以上である。
5−ヒドロキシ−C、DNA酸化生成物、DNAアルキル化生成物、ヒストン末端(histone−foot)プリンティング等の他のEpi修飾はまた、本願に開示する方法及び組成物を用いてフェージングの中で分析することもできる。
いくつかの実施形態において、DNAは、初めに、固体支持体上でインデックス付き結合ライブラリーに変換される。元のDNAよりもはるかに小さい個々のインデックス付きライブラリーは、個々のライブラリーがより小さいため、フラグメント化され難い。インデックス付きライブラリーの小画分が消失したとしても、フェージング情報は、インデックス付きDNA分子の全長にわたって依然として維持される。例えば、100kbの分子の場合、従来の亜硫酸水素塩変換(BSC)では半分にフラグメント化され、連続性はもはや50kbに制限される。本明細書に開示する方法では、100kbのライブラリーは、初めにインデックス化され、個々のライブラリーの画分が消失しても、連続性は、依然として〜100kbである(全ライブラリーがDNA分子の一端から消失する稀な事態を除いて)。また、本明細書に開示する方法は、従来の亜硫酸水素塩変換アプローチでは必要とされるのとは対照的に、更なる精製ステップが必要とされないことにより、収率が上がるため、さらに利点を有する。本明細書に開示する方法では、ビーズは、亜硫酸水素塩変換の後に洗浄するだけである。さらに、DNAが固相に結合しているままで、DNA(インデックス付きライブラリー)の最小限の消失及び少ない手間でバッファー交換を容易に行うことができる。
フェージング及びメチル化の同時検出の例示的なスキームを図43に示す。操作フローは、ビーズ上でのDNAのタグメント化、9塩基対の反復領域のギャップ充填ライゲーション、SDSによるTn5の除去、及びビーズ上の個々のライブラリーの亜硫酸水素塩変換からなる。隣接する相補的ライブラリーが再アニールしないことを確実にするために、亜硫酸水素塩変換を変性条件下で行い、それにより、亜硫酸水素塩変換効率を低下させる。BSCは、非メチル化CをUに変換し、メチル化Cは、変換されない。
図44は、フェージング及びメチル化の同時検出の別の例示的なスキームを示す。転位後にシークエンシングライブラリーを調製した後、一本鎖鋳型を調製するために、ギャップ充填ライゲーションしたライブラリーの画分を分解する。一本鎖鋳型は、既に鋳型が、ライブラリーの消失を低減すること又は亜硫酸水素塩変換効率を改善することができる一本鎖であるため、亜硫酸水素塩変換に対してより穏やかな条件を必要とする。1つの実施形態において、3’チオ保護トランスポゾン(Exo抵抗性)及び非保護トランスポゾンの混合物を、同じビーズ上で用いる。酵素、例えば、Exo Iを用いて、非チオ保護ライブラリーを分解し、それらを一本鎖ライブラリーに変換することができる。チオ保護トランスポゾン:非保護トランスポゾンが50:50である混合物を用いることにより、ライブラリーの50%を一本鎖ライブラリーに変換し(50%では、ライブラリーの1つのトランスポゾンは保護されており、1つのトランスポゾン(相補鎖)は保護されていない)、25%は変換せず(両方のトランスポゾンがチオ保護されている)、25%は両方とも変換してライブラリー全体を除去する(両方のトランスポゾンが保護されていない)。
ストレプトアビジン磁性ビーズ等の固相に結合したDNAの亜硫酸水素塩変換を行う上での1つの課題は、DNAが結合したビーズを、亜硫酸水素ナトリウムにより高温で長時間処理することで、DNA及びビーズの両方に損傷を与えることである。DNA損傷の回復を助けるため、キャリアDNA(即ち、ラムダDNA)を亜硫酸水素塩処理前に反応混合物に加える。キャリアDNAが存在しても、当初のDNAの約80%が消失することが予測された。結果として、CPTSeq連続性ブロックは、従来のCPTSeqプロトコルよりも少ないメンバーを有する。
従って、本明細書において、Epi−CPTSeqプロトコルのDNA収量を改善するためのいくつかのストラテジーを提案する。第1のストラテジーは、ストレプトアビジンビーズにトランスポソーム複合体をより密集させることで、ライブラリー挿入サイズを小さくすることに依拠する。ライブラリーサイズを小さくすることにより、より少ない割合のライブラリーエレメントが亜硫酸水素塩処理により分解される。
Epi−CPTSeqプロトコルのDNA収量を改善するための第2のストラテジーは、破損したライブラリーエレメントを酵素により回復させることである。回復ストラテジーの目的は、ライブラリー増幅に必要な3’共通配列を、亜硫酸水素塩処理中に3’部分が分解及び消失したビーズ結合ライブラリーエレメントに再び加えることである。3’共通配列を加えた後は、これらのエレメントをPCR増幅及びシークエンシングすることができる。図67及び68は、このストラテジーの例示的なスキームを示す。二本鎖CPTSeqライブラリーエレメントを変性し、亜硫酸水素塩変換する(上段)。亜硫酸水素塩変換の間に、DNA鎖の1つが損傷を受け(中段)、3’末端上のPCR共通配列が消失する。鋳型救出ストラテジーにより、PCR増幅に必要な3’共通配列(緑色)を回復させる(下段)。1つの例において、3’リン酸化アテニュエーターオリゴ、即ち、シークエンシングアダプターとそれに続くオリゴdTストレッチを含む配列の存在下で、ターミナルトランスフェラーゼを使用する(図68A)。簡単に言えば、TdTが、10〜15dAのストレッチを、アテニュエーターオリゴのオリゴdT部分にアニールする破損ライブラリーエレメントの3’末端に、加える。このDNAハイブリッドの形成により、TdT反応が停止し、破損ライブラリーエレメントの3’末端をDNAポリメラーゼにより結果的に伸長させるための鋳型をもたらす。
別の操作フロー(図68B)では、TdTテーリング反応を、一本鎖オリゴdT部分及び5’リン酸化二本鎖シークエンシングアダプター部分を有する部分的二本鎖アテニュエーターオリゴの存在下で行う。TdT反応の終結時、最後に付加されたdAと5’リン酸化アテニュエーターオリゴとの間のニックを、DNAリガーゼで封止する。
記載した操作フローのどちらも、近年開発された制御可能なTdTテーリング反応に依拠しており、米国特許出願公開第2015/0087027号明細書に記載されている。共通シークエンシングアダプターはまた、近年導入されたMMLV RTのssDNA鋳型スイッチング活性により、破損ライブラリーエレメントの3’末端に付加することができる。つまり、MMLV RT及び鋳型スイッチオリゴ(TSオリゴ:template switch_oligo)を、損傷DNAに加える(図68C)。この反応の最初のステップにおいて、逆転写酵素は、一本鎖DNAフラグメントの3’末端にいくつかの追加のヌクレオチドを付加し、これらの塩基は、TSオリゴの1つの3’末端に存在するオリゴ(N)配列とペアを作る。次いで、逆転写酵素の鋳型スイッチング活性により、アニールされた共通プライマーの配列をBSC破損ライブラリーエレメントの3’末端に付加し、共通シークエンシングプライマーによるPCRで増幅される能力を回復させる。
第3のストラテジーの一部として、Epicentre社のEpiGenomeキット「ポスト亜硫酸水素塩変換」ライブラリー構築法を用いて、亜硫酸水素塩変換中に3’末端の共通配列を消失したライブラリーエレメントを救出することができる。図69に示すように、このライブラリー救出法は、共通配列及びそれに続く短いストレッチのランダム配列を有する3’リン酸化オリゴを利用する。これらの短いランダム配列は、亜硫酸水素塩処理一本鎖DNAにハイブリダイズし、続いて共通配列が、DNAポリメラーゼにより破損ライブラリー鎖に複製される。
図74は、ビーズ上での亜硫酸水素塩シークエンシング法を改良する第4のストラテジーを示す。捕捉タグを含む第1の共通配列を、DNAの5’末端に共有結合させる。第1の共通配列は、片側転位(図示する)、アダプターライゲーション、又は米国特許出願公開第2015/0087027号明細書に記載されたターミナルトランスフェラーゼ(TdT)アダプターライゲーションを含む、種々の方法を用いてDNAに結合させることができる。
次に、DNAを変性させ(例えば、高熱でのインキュベーション)、固体支持体に結合させる。ビオチンをCS1上の捕捉タグとして使用する場合は、例えば、DNAは、ストレプトアビジン磁性ビーズ(図示する)を用いて結合させることができる。固体支持体に結合してしまえば、バッファー交換を容易に行うことができる。
次のステップにおいて、ssDNAの亜硫酸水素塩変換を行う。一本鎖の形では、DNAは、亜硫酸水素塩変換に容易に利用できるはずであり、Promega社のMethyl Edge BSCキットの改良版を用いて変換効率95%まで観察した(図75)。
亜硫酸水素塩変換後、第2の共通配列を、固体支持体に結合したssDNAの3’末端に共有結合させる。オリゴをssDNAに共有結合させるためのいくつかの方法を、上述してきた。TdTアテニュエーター/アダプターライゲーション法を用いて、>95%のライゲーション効率を達成した。結果として、提案したメチルシークエンシング(MethylSeq)操作フローを用いた最終ライブラリーの収量は、既存の方法よりも高くなるはずである。
最終ステップにおいて、PCRを行ってライブラリーを増幅し、ライブラリーを固体支持体から除去する。PCRプライマーは、シークエンシングアダプター等の追加の共通配列を、MethylSeqライブラリーの末端に付加するようにデザインすることができる。
単一アッセイにおける様々なサイズのライブラリーの調製
ゲノムのアセンブリの精度は、様々な長さスケールの技術の使用次第である。例えば、ショットガン(数百bp)−メイトペア(〜3Kb)から−Hi−C(Mbスケール)は全て、アセンブリ及びコンティグ長を経時的に改良する方法である。課題は、これを行うために多重アッセイが必要であり、多層アプローチを扱い難く且つ費用が掛かるものとしていることである。本明細書に開示する組成物及び方法は、単一のアッセイで複数の長さスケールに対応することができる。
いくつかの実施形態において、ライブラリー調製を、サイズの異なる固体支持体、例えば、ビーズを用いて単一アッセイで達成することができる。各ビーズのサイズは、ビーズの物理的サイズがライブラリーサイズを決定し、特定のライブラリーサイズ又はサイズ範囲をもたらすことになる。様々なサイズのビーズは全て、ライブラリーに転移する固有のクローンインデックスを有する。従って、様々なサイズのライブラリーが、固有にインデックス付けされた異なる各ライブラリースケール長で生成される。様々な長さスケールのライブラリーを同じ物理的区画で同時に調製するため、コストが減り、操作フロー全体を改善する。いくつかの実施形態において、各特定の固体支持体サイズ、例えば、ビーズサイズは、固有のインデックスを受け取る。いくつかの他の実施形態において、同じ固体支持体サイズ、例えば、同じビーズサイズの複数の異なるインデックスもまた調製することで、複数のDNA分子をそのサイズ範囲に対してインデックス区分することができる。図45は、単一アッセイで、様々なサイズのクローンインデックス付きビーズを用いて様々なサイズのライブラリーを生成する例示的なスキームを示す。
いくつかの実施形態において、生成されるライブラリーのサイズは、約50塩基、75塩基、100塩基、150塩基、200塩基、250塩基、300塩基、350塩基、400塩基、500塩基、600塩基、700塩基、800塩基、900塩基、1000塩基、1200塩基、1300塩基、1500塩基、2000塩基、3000塩基、3500塩基、4000塩基、4500塩基、5000塩基、5500塩基、6000塩基、6500塩基、7000塩基、7,500塩基、8000塩基、8500塩基、9000塩基、9500塩基、10,000塩基、10,500塩基、11,000塩基、11,500塩基、12,000塩基、12,500塩基、13,000塩基、14,000塩基、14,500塩基、15,000塩基、15,500塩基、16,000塩基、16,500塩基、17,000塩基、17,500塩基、18,000塩基、18,500塩基、19,000塩基、19,500塩基、20,000塩基、20,500塩基、21,000塩基、21,500塩基、22,000塩基、22,500塩基、23,000塩基、23,500塩基、24,000塩基、24,500塩基、25,000塩基、25,500塩基、26,000塩基、26,500塩基、27,000塩基、27,500塩基、28,000塩基、28,500塩基、29,500塩基、30,000塩基、30,500塩基、31,000塩基、31,500塩基、32,000塩基、33,000塩基、34,000塩基、35,000塩基、36,000塩基、37,000塩基、38,000塩基、39,000塩基、40,000塩基、42,000塩基、45,000塩基、50,000塩基、55,000塩基、60,000塩基、65,000塩基、70,000塩基、75,000塩基、80,000塩基、85,000塩基、90,000塩基、95,000塩基、100,000塩基、110,000塩基、120,000塩基、130,000塩基、140,000塩基、150,000塩基、160,000塩基、170,000塩基、180,000塩基、200,000塩基、225,000塩基、250,000塩基、300,000塩基、350,000塩基、400,000塩基、450,000塩基、500,000塩基、550,000塩基、600,000塩基、650,000塩基、700,000塩基、750,000塩基、800,000塩基、850,000塩基、900,000塩基、1,000,000塩基、1,250,000塩基、1,500,000塩基、2,000,000塩基、2,500,000塩基、3,000,000塩基、4,000,000塩基、5,000,000塩基、6,000,000塩基、7,000,000塩基、8,000,000塩基、9,000,000塩基、10,000,000塩基、15,000,000塩基、20,000,000塩基、30,000,000塩基、40,000,000塩基、50,000,000塩基、75,000,000塩基、100,000,000塩基、又はそれ以上である。
いくつかの実施形態において、上述の複数の長さスケールのライブラリーを、1つの大きな長さスケールを有する代わりに、疑似遺伝子、パラログ等のアセンブリに用いることができる。いくつかの実施形態において、複数の長さスケールのライブラリーを、単一アッセイで同時に調製する。利点は、少なくとも1つの長さスケールが、疑似遺伝子又は遺伝子のみを有し、両方は有さない固有領域に結合することである。従って、この長さスケールで検出される変異は、遺伝子又は疑似遺伝子のどちらかに変異を一意的に決めることができる。同じことがコピー数の変異、パラログ等にも当てはまる。アセンブリの長所は、異なる長さスケールの使用である。本明細書に開示する方法を用いることにより、異なる長さスケールのインデックス付き結合ライブラリーを、異なる長さスケールのための個々の異なるライブラリー調製を行わずに、単一のアッセイで生成することができる。図46は、異なる長さスケールのライブラリーで遺伝子変異を決定する例示的なスキームを示す。
遺伝子変異の分析
本明細書に開示する組成物及び方法は、遺伝子変異の分析に関する。例示的な遺伝子変異としては、これに限定されないが、欠損、染色体間転位、重複、パラログ、染色体間遺伝子融合が挙げられる。いくつかの実施形態において、本明細書に開示する組成物及び方法は、遺伝子変異のフェージング情報の決定に関する。以下の表は、例示的な染色体間遺伝子融合を示す。
表2は、染色体1における例示的な欠損を示す。
いくつかの実施形態において、標的核酸は、標的核酸をトランスポソームに曝す前にフラグメント化することができる。例示的なフラグメント化法としては、これに限定されないが、超音波処理、機械的剪断、及び制限消化が挙げられる。タグメント化(フラグメント化及びタグ化)前の標的核酸のフラグメント化は、疑似遺伝子(例えば、CYP2D6)のアセンブリ/フェージングに有利である。インデックス付き結合リードの長い島(>30kb)は、図64に示すように、疑似遺伝子A及びA’に及ぶであろう。高い配列相同性のため、どの変異が遺伝子A及び遺伝子A’に属するのかを決定することが課題となるであろう。より短い変異は、固有の周囲配列で疑似遺伝子の1つの変異に結合するであろう。そのようなより短い島は、タグメント化前に標的核酸をフラグメント化することにより達成することができる。
結合トランスポソーム
いくつかの実施形態において、トランスポザーゼは、トランスポソーム複合体中で多量体であり、例えば、二量体、四量体等をトランスポソーム複合体中で形成する。本願の発明者らは、驚くべきことに、且つ予想外にも、多量体トランスポソーム複合体中の単量体トランスポザーゼを結合させること、又は多量体トランスポソーム複合体中のトランスポソーム単量体のトランスポゾン末端を結合させることには、いくつかの利点があることを見出した。1つ目としては、トランスポザーゼ又はトランスポゾンの結合は、より安定した複合体をもたらし、大きな画分が活性化状態にある。2つ目としては、より低い濃度のトランスポソームを、転位反応によるフラグメント化において用いることができる可能性がある。3つ目としては、結合により、トランスポソーム複合体のモザイク末端(ME)の交換が少なくなり、それにより、バーコード又はアダプター分子の混合が少なくなる。そのようなME末端の交換は、複合体がバラバラになり、再編成する場合、又は、トランスポソームがストレプトアビジン/ビオチンにより固体支持体上に固定化され、ストレプトアビジン/ビオチン相互作用が壊れて再編成する場合、又は、コンタミネーションの可能性がある場合に、生じる可能性がある。本願の発明者らは、種々の反応条件下で、ME末端の重大な交換(swap又はexchange)があることに気付いた。いくつかの実施形態において、交換は、15%にまで達する可能性がある。交換は、高塩濃度バッファーで顕著であり、グルタミン酸バッファーでは低下する。図57及び58は、ME交換のいくつかの考え得るメカニズムを示す。
いくつかの実施形態において、トランスポソーム複合体中のトランスポザーゼのサブユニットは、共有及び非共有手段により互いに結合させることができる。いくつかの実施形態において、トランスポザーゼ単量体は、トランスポソーム複合体を形成する前に(トランスポゾンが加わる前に)結合させることができる。いくつかの実施形態において、トランスポザーゼ単量体は、トランスポソームの形成後に結合させることができる。
いくつかの実施形態において、天然アミノ酸残基を多量体界面でシステイン(Cys)アミノ酸で置換し、ジスルフィド結合の形成を促進していてもよい。例えば、Tn5トランスポザーゼにおいて、Asp468、Tyr407、Asp461、Lys459、Ser458、Gly462、Ala466、Met470をCysで置換して、単量体サブユニット間のジスルフィド結合を促進していてもよい。図59及び60に示す。Mos−1トランスポザーゼに関して、システインで置換することができる例示的なアミノ酸としては、これに限定されないが、Leu21、Leu32、Ala35、His20、Phe17、Phe36、Ile16、Thr13、Arg12、Gln10、Glu9が挙げられる。図61に示す。いくつかの実施形態において、システインで置換されたアミノ酸残基を有する修飾トランスポザーゼは、マレイミド又はピリジルジチオール反応基を用いた化学架橋剤を用いて、互いに化学的に架橋させることができる。例示的な化学架橋剤は、Pierce Protein Biology/ThermoFisher Scientific社(米国ニューヨーク州グランドアイランド)から市販されている。
いくつかの実施形態において、トランスポソーム多量体複合体は、固体支持体に共有結合させることができる。例示的な固体支持体としては、これに限定されないが、ナノ粒子、ビーズ、フローセル表面、カラムマトリックスが挙げられる。いくつかの実施形態において、固体表面は、アミン基で被覆されていてもよい。システインで置換されたアミノ酸残基を有する修飾トランスポザーゼは、そのようなアミン基に対し、アミン−スルフヒドリル架橋剤(即ち、スクシンイミジル−4−(N−マレイミドメチル)シクロヘキサン−1−カルボキシレート(SMCC))を用いて、化学的に架橋させることができる。例示的なスキームを図62に示す。いくつかの実施形態において、マレイミド−PEG−ビオチン架橋剤を用いて、dTnpをストレプトアビジン被覆固体表面に結合させてもよい。
いくつかの実施形態において、トランスポザーゼ遺伝子は、単一のポリペプチドで多量体タンパク質を発現するように、修飾することができる。例えば、Tn5又はMos−1遺伝子は、単一のポリペプチドで、2つのTn5又はMos−1タンパク質を発現するように修飾することができる。同様に、Muトランスポザーゼ遺伝子は、単一のポリペプチドで、4つのmuトランスポザーゼユニットをコードするように修飾することができる。
いくつかの実施形態において、トランスポソーム単量体単位のトランスポゾン末端を結合させて、結合トランスポソーム多量体複合体を形成することができる。トランスポゾン末端を結合させることにより、プライマー部位を挿入することができ、シークエンシングプライマー、増幅プライマー、又は任意のロール(role)DNAが、標的DNAをフラグメント化することなくgDNAに働くことができる。そのような機能性の挿入は、情報を無傷分子から抽出する必要があるか又はサブサンプリングが重要である、ハプロタイプアッセイ又は結合部タグ化アッセイにおいて、利点である。いくつかの実施形態において、Muトランスポソームのトランスポゾン末端は、「ループ状の」Muトランスポザーゼ/トランスポゾン構造に結合させることができる。Muは四量体であるため、これに制限されないが、R2UJ及び/又はR1UJをR2J及び/又はR1Jに結合させることにより、種々の構造が可能である。これらの構造において、R2UJ及びR1UJは、R2J及びR1Jと、それぞれ結合することができる又は結合しない。図63は、トランスポゾン末端が結合したMuトランスポソーム複合体を示す。いくつかの実施形態において、Tn5のトランスポゾン末端又はMos−1トランスポソームのトランスポゾン末端を、結合させることができる。
本明細書で用いる場合、用語「トランスポゾン」は、in vitro転位反応において機能するトランスポザーゼ又はインテグラーゼ酵素と複合体を形成するのに必要なヌクレオチド配列(「トランスポゾン末端配列」)のみを示す、二本鎖DNAを意味する。トランスポゾンは、トランスポゾンを認識し、且つ結合するトランスポザーゼ又はインテグラーゼとともに、「複合体」又は「シナプス複合体」又は「トランスポソーム複合体」又は「トランスポソーム組成物」を形成する。複合体は、in vitro転位反応において一緒にインキュベートする標的DNAに、トランスポゾンを挿入又は転位することが可能である。トランスポゾンは、「転移トランスポゾン配列」すなわち「転移鎖」、及び「非転移トランスポゾン配列」すなわち「非転移鎖」からなる2つの相補的配列を示す。例えば、in vitro転位反応において活性がある機能亢進性Tn5トランスポザーゼ(例えば、EZ−Tn5(商標)トランスポザーゼ、米国ウィスコンシン州マディソン、EPICENTRE Biotechnologies社)とともに複合体を形成する1つのトランスポゾンは、以下の「転移トランスポゾン配列」を示す転移鎖:
5’AGATGTGTATAAGAGACAG3’
及び以下の「非転移トランスポゾン配列」を示す非転移鎖:
5’CTGTCT CTTATACACATCT3’
を含む。
転移鎖の3’末端は、in vitro転位反応において、標的DNAに結合又は転移する。非転移鎖は、転移トランスポゾン末端配列に相補的なトランスポゾン配列を示し、in vitro転位反応において、標的DNAに結合又は転移しない。いくつかの実施形態において、トランスポゾン配列は、以下の配列うちの1つ又はそれ以上を含んでいてもよい:バーコード、アダプター配列、タグ配列、プライマー結合配列、捕捉配列、固有分子識別(UMI:unique molecular identifier)配列。
本明細書で用いる場合、用語「アダプター」は、バーコード、プライマー結合配列、捕捉配列、捕捉配列に相補的な配列、固有分子識別(UMI)配列、親和性部分、制限部位を含むことができる核酸配列を意味する。
本明細書で用いる場合、用語「連続性情報」は、共有情報に基づいた、2つ又はそれ以上のDNAフラグメント間の空間的関係を指す。情報の共有態様は、隣接関係、区画関係、及び距離空間関係に関するものとすることができる。これらの関係に関する情報は、順に、DNAフラグメントに由来する配列リードの階層的なアセンブリ又はマッピングを容易にする。この連続性情報は、そのようなアセンブリ又はマッピングの効率及び精度を改善する。なぜなら、従来のショットガンシークエンシングと関連して用いられる伝統的なアセンブリ又はマッピング法では、個々の配列リードが由来した2つ又はそれ以上のDNAフラグメントの空間的関係に関して、個々の配列リードの相対的なゲノム起源又は座標を考慮に入れないからである。従って、本明細書に記載する実施形態によれば、連続性情報を捕捉する方法を、隣接空間関係を決定する短距離連続性法、区画空間関係を決定する中距離連続性法、又は距離空間関係を決定する長距離連続性法により行ってもよい。これらの方法は、DNA配列アセンブリ又はマッピングの精度及び質を高める。また、これらの方法は、上述のシークエンシング法等の任意のシークエンシング法とともに用いてもよい。
連続性情報は、個々の配列リードが由来した2つ又はそれ以上のDNAフラグメントの空間的関係に関して、個々の配列リードの相対的なゲノム起源又は座標を含む。いくつかの実施形態において、連続性情報は、非重複配列リードからの配列情報を含む。
いくつかの実施形態において、標的核酸配列の連続性情報は、ハプロタイプ情報を示す。いくつかの実施形態において、標的核酸配列の連続性情報は、ゲノム変異を示す。
本明細書で用いる場合、用語「標的核酸の連続性の維持」は、核酸のフラグメント化との関連において、同じ標的核酸からのフラグメントの核酸配列の順番を維持することを意味する。
本明細書で用いる場合、用語「少なくとも一部」及び/又はその文法的等価物は、全量のうちの任意の分量を指すことができる。例えば、「少なくとも一部」は、全量の少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%、99.9%、又は100%を指すことができる。
本明細書で用いる場合、用語「約」は、±10%を意味する。
本明細書で用いる場合、用語「シークエンシングリード」及び/又はその文法的等価物は、ポリマー中の単量体の順序を示すシグナルを得るために行われる物理的又は化学的ステップの繰り返し工程を指すことができる。シグナルは、単一の単量体解像度又はより低い解像度で単量体の順序を示すことができる。特定の実施形態において、ステップを、核酸標的に対して開始し、核酸標的中の塩基の順序を示すシグナルを得るために行うことができる。工程は、典型的な完了まで行うことができ、典型的な完了とは、通常、工程からのシグナルが、合理的なレベルの確実性で、標的の塩基をそれ以上区別することができない時点までと定義される。所望する場合、例えば、所望の配列情報量が得られるまで等、より早く完了することができる。シークエンシングリードは、単一の標的核酸分子に対して、又は同じ配列を有する標的核酸分子群に対して同時に、又は異なる配列を有する標的核酸群に対して同時に行うことができる。いくつかの実施形態において、シークエンシングリードは、シグナルが、シグナル取得が開始された1つ又はそれ以上の標的核酸分子からそれ以上は得られない時点で、終了する。例えば、シークエンシングリードは、固相基質上に存在する1つ又はそれ以上の標的核酸分子に対して開始し、1つ又はそれ以上の標的核酸分子を基質から除去した時点で終了させることができる。或いは、シークエンシングは、シークエンシングランを開始した時に基質上に存在していた標的核酸の検出を中止することにより、終了することができる。例示的なシークエンシング方法は、その全体が参照により本明細書に組み込まれる、米国特許第9,029,103号明細書に記載されている。
本明細書で用いる場合、用語「シークエンシング表示」及び/又はその文法的等価物は、ポリマー中の単量体単位の順序及び種類を示す情報を指すことができる。例えば、情報は、核酸中のヌクレオチドの順序及び種類を示すことができる。情報は、例えば、描写、画像、電子メディア、一連の記号、一連の数字、一連の文字、一連の色等を含む、任意の種々の形式であってよい。情報は、単一の単量体解像度又はより低い解像度であってもよい。例示的なポリマーは、ヌクレオチド単位を有するDNA又はRNA等の核酸である。一連の「A」、「T」、「G」、及び「C」文字は、単一のヌクレオチド解像度でDNA分子の実際の配列と相関性があるDNAに対する周知の配列表示である。その他の例示的なポリマーは、アミノ酸単位を有するタンパク質、及び糖単位を有する多糖類である。
固体支持体
本明細書全体を通じて、固体支持体及び固体表面は、交換可能に用いられる。いくつかの実施形態において、固体支持体又はその表面は、管又は容器の内表面又は外表面等、非平面である。いくつかの実施形態において、固体支持体は、ミクロスフェア又はビーズを含む。本明細書において、「ミクロスフェア」又は「ビーズ」又は「粒子」又はその文法的等価物は、小さな分散粒子を意味する。適切なビーズ組成物としては、これに限定されないが、プラスチック、セラミック、ガラス、ポリスチレン、メチルスチレン、アクリルポリマー、常磁性物質、トリアゾル(thoria sol)、カーボングラファイト、二酸化チタン、ラテックス、又は、セファロース等の架橋デキストラン、セルロース、ナイロン、架橋ミセル、及びテフロンが挙げられ、同様に、固形支持体として本明細書で概説する任意の他の材料を全て使用することができる。Bangs Laboratories社(インディアナ州フィッシャーズ)の「ミクロスフェア検出ガイド(Microsphere Detection Guide)」は、役立つガイドである。特定の実施態様において、ミクロスフェアは、磁性ミクロスフェア又はビーズである。いくつかの実施形態において、ビーズは、色分けされていてもよい。例えば、Luminex社(テキサス州オースティン)のMicroPlex(登録商標)ミクロスフェアを用いてもよい。
ビーズは球状である必要はなく、不規則粒子を用いてもよい。代わりに又は加えて、ビーズは多孔質であってもよい。ビーズのサイズは、直径で、ナノメートル即ち約10nmから、ミリメートル即ち1mmに及び、約0.2ミクロン〜約200ミクロンのビーズが好ましく、約0.5〜約5ミクロンのビーズが特に好ましいが、いくつかの実施態様において、より小さい又はより大きいビーズを用いてもよい。いくつかの実施態様において、ビーズは、直径が約0.1μm、0.2μm、0.3μm、0.4μm、0.5μm、0.6μm、0.7μm、0.8μm、0.9μm、1μm、1.5μm、2μm、2.5μm、2.8μm、3μm、3.5μm、4μm、4.5μm、5μm、5.5μm、6μm、6.5μm、7μm、7.5μm、8μm、8.5μm、9μm、9.5μm、10μm、10.5μm、15μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、95μm、100μm、150μm、又は200μmであってもよい。
トランスポソーム
「トランスポソーム」は、インテグラーゼ又はトランスポザーゼ等の組み込み(インテグレーション)酵素、及びトランスポザーゼ認識部位等の組み込み認識部位を含む核酸を含む。本明細書で提供する実施形態において、トランスポザーゼは、転位反応を触媒することが可能なトランスポザーゼ認識部位とともに機能的複合体を形成することができる。トランスポザーゼは、「タグメント化」と称することもある工程において、トランスポザーゼ認識部位に結合し、トランスポザーゼ認識部位を標的核酸に挿入する可能性がある。いくつかのそのような組み込み事象において、トランスポザーゼ認識部位の1つの鎖が、標的核酸に転移してもよい。1つの例において、トランスポソームは、2つのサブユニットを含む二量体トランスポザーゼ、及び2つの非連続トランスポゾン配列を含む。別の例において、トランスポソームは、2つのサブユニットを含む二量体トランスポザーゼを含むトランスポザーゼ、及び連続トランスポゾン配列を含む。
いくつかの実施形態は、機能亢進性Tn5トランスポザーゼ及びTn5型トランスポザーゼ認識部位(Goryshin and Reznikoff,J.Biol.Chem.,273:7367(1998))、又は、MuAトランスポザーゼ、及びR1及びR2末端配列を含むMuトランスポザーゼ認識部位(Mizuuchi,K.,Cell,35:785,1983;Savilahti,H,etal.,EMBOJ.,14:4893,1995)の使用を含めることができる。機能亢進性Tn5トランスポザーゼと複合体を形成する例示的なトランスポザーゼ認識部位(例えば、EZ−Tn5(商標)トランスポザーゼ、ウィスコンシン州マディソン、Epicentre Biotechnologies社)は、以下の19塩基の転移鎖(時に、「M」又は「ME」)及び非転移鎖:それぞれ、5′AGATGTGTATAAGAGACAG3′、5′CTGTCTCTTATACACATCT3′を含む。ME配列はまた、当業者により最適化されて、使用されてもよい。
本明細書で提供する組成物及び方法の特定の実施形態とともに使用することができる転位システムの更なる例としては、黄色ブドウ球菌(Staphylococcus aureus)Tn552(Colegio et al.,J.Bacteriol.,183:2384−8,2001;Kirby C et al.,Mol.Microbiol.,43:173−86,2002)、Ty1(Devine&Boeke,Nucleic Acids Res.,22:3765−72,1994、及び国際公開第95/23875号)、トランスポゾンTn7(Craig,N L,Science.271:1512,1996;Craig,N L,Review in:Curr Top Microbiol Immunol.,204:27−48,1996)、Tn/O及びIS10(Kleckner N,et al.,Curr Top Microbiol Immunol.,204:49−82,1996)、マリナートランスポザーゼ(Lampe D J,et al.,EMBO J.,15:5470−9,1996)、Tc1(Plasterk R H,Curr.Topics Microbiol.Immunol.,204:125−43,1996)、Pエレメント(Gloor,G B,Methods Mol.Biol.,260:97−114,2004)、Tn3(Ichikawa & Ohtsubo,J Biol.Chem.265:18829−32,1990)、細菌挿入配列(Ohtsubo&Sekine,Curr.Top.Microbiol.Immunol.204:1−26,1996)、レトロウイルス(Brown,et al.,Proc Natl Acad Sci USA,86:2525−9,1989)、及び酵母のレトロトランスポゾン(Boeke&Corces,Annu Rev Microbiol.43:403−34,1989)が挙げられる。更なる例としては、IS5、Tn10、Tn903、IS911、カタバミ(Sleeping Beauty)、SPINhAT、ピギーバック(PiggyBac)、ハーミス(Hermes)、Tcバスター(TcBuster)、Aeバスター1(AeBuster1)、Tol2、及び改変型トランスポザーゼファミリー酵素(Zhang et al.,(2009)PLoS Genet.5:e1000689.Epub 2009 Oct 16;Wilson C.et al(2007)J.Microbiol.Methods 71:332−5)が挙げられる。
本明細書で提供する方法及び組成物とともに使用することができるインテグラーゼの更なる例としては、レトロウイルスインテグラーゼ、及びレトロウイルスインテグラーゼに対するインテグラーゼ認識配列が挙げられ、例えば、HIV−1、HIV−2、SIV、PFV−1、RSVのインテグラーゼが挙げられる。
バーコード
一般に、バーコードは、1つ又はそれ以上の特定の核酸を同定するために使用することができる1つ又はそれ以上のヌクレオチド配列を含むことができる。バーコードは、人工配列であってもよく、或いは、転位の際に生成する自然発生配列、例えば、以前に並置されたDNAフラグメントの末端にある同一のフランキングゲノムDNA配列(gコード)等であってもよい。いくつかの実施形態において、バーコードは、標的核酸配列にはない人工配列であり、1つ又はそれ以上の標的核酸配列を同定するのに用いることができる。
バーコードは、少なくとも約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、又はそれ以上の連続したヌクレオチドを含んでいてもよい。いくつかの実施形態において、バーコードは、少なくとも約10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、又はそれ以上の連続したヌクレオチドを含む。いくつかの実施形態において、バーコードを含む核酸群におけるバーコードの少なくとも一部は、異なっている。いくつかの実施形態において、バーコードの少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%が、異なっている。更なるそのような実施形態において、バーコードの全てが異なっている。バーコードを含む核酸群において、異なるバーコードの多様性は、ランダムに又は非ランダムに生成することができる。
いくつかの実施形態において、トランスポゾン配列は、少なくとも1つのバーコードを含む。2つの非連続トランスポゾン配列を含むトランスポソーム等、いくつかの実施形態において、第1のトランスポゾン配列は、第1のバーコードを含み、第2のトランスポゾン配列は、第2のバーコードを含む。いくつかの実施形態において、トランスポゾン配列は、第1のバーコード配列及び第2のバーコード配列を含むバーコードを含む。前述の実施形態のいくつかにおいて、第1のバーコード配列は、第2のバーコード配列とペアになるように同定又は設計することができる。例えば、互いにペアとなることが知られている複数の第1及び第2のバーコード配列を含む参照表を用いて、既知の第1のバーコード配列が既知の第2のバーコード配列とペアになることを知ることができる。
別の例において、第1のバーコード配列は、第2のバーコード配列と同じ配列を含んでいてもよい。別の例において、第1のバーコード配列は、第2のバーコード配列の逆相補配列を含んでいてもよい。いくつかの実施形態において、第1のバーコード配列及び第2のバーコード配列は、異なる。第1及び第2のバーコード配列は、バイコード(bi−code)を含んでいてもよい。
本明細書に記載する組成物及び方法のいくつかの実施形態において、バーコードは、鋳型核酸の調製に用いる。当然のことながら、膨大な数の利用可能なバーコードにより、各鋳型核酸分子は、固有の識別を含むことができる。鋳型核酸の混合物における各分子の固有の識別は、いくつかの用途に用いることができる。例えば、固有に識別された分子は、例えば、ハプロタイプシークエンシング、親対立遺伝子の識別、メタゲノムシークエンシング、及びゲノムのサンプルシークエンシングにおいて、複数の染色体を有するサンプル、ゲノム、細胞、細胞型、細胞の病状、及び種における、個々の核酸分子の同定に応用することができる。
例示的なバーコード配列としては、これに限定されないが、TATAGCCT、ATAGAGGC、CCTATCCT、GGCTCTGA、AGGCGAAG、TAATCTTA、CAGGACGT、及びGTACTGACが挙げられる。
プライマー部位
いくつかの実施形態において、トランスポゾン配列は、「シークエンシングアダプター」又は「シークエンシングアダプター部位」、言い換えれば、プライマーにハイブリダイズすることができる1つ又はそれ以上の部位を含む領域を含むことができる。いくつかの実施形態において、トランスポゾン配列は、増幅及びシークエンシング等に有用な少なくとも第1のプライマー部位を含むことができる。配列結合部位の例示的な配列としては、これに限定されないが、AATGATACGGCGACCACCGAGATCTACAC(P5配列)及びCAAGCAGAAGACGGCATACGAGAT(P7配列)が挙げられる。
標的核酸
標的核酸としては、任意の目的の核酸を挙げることができる。標的核酸としては、DNA、RNA、ペプチド核酸、モルフォリノ核酸、ロックド核酸、グリコール核酸、トレオース核酸、核酸の混合サンプル、倍数性DNA(即ち、植物DNA)、これらの混合物、及びこれらのハイブリッドを挙げることができる。好ましい実施形態において、ゲノムDNA又はその増幅コピーを、標的核酸として用いる。別の好ましい実施形態において、cDNA、ミトコンドリアDNA、又は葉緑体DNAを用いる。いくつかの実施形態において、標的核酸は、mRNAである。
いくつかの実施形態において、標的核酸は、単一の細胞由来、又は単一の細胞の画分由来である。いくつかの実施形態において、標的核酸は、単一の細胞小器官由来である。例示的な単一の細胞小器官としては、これに限定されないが、単一の核、単一のミトコンドリア、及び単一のリボソームが挙げられる。いくつかの実施形態において、標的核酸は、ホルマリン固定パラフィン包埋(FFPE)サンプルに由来する。いくつかの実施形態において、標的核酸は、架橋核酸である。いくつかの実施形態において、標的核酸は、タンパク質と架橋する。いくつかの実施形態において、標的核酸は、架橋DNAである。いくつかの実施形態において、標的核酸は、ヒストンに保護されたDNAである。いくつかの実施形態において、ヒストンは、標的核酸から除去される。いくつかの実施形態において、標的核酸は、ヌクレオソーム由来である。いくつかの実施形態において、標的核酸は、核タンパク質が除去されたヌクレオソーム由来である。
標的核酸は、任意のヌクレオチド配列を含むことができる。いくつかの実施形態において、標的核酸は、ホモポリマー配列を含む。標的核酸はまた、繰り返し配列を含むことができる。繰り返し配列は、例えば、2ヌクレオチド、5ヌクレオチド、10ヌクレオチド、20ヌクレオチド、30ヌクレオチド、40ヌクレオチド、50ヌクレオチド、100ヌクレオチド、250ヌクレオチド、500ヌクレオチド、1000ヌクレオチド、又はそれ以上を含めた任意の種々の長さとすることができる。繰り返し配列は、連続又は非連続して、例えば、2回、3回、4回、5回、6回、7回、8回、9回、10回、15回、20回、又はそれ以上を含めた、任意の種々の回数の繰り返しとすることができる。
本明細書に記載するいくつかの実施形態は、単一の標的核酸を使用することができる。他の実施形態は、複数の標的核酸を使用することができる。そのような実施形態において、複数の標的核酸としては、複数の同じ標的核酸、いくつかの標的核酸は同じである複数の異なる標的核酸、又は全ての標的核酸が異なる複数の標的核酸を挙げることができる。複数の標的核酸を使用する実施形態は、例えば、1つ又はそれ以上のチャンバー又はアレイ表面で試薬が標的核酸に同時に送られるように、多重型式で行うことができる。いくつかの実施形態において、複数の標的核酸としては、実質的に全ての特定の生命体のゲノムを挙げることができる。複数の標的核酸としては、例えば、ゲノムの少なくとも約1%、5%、10%、25%、50%、75%、80%、85%、90%、95%,又は99%を含めた、特定の生命体のゲノムの少なくとも一部を挙げることができる。特定の実施形態において、当該一部は、ゲノムの最大で約1%、5%、10%、25%、50%、75%、80%、85%、90%、95%,又は99%である上限を有することができる。
標的核酸は、あらゆる供給源から得ることができる。例えば、標的核酸は、単一の生命体から得られる核酸分子、又は1つ又はそれ以上の生命体を含む自然源から得られる核酸分子群から調製してもよい。核酸分子の供給源としては、これに限定されないが、細胞小器官、細胞、組織、臓器、又は生命体が挙げられる。標的核酸分子の供給源として用いられてもよい細胞は、原核細胞(バクテリア細胞、例えば、大腸菌(Escherichia)、バチルス(Bacillus)、セラチア(Serratia)、サルモネア(Salmonella)、ブドウ球菌(Staphylococcus)、連鎖球菌(Streptococcus)、クロストリジウム(Clostridium)、クラミジア(Chlamydia)、ナイセリア(Neisseria)、トレポネーマ(Treponema)、マイコプラズマ(Mycoplasma)、ボレリア(Borrelia)、レジオネラ(Legionella)、シュードモナス(Pseudomonas)、マイコバクテリウム(Mycobacterium)、ヘリコバクター(Helicobacter)、エルウィニア(Erwinia)、アグロバクテリウム(Agrobacterium)、根粒菌(Rhizobium)、及びStreptomyces genera);クレン古細菌門(crenarchaeota)、ナノ古細菌門(nanoarchaeota)、又はユリ古細菌門(euryarchaeotia)等の古細菌細胞;又は真菌(例えば、酵母)、植物、原生動物や他の寄生生物、及び動物(昆虫(例えば、ショウジョウバエ(Drosophila spp.)、線形動物(例えば、線虫(Caenorhabditis elegans)、及び哺乳動物(例えば、ラット、マウス、サル、非ヒト霊長類、及びヒト)を含む)等の真核細胞であってもよい。標的核酸及び鋳型核酸は、当該技術分野でよく知られている種々の方法を用いて、目的とする特定の配列を濃縮することができる。そのような方法の例は、その全体が参照により本明細書に組み込まれる国際公開第2012/108864号において提供されている。いくつかの実施形態において、核酸は、鋳型ライブラリーの調製方法の間に、さらに濃縮させてもよい。例えば、核酸は、トランスポソームの挿入前、トランスポソームの挿入後、及び/又は核酸の増幅後に、特定の配列について濃縮させてもよい。
また、いくつかの実施形態において、標的核酸及び/又は鋳型核酸は、高度に精製することができ、例えば、核酸は、本明細書で提供する方法で用いる前に、混入物を少なくとも約70%、80%、90%、95%、96%、97%、98%、99%、又は100%含まないものとすることができる。いくつかの実施形態において、当該技術分野で知られている標的核酸の質及びサイズを維持する方法を用いることは有益であり、例えば、標的DNAの単離及び/又は直接転位を、アガロースプラグを用いて行ってもよい。転位はまた、細胞群、ライセート、及び未精製DNAを用いて、細胞で直接行うことができる。
いくつかの実施形態において、標的核酸は、生体サンプル又は患者サンプルから得てもよい。本明細書で用いる場合、用語「生体サンプル」又は「患者サンプル」は、組織及び体液等のサンプルを含む。「体液」としては、これに限定されないが、血液、血清、血漿、唾液、脳脊髄液、胸膜液、涙液、乳管液(lactal duct fluid)、リンパ液、喀痰、尿、羊水、及び精液が挙げられる。サンプルは、「無細胞」である体液を含んでいてもよい。「無細胞体液」は、約1%(質量/質量)未満の全細胞物質を含む。血漿又は血清は、無細胞体液の例である。サンプルは、天然又は合成由来(即ち、無細胞となるように調製された細胞サンプル)の標本を含んでいてもよい。
上記に開示した方法のいくつかの実施形態において、標的核酸は、標的核酸をトランスポソームに曝す前に、(例えば、超音波処理、制限消化、他の機械的手段により)フラグメント化することができる。
本明細書で用いる場合、用語「血漿」は、血液で見られる無細胞液体を指す。「血漿」は、当技術分野で知られている方法(例えば、遠心分離及びろ過等)により、血液から全細胞物質を除去することにより、血液から得てもよい。
特段の定めがない限り、用語「a」又は「an」は、本明細書全体を通じて、「1つ又はそれ以上」を意味する。
用語「例えば(for example)」、「例えば(e.g.)」、「等(such as)」、「含む(include)」、「含めて(including)」、又はそれらの変形が本明細書で用いられる場合、これらの用語は、限定の用語であるとは見なされないものであり、「これに限定されるものではないが」又は「限定されずに」を意味すると解釈されるものである。
以下の実施例は、説明のための実施例を提供するものであり、決して本明細書で提供する発明を制限するものではない。
実施例1 ビーズベースタグメント化工程からのDNAクラスターの収量
図3のビーズベースタグメント化工程からのDNAクラスターの収量を評価し、図4の表に示した。本実施例において、50ng、250ng、1000ngのヒトNA12878 DNAを、同じバッチのタグメント化ビーズ(2.8μmビーズ)を用いてタグメント化した。第2の50ng分量のNA12878 DNAを、第2のバッチのタグメント化ビーズ(完全リピート:2.8μmビーズ)を用いてタグメント化した。ビーズ結合タグメント化DNAサンプルをPCR増幅し、精製した。一定分量(5.4μL)の各精製PCR産物(未定量)を270倍希釈し、約50pMのストックサンプル溶液を作製した。各サンプルに対し、50pMストック溶液を15pM、19pM、21pM、及び24pMに希釈した。希釈したサンプルを、クラスター生成及びシークエンシングのためにフローセルにロードした。データによれば、同じ希釈液(〜50pM)から始めて、クラスター数は、同じセットのビーズを用いた3つの異なるインプットレベル(即ち、50ng、250ng、1000ng)に対して、100〜114%の間であることが分かる。50ng完全リピートでのクラスター数(異なるバッチのビーズを用いた)は、81%であった。異なる希釈液(15pM、19pM、21pM、及び24pM)は、約10%以内の同数のクラスターを産生する。データによれば、ビーズが収量を大きく制御し、収量は、異なるDNAインプット及び異なるリピートで再現性があることが分かる。
実施例2 ビーズベースタグメント化工程の再現性
図3のビーズベースタグメント化工程の再現性を図5に示す。本実施例において、「同じ」トランスポソーム密度で作製した6種類の異なるインデックス付きビーズ(インデックス1〜6;2.8μmビーズ)調製物を、50ng及び500ngのインプットNA12878 DNAを用いたタグメント化DNAの調製に用いた。タグメント化DNAをPCR増幅し、精製した。2つのHiSeqレーン用に、12種類の精製PCR産物をプールして、6種類ずつの2つの混合物(プール1及びプール2)にした。各プールは、1レーン当たり3〜50ng及び3〜500ngのサンプルを含む。データ表500は、各インデックス付きサンプルの挿入サイズ中央値及び挿入サイズ平均値を示す。
実施例3 プール1の挿入サイズ及びプール2の挿入サイズ
図5のインデックス付きサンプルのプール1の挿入サイズ及びプール2の挿入サイズを、それぞれ図6A(プロット600)及び図6B(プロット650)に示す。データはまた、挿入サイズが、6種類の異なるインデックス付きビーズ調製物の間で均一であることを示す。ビーズベースタグメント化は、挿入サイズ及びDNA収量を制御するメカニズムをもたらす。
実施例4 リードの合計数の再現性
図5に記載の実験に関して、リードの合計数及びアラインされたリードの割合の再現性を図7(棒グラフ700)に示す。両方のインプット(50ng及び500ng)で、リードの合計数は、同じインデックス付きビーズ調製物に対して同様である。6種類のインデックス付きビーズ調製物のうちの4種類(インデックス1、2、3、及び6)で、極めて近い収量を示し、インデックス付きビーズ調製物4及び5では、インデックス配列によるものである可能性がある、幾分のばらつきが見られた。
1つの応用において、ビーズベースタグメント化工程は、タグメント化ステップを含むエクソーム濃縮アッセイ、例えば、Illumina社のNextera(登録商標)急速捕捉濃縮プロトコルに用いてもよい。現在のエクソーム濃縮アッセイ(即ち、Illumina社のNextera(登録商標)急速捕捉濃縮プロトコル)では、溶液ベースのタグメント化(Nextera)をゲノムDNAのフラグメント化に用いる。その後、遺伝子特異的プライマーを用いて、目的とする特異的遺伝子フラグメントをプルダウンする。2回の濃縮サイクルを行った後、プルダウンしたフラグメントをPCR及びシークエンシングにより濃縮する。
エクソーム濃縮アッセイにおけるビーズベースタグメント化工程の使用を評価するため、ヒトNA12878 DNAを、25ng、50ng、100ng、150ng、200ng、及び500ngのインプットDNAを用いてタグメント化した。コントロールライブラリー(NA00536)を、標準プロトコルに従って、50ngのインプットDNAから調製した。各DNAインプットは、異なるインデックス(固有識別子)を有した。標準方法に合わせるため、且つ、十分な量のフラグメントがプルダウン用に存在することを確実にするために、濃縮ポリメラーゼマスターミックス(EPM:enhanced polymerase mastermix)を用いた10サイクルのPCRを行った。増幅プロトコルは、72℃で3分、98℃で30秒、続いて98℃で10秒を10サイクル、65℃で30秒、及び72℃で1分とした。その後、サンプルを10℃で保持した。次に、サンプルを、エクソーム濃縮プルダウン工程及びシークエンシングを通じて処理した。
実施例5 エクソーム濃縮アッセイにおけるコントロールライブラリー及びビーズベースタグメント化ライブラリーの挿入サイズ
図8A、8B、及び8Cは、それぞれ、エクソーム濃縮アッセイにおける、コントロールライブラリーでの挿入サイズのプロット800、ビーズベースタグメント化ライブラリーでの挿入サイズのプロット820、及びサマリーデータ表840を示す。データによれば、ビーズベースタグメント化ライブラリーは、コントロールライブラリーに比べて、広い挿入サイズ分布を有するが、挿入サイズは、サンプルのDNAインプットに関係なく極めて近いことが分かる。
実施例6 リード配列の質
図9A、9B、及び9Cは、それぞれ、図8A、8B、及び8Cのエクソーム濃縮アッセイにおける、フィルターを通過した複製物(dups PF:duplicates passing filters)の割合の棒グラフ900、PCT selected basesの棒グラフ920、及びPCT usable bases on targetの棒グラフ940を示す。図9Aを参照すると、dups PFの割合(%)は、いくつのリードがフローセルの他の部分で複製されているかを示す尺度である。この数値は、全てのクラスターが結果に対して有益なデータをもたらすことを確実にするためには、理想的には、(ここで示すように)低くなるものである。
図9Bは、PCT selected basesを示し、濃縮工程の間に濃縮されていたはずの目的の部位に又はその近くに配列するリードの割合の尺度である。理想的には、この数値は、濃縮工程の成功を反映して1に近くなるものである。また、この数値は、濃縮されるべきではないリードが工程を終えていないことを示す。
図9Cは、PCT usable bases on targetを示し、濃縮された領域内で目的とする特定の塩基上に実際に配列しているリードの割合の尺度である。理想的には、全ての濃縮リードが濃縮されたリード内の目的とする塩基上に配列するものであるが、タグメント化のランダム性及び様々な挿入長さのために、目的とする領域上で配列し終えていないリードが濃縮される可能性がある。
2つの技術を使用して挿入サイズ分布を最適化してもよい。一例を挙げれば、SPRIクリーンアップを用いて小さ過ぎる又は大き過ぎるフラグメントを除去してもよい。SPRIクリーンアップは、サイズ及び所望の沈澱又は非沈澱DNAの保持(即ち、第1ステップは、所望のサイズよりも大きいDNAのみを沈澱させ、可溶な小さいフラグメントを保持する)に基づいた選択的DNA沈澱により、所望のサイズよりも大きい又は小さいフラグメントを除去する工程である。その後、小さいフラグメントをさらに沈澱させ、この時、望まない極めて小さいフラグメント(まだ溶液中にある)を除去し、沈澱したDNAを保持し、洗浄した後、再可溶化して所望のサイズ範囲のDNAを得る。別の例を挙げれば、ビーズ表面上の活性化トランスポソームのスペーシングを用いて、挿入サイズ分布を制御してもよい。例えば、ビーズ表面上のギャップを不活性トランスポソーム(例えば、不活性トランスポゾンを有するトランスポソーム)で充填してもよい。
ビーズベースのタグメント化工程の連続性を評価した。表3は、インデックスを共有する1000bpウィンドウ内で0回、1回、2回、又は3回のリードが起きた回数を示す。ビーズを9種類の異なるインデックス付きトランスポソームで生成し、少量のヒトDNAのタグメント化に用いた。リードを生成させ、アラインし、同じインデックスを共有する1000bp又は10Kbウィンドウ内のリードの数について分析した。インデックスを共有する小さいウィンドウ内のリードの中には、偶然生成するものがあってもよく、これが何回起こる可能性があるかという予測を、表3及び表4の「ランダム」列に示す。「ビーズ」列の数は、インデックスを共有する1000bp(表3)又は10Kp(表4)ウィンドウの実際の数を示す。表3及び表4に示すように、同じインデックスが1000bp又は10Kpウィンドウ内で見つかった実際の回数は、ランダムケースでの予測よりも顕著に多い。「0」枠は、特定の1000bpウィンドウがそれにマッピングするインデックスリードを有さない全ての回数を示す。数値は、極少量のヒトゲノムのみがシークエンシングされ、大半のウィンドウがそれらにアラインされるリードを有さないため、ここでは最も大きい。「1」は、ただ1つのリードが1000bp(又は10Kp)ウィンドウにマップする回数であり、「2」は、1000bp(又は10Kp)ウィンドウ内で2つのリードがインデックスを共有する回数である、等である。このデータは、1400超のケースにおいて、同じピースのDNA(10Kp超)が、約15000回のタグメント化事象の中で、同じビーズにより、少なくとも2回から5回までタグメント化されていることを示唆している。フラグメントは、インデックスを共有しているため、それらが偶然にそこに存在する可能性は低く、同じビーズに由来している。
表4は、インデックスを共有する10Kpウィンドウ内のリード数(5個まで)を示す。
実施例7 CPT−DNAからの遊離トランスポソームの分離
転位の後、CPT−DNA及び遊離トランスポソームを含む反応混合物を、Sephacryl S−400及びSephacryl S−200サイズ排除クロマトグラフィーを用いたカラムクロマトグラフィーにかけた。図22に示す。CPT−DNAは、NCP DNAと表示する。
実施例8 ビーズ上の捕捉プローブ密度の最適化
捕捉プローブA7及びB7の密度を、1μmビーズ上で最適化し、結果を図25に示した。レーン1(A7)及びレーン3(B7)は、高いプローブ密度を有し、レーン2(A7)及びレーン4(B7)は、1umビーズ当たり推定10,000〜100,000のプローブ密度を有した。標的分子に対する捕捉プローブのライゲーション産物を、アガロースゲルで評価した。ビーズ当たり約10,000〜100,000のプローブ密度は、より高いプローブ密度よりも良好なライゲーション効率を有した。
実施例9 分子内ハイブリダイゼーションによるビーズ上でのCPT−DNAのインデックス付きシークエンシングライブラリーの調製の実現性試験
トランスポソームを、ビーズ上のA7及びB7捕捉配列に相補的なA7’及びB7’捕捉配列を有するトランスポゾンと機能亢進性Tn5トランスポザーゼとを混合することにより、調製した。高分子量ゲノムDNAをトランスポソームと混合し、CPT−DNAを生成する。それとは別に、ビーズを、固定化オリゴヌクレオチド:P5−A7、P7−B7、又はP5−A7+P7−B7で調製する。ここで、P5及びP7は、プライマー結合配列であり、A7及びB7は、それぞれA7’及びB7’配列に相補的な捕捉配列である。P5−A7単独、P7−B7単独、P5−A7+P7−B7、又はP5−A7ビーズ及びP7−B7ビーズの混合物を含むビーズを、CPT−DNAで処理し、反応混合物にリガーゼを添加して、固定化オリゴの転位DNAに対するハイブリダイゼーションの効率を決定した。結果を図26に示す。シークエンシングライブラリーは、アガロースゲル上で高分子量バンドにより示されるように、P5−A7及びP7−B7がともに1つのビーズ上に固定化されている場合(レーン4)のみで作製される。結果は、高効率の分子内ハイブリダイゼーションを示し、また、分子内ハイブリダイゼーションによるビーズ上でのCPT−DNAのインデックス付きシークエンシングライブラリーの調製の実現性を証明した。
実施例10 クローンインデックス化の実現性試験
いくつかのトランスポソームセットを調製した。1つのセットにおいて、機能亢進性Tn5トランスポザーゼを、5’ビオチンを有するトランスポゾン配列Tnp1と混合し、トランスポソーム1を調製する。別のセットにおいて、5’ビオチンを有する固有インデックス2を有するTnp2で、トランスポソーム2を調製する。別のセットにおいて、トランスポソーム3の調製のため、機能亢進性Tn5トランスポザーゼを、5’ビオチンを有するトランスポゾン配列Tnp3と混合する。別のセットにおいて、固有インデックス4及び5’ビオチンを有するTnp4でトランスポソーム4を調製する。トランスポソーム1及び2、並びにトランスポソーム3及び4を、それぞれ別々にストレプトアビジンビーズと混合し、ビーズセット1及びビーズセット2を生成する。次に、2つのセットのビーズを混合し、ゲノムDNA及びタグメント化バッファーとともにインキュベートして、ゲノムDNAのタグメント化を促進する。この後、タグメント化配列のPCR増幅を行う。増幅したDNAをシークエンシングし、インデックス配列の挿入を分析する。タグメント化がビーズに限定される場合、大多数のフラグメントは、Tnp1/Tnp2及びTnp3/Tnp4インデックスでコードされることになる。分子内ハイブリダイゼーションがある場合には、フラグメントは、Tnp1/Tnp4、Tnp2/Tnp3、Tnp1/Tnp3、及びTnp2/Tnp4インデックスでコードされることになる。5サイクル及び10サイクルのPCR後のシークエンシング結果を図27に示した。コントロールは、混合され、ビーズ上に固定化された、4種類全てのトランスポゾンを有する。結果は、大多数の配列がTnp1/Tnp2又はTnp3/Tnp4インデックスを有することを示し、クローンインデックス化が実現可能であることを示している。コントロールは、インデックスを区別しないことを示す。
実施例11 単一反応におけるインデックス付きクローンビーズ転位
96種類のインデックス付きトランスポソームビーズを調製する。個々のインデックス付きトランスポソームは、5’末端のTn5モザイク末端配列(ME)及びインデックス配列を有するオリゴヌクレオチドを含むトランスポゾンを混合して、調製した。個々のインデックス付きトランスポソームを、ストレプトアビジン−ビオチン相互作用によりビーズ上に固定化した。ビーズ上のトランスポソームを洗浄し、ビーズ上の96種類全ての個々にインデックス化されたトランスポソームをプールした。ME配列に相補的でインデックス配列を有するオリゴヌクレオチドを、固定化オリゴヌクレオチドにアニールし、固有のインデックスを有するトランスポゾンを作製した。96種類のクローンインデックス付きトランスポソームビーズセットを混ぜ合わせ、高分子量(HMW:high molecular weight)ゲノムDNAとともに、Nexteraタグメント化バッファーの存在下、単一のチューブでインキュベートした。
ビーズを洗浄し、反応混合物を0.1%SDSで処理することにより、トランスポザーゼを除去する。タグメント化DNAをインデックス付きプライマーで増幅し、PE HiSeqフローセルv2で、TrueSeq v3クラスターキットを用いてシークエンシングし、シークエンシングデータを分析する。
リードのクラスター、すなわち島を観察する。各配列に対するリード間の最近隣距離のプロットは、主要なピーク、1つはクラスター内からのもの(近位)ともう1つはクラスター間からのもの(遠位)、を基本的に示す。方法及び結果の模式図を、図30及び31に示す。島のサイズは、約3〜10kbの範囲である。カバーされた塩基の割合は、約5%〜10%である。ゲノムDNAの挿入サイズは、約200〜300塩基である。
実施例12 ビーズ上のトランスポソームに対するライブラリーサイズ
初めに、ME’配列を有する第1のオリゴヌクレオチド、ME−バーコード−P5/P7配列を有する第2のオリゴヌクレオチド、及びTn5トランスポザーゼを混合することにより、トランスポソームを溶液中にアセンブルした。第1のセットにおいて、ME’配列を有する第1のオリゴヌクレオチドを、3’末端でビオチン化する。第2のケースにおいて、ME−バーコード−P5/P7配列を有するオリゴヌクレオチドを、5’末端でビオチン化する。種々の濃度(10nM、50nM、及び200NM)の得られた各トランスポソームセットに対し、ストレプトアビジンビーズを添加して、トランスポソームがストレプトアビジンビーズに固定化されるようにする。ビーズを洗浄し、HMWゲノムDNAを加え、タグメント化を行う。いくつかのケースでは、タグメント化DNAを0.1%SDSで処理し、他のケースでは、タグメント化DNAを処理しない。タグメント化DNAを5〜8サイクルでPCR増幅し、シークエンシングする。模式図を図32に示す。
図33に示すように、SDS処理により増幅効率及びシークエンシングの質が改善される。3’ビオチンを有するオリゴヌクレオチドは、トランスポソームに対してより良いライブラリーサイズを有する。
図34は、挿入サイズに対するトランスポソーム表面密度の影響を示す。5’ビオチンを有するトランスポソームは、より小さいサイズのライブラリー及びより多くの自己挿入副産物を示す。
実施例13 インプットDNAの滴定
種々の量の標的HMW DNAを、50mMのTn5:トランスポゾン密度を有するクローンインデックス付きビーズに加え、37℃で15分間若しくは60分間、又は室温で60分間インキュベートした。トランスポソームは、3’ビオチンを有するオリゴヌクレオチドを含んだ。タグメント化を行い、反応混合物を0.1%SDSで処理し、PCR増幅させた。増幅したDNAをシークエンシングした。図35は、サイズ分布に対するインプットDNAの影響を示す。10pgのインプットDNAによる反応は、最小シグナルを示した。サイズ分布パターンは、20pg、40pg、及び200pgのDNAインプットで同様であった。
実施例14 溶液ベース及びビーズベースの方法を用いた島のサイズ及び分布
溶液ベース及びビーズベースの方法を用いて、島のサイズ及び分布を比較した。溶液ベースアプローチにおいて、トランスポゾンにそれぞれ固有のインデックスを有する96種類のトランスポソームを、96穴プレートにアセンブルする。HMWゲノムDNAを添加し、タグメント化反応を行う。反応生成物を0.1%SDSで処理し、PCR増幅させる。増幅したDNAをシークエンシングした。
ビーズベースアプローチにおいて、トランスポゾンにそれぞれ固有インデックスを有する96種類のトランスポソームを、96穴プレートにアセンブルした。オリゴヌクレオチドは、3’末端ビオチンを含んだ。ストレプトアビジンビーズを96穴プレートの各々に添加し、トランスポソームがストレプトアビジンビーズに固定化されるようにインキュベートする。ビーズをそれぞれ洗浄してプールし、HMWゲノムDNAを添加し、タグメント化反応を単一反応容器(ワンポット)内で行う。反応生成物を0.1%SDSで処理し、PCR増幅させる。増幅産物をシークエンシングした。
ネガティブコントロールでは、最初に、それぞれ固有のインデックスを有する96種類全てのトランスポゾン配列を混合する。オリゴヌクレオチドは、3’末端ビオチンを含んだ。トランスポソームを個々の混合インデックス付きトランスポゾンから調製する。ストレプトアビジンビーズを混合物に添加する。HMWゲノムDNAを添加し、タグメント化反応を行う。反応生成物を0.1%SDSで処理し、PCR増幅させる。増幅産物をシークエンシングした。
島内リードの数を島のサイズに対してプロットする。図36に示す結果は、島(近位リード)が、溶液ベースの方法と同様に、ワンポットクローンインデックス付きビーズで観られることを示している。インデックス付きトランスポゾンをトランスポソーム形成前に混合した場合、島(近位リード)は観られなかった。トランスポソーム形成前にトランスポゾンを混合することにより、ビーズ当たり異なるインデックス/トランスポソームを有する、即ちクローンではないビーズが得られる。
実施例15 CPT−seqを用いた構造変異の分析
60kbヘテロ接合欠損の検出
シークエンシングデータをfastqファイルとして抽出し、分離(デマルチプレックス)工程を行って、各バーコードに対する個々のfastqファイルを生成する。CPTシークエンシングからのfastqファイルを、インデックスに従って分離し、重複を除去した参照ゲノムにアラインする。スキャンウィンドウ内の任意のリードを示すインデックスの数を記録する、5kb/1kbウィンドウにより、染色体をスキャンする。統計的には、ヘテロ接合欠損領域のため、隣接領域と比較して、半量のDNAしかライブラリー生成に利用できない。従って、インデックスの数も隣接領域の約半分となるべきである。NA12878 chr1の60kbヘテロ接合欠損を、9216個のインデックス付きCPTシークエンシングデータから5kbウィンドウにスキャンすることにより、図47A及び47Bに示す。
遺伝子融合の検出
CPTシークエンシングからのfastqファイルを、インデックスに従って分離し、重複を除去した参照ゲノムにアラインする。染色体を2kbウィンドウにスキャンする。各2kbウィンドウは、36864ベクターであり、固有インデックスからのリードがこの2kbウィンドウでいくつ見つかったかを各エレメントが記録する。ゲノムにわたり、2kbウィンドウペア(X、Y)毎に、重み付けジャッカード(weighted−Jaccard)インデックスを計算する。このインデックスは、事実上、サンプルの(X、Y)間の距離を示す。これらのインデックスを、図48に示すヒートマップとして表示する。各データポイントは、2kbスキャンウィンドウのペアを表わし、左上の四角は、ともに領域1からのX、Yであり、右下は、ともに領域2からのX、Yであり、右上は、領域1から領域2にわたる領域からのX、Yである。遺伝子融合シグナルは、このケースでは中央の横線として示される。
欠損の検出
CPTシークエンシングからのfastqファイルを、インデックスに従って分離し、重複を除去した参照ゲノムにアラインする。染色体を1kbウィンドウにスキャンする。図49は、遺伝子欠損の検出結果を示す。
実施例16 フェージング及びメチル化検出
亜硫酸水素塩変換効率の最適化
ビーズ上のインデックス付き結合CPT−seqライブラリーに対して、ME(モザイクエレメント領域)及びgDNA領域で、変換を評価した。Promega社のMethylEdge亜硫酸水素塩変換システムを最適化して、効率を改善した。
ME配列を分析して、亜硫酸水素塩変換処理の効率を決定した。図50に示す。ビーズに付着したインデックス付き結合ライブラリーのうち、95%が亜硫酸水素塩変換(BSC)した。亜硫酸水素塩条件間で、同様のPCR収量が観察された。>より厳しい亜硫酸水素塩処理でも、ライブラリーを分解しないように思われた。図51に示す。ビーズ上のインデックス付き結合ライブラリーの約95%でBSCが観察された。BSCを改良(C>U)するために研究した変数は、温度及びNaOH濃度(変性)であった。60℃及び1MのNaOH、又は℃及び0.3MのNaOHで良い結果となった。
ビーズライブラリーでのBSC変換CPT−seqのシークエンシング後、期待したシークエンシングリード構造が観察された。塩基の割合(%)の計測値を、IVCプロットとともに図52に示す。
図53は、亜硫酸水素塩変換後のPCRの後の、インデックス付き結合ライブラリーのアガロースゲル電気泳動の画像を示す。200〜500bpの期待したサイズ範囲のライブラリーが観察された。DNA無しでの反応では、インデックス付き結合ライブラリーを産生しない。
実施例17 標的フェージング
全ゲノムインデックス付き結合CPT−seqライブラリーを濃縮した。図54は、サイズ選択をしない濃縮前の全ゲノムインデックス付き結合CPT−seqライブラリーのバイオアナライザートレースを示す。図55は、濃縮後のライブラリーのアガロースゲル分析を示す。
HLA領域に対する濃縮統計を以下に示す。
図56は、染色体のHLA領域に対して標的化ハプロタイピングを適用した結果を示す。全ゲノムインデックス付き結合リードライブラリーの濃縮の図解を左に示す。小さいバーは、各々インデックス付き短ライブラリーを示す。インデックス付きライブラリーのクラスターは、単一ビーズ上で同じインデックスでクローンインデックス付けされた領域である「島」であり、従って、ゲノムスケール上でリードの近位性(「島」性)を示す。標的領域におけるライブラリーの濃縮(国際公開第2012/108864号「核酸の選択的濃縮(Selective enrichment of nucleic acids)」を参照)を右に示す。リードは、HLA領域で濃縮される。さらに、リードがインデックスで選別され、ゲノムにアラインされる場合、リードは、インデックス付き結合リードから連続性情報が維持されていることを示す「島」構造を再び示す。
実施例18 インデックス交換
トランスポソーム複合体のモザイク末端(ME)の交換を評価するため、異なるインデックスを有するビーズを調製した。混合後、ライブラリーをシークエンシングし、各ライブラリーのインデックスをレポートすることにより、インデックス交換を決定した。「交換(swapped)」の割合(%)を、(D4+D5+E3+E5+f4)/(全96種の合計)で計算した。図65に示す。
実施例19 トランスポソーム複合体をストレプトアビジンビーズにより密集させることによるライブラリー挿入サイズの縮小
ストレプトアビジン磁性ビーズを、1倍、6倍、及び12倍濃度のTsTn5トランスポソーム複合体とともにロードした。各ビーズタイプに対して、Epi−CPTSeqプロトコルを実施した。分析のため、最終PCR産物をAgilent BioAnalyzer上にロードした。図に示す。Epi−CPTSeqライブラリーフラグメントは、比較的小さく、ビーズ上にTsTn5を多くロードするほど多く産生した。
実施例20 亜硫酸水素塩変換中のDNAライブラリーのフラグメント化
亜硫酸水素塩変換後、DNAは損傷を受け、結果としてPCR増幅に必要な共通配列(CS2)が減少する。DNAフラグメントCPTSeq及びEpi−CPTSeq(Me−CPTSeq)ライブラリーを、BioAnalyzerで分析した。亜硫酸水素塩変換中のDNA損傷により、Epi−CPTSeqライブラリーは、図70に示すように、CPTSeqライブラリーと比較して、5倍低い収量であり、小さいライブラリーサイズ分布を有する。
実施例21 TdT媒介ssDNAライゲーション反応
ターミナルトランスフェラーゼ(TdT)媒介ライゲーションによるDNA末端修復の実現性を試験した。簡単には、5pmolのssDNA鋳型を,TdT(10/50U)、アテニュエーター/アダプター二本鎖(0/15/25pmol)、及びDNAリガーゼ(0/10U)とともに、37℃で15分間インキュベートした。伸長/ライゲーションのDNA産物を、TBE−Ureaゲルで分析し、結果を図71に示した。全ての反応成分を添加した結果、アダプター分子のほぼ完全なライゲーションが行われた(レーン5〜8)。
ターミナルトランスフェラーゼ(TdT)媒介ライゲーションによるDNA末端修復の実現性を、亜硫酸水素ナトリウム変換ビーズ結合ライブラリーに対して試験した。図72に示す。簡単には、DNAをビーズ上でタグメント化し(最初の2レーン)、Promega社のMethylEdge亜硫酸水素塩変換キットで処理し(レーン3及び4)、DNA救出プロトコルを行った(レーン5及び6)。救出反応後のDNAライブラリーの収量及びサイズは、明らかに増加している。また、挿入トランスポゾン(SI)の存在量も増加しており、アダプター分子の効率的なライゲーションを示している。
メチル−CPTSeqアッセイの結果を図73に示す。

Claims (58)

  1. (a)標的核酸を複数のトランスポソーム複合体と接触させるステップであって、
    各トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、
    前記トランスポゾンは、転移鎖及び非転移鎖を含み、前記トランスポソーム複合体の少なくとも1つの前記トランスポゾンは、相補的な捕捉配列にハイブリダイズすることが可能なアダプター配列を含む、ステップと、
    (b)前記標的核酸を複数のフラグメントにフラグメント化し、前記標的核酸の連続性を維持しながら前記フラグメントの少なくとも1つの鎖の5’末端に複数の転移鎖を挿入する、ステップと、
    (c)前記標的核酸の前記複数のフラグメントを複数の固体支持体と接触させるステップであって、前記複数の固体支持体の各々は複数の固定化オリゴヌクレオチドを含み、各前記オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列を含み、前記複数の固体支持体中の各固体支持体からの第1のバーコード配列は、前記複数の固体支持体中の他の固体支持体からの第1のバーコード配列とは異なる、ステップと、
    (d)前記バーコード配列の情報を前記標的核酸のフラグメントに転移させ、それにより二本鎖フラグメントのライブラリーを作製するステップであって、少なくとも1つの鎖が前記第1のバーコードで5’タグ化され、同じ前記標的核酸の少なくとも2つのフラグメントが同一のバーコード情報を受け取る、ステップと
    を含む、標的核酸のバーコード化DNAフラグメントのライブラリーを調製する方法。
  2. (a)標的核酸を複数のトランスポソーム複合体と接触させるステップであって、
    各トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、
    前記トランスポゾンは、転移鎖及び非転移鎖を含み、前記トランスポソーム複合体の少なくとも1つの前記トランスポゾンは、相補的な捕捉配列にハイブリダイズすることが可能なアダプター配列を含む、ステップと、
    (b)前記標的核酸を複数のフラグメントにフラグメント化し、前記標的核酸の連続性を維持しながら複数の転移鎖を挿入するステップと、
    (c)前記標的核酸の前記複数のフラグメントを複数の固体支持体と接触させるステップであって、前記複数の固体支持体の各々は複数の固定化オリゴヌクレオチドを含み、各前記オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列を含み、前記複数の固体支持体中の各固体支持体からの第1のバーコード配列は、前記複数の固体支持体中の他の固体支持体からの第1のバーコード配列とは異なる、ステップと、
    (d)前記バーコード配列の情報を前記標的核酸のフラグメントに転移させるステップであって、同じ前記標的核酸の少なくとも2つのフラグメントが同一のバーコード情報を受け取る、ステップと
    (e)前記標的核酸のフラグメントの配列及び前記バーコード配列を決定するステップと、
    (f)前記バーコード配列を識別することにより、前記標的核酸の連続性情報を決定するステップと
    を含む、標的核酸配列の連続性情報を決定する方法。
  3. (a)標的核酸を複数のトランスポソーム複合体と接触させるステップであって、
    各トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、
    前記トランスポゾンは、転移鎖及び非転移鎖を含み、前記トランスポソーム複合体の少なくとも1つの前記トランスポゾンは、相補的な捕捉配列にハイブリダイズすることが可能なアダプター配列を含む、ステップと、
    (b)前記標的核酸を複数のフラグメントにフラグメント化し、前記標的核酸の連続性を維持しながら複数の転移鎖を挿入するステップと、
    (c)前記標的核酸の前記複数のフラグメントを複数の固体支持体と接触させるステップであって、前記複数の固体支持体の各々は複数の固定化オリゴヌクレオチドを含み、各前記オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列を含み、前記複数の固体支持体中の各固体支持体からの第1のバーコード配列は、前記複数の固体支持体中の他の固体支持体からの第1のバーコード配列とは異なる、ステップと、
    (d)前記バーコード配列の情報を前記標的核酸のフラグメントに転移させるステップであって、同じ前記標的核酸の少なくとも2つのフラグメントが同一のバーコード情報を受け取る、ステップと
    (e)バーコードを含む前記標的核酸のフラグメントを亜硫酸水素塩処理に付し、それによりバーコードを含む亜硫酸水素塩処理標的核酸フラグメントを生成させるステップと、
    (f)前記亜硫酸水素塩処理標的核酸フラグメントの配列及び前記バーコード配列を決定するステップと、
    (g)前記バーコード配列を識別することにより、前記標的核酸の連続性情報を決定するステップとを含み、
    前記配列情報は、前記標的核酸のメチル化状態を示し、前記連続性情報は、ハプロタイプ情報を示す、
    標的核酸配列のフェージング情報及びメチル化状態を同時に決定する方法。
  4. 単一のバーコード配列が、各個々の前記固体支持体上の前記複数の固定化オリゴヌクレオチドに存在する、請求項1〜3のいずれか一項に記載の方法。
  5. 異なるバーコード配列が、各個々の前記固体支持体上の前記複数の固定化オリゴヌクレオチドに存在する、請求項1〜3のいずれか一項に記載の方法。
  6. 前記バーコード配列情報の前記標的核酸フラグメントへの転移を、ライゲーションにより行う、請求項1〜5のいずれか一項に記載の方法。
  7. 前記バーコード配列情報の前記標的核酸フラグメントへの転移を、ポリメラーゼ伸長により行う、請求項1〜5のいずれか一項に記載の方法。
  8. 前記バーコード配列情報の前記標的核酸フラグメントへの転移を、ライゲーション及びポリメラーゼ伸長の両方により行う、請求項1〜5のいずれか一項に記載の方法。
  9. 前記ポリメラーゼ伸長を、ライゲートされた前記固定化オリゴヌクレオチドを鋳型として用い、ライゲートされていない前記トランスポゾン鎖の3’末端をDNAポリメラーゼで伸長することにより行う、請求項7又は8に記載の方法。
  10. 前記アダプター配列の少なくとも一部が、第2のバーコード配列をさらに含む、請求項1〜9のいずれか一項に記載の方法。
  11. 前記トランスポソーム複合体が多量体であり、各単量体単位の前記トランスポゾンの前記アダプター配列が、同じ前記トランスポソーム複合体の他の単量体単位とは異なる、請求項1〜10のいずれか一項に記載の方法。
  12. 前記アダプター配列が、第1のプライマー結合配列をさらに含む、請求項1〜11のいずれか一項に記載の方法。
  13. 前記第1のプライマー結合部位が、前記捕捉配列又は前記捕捉配列の相補体に対して配列相同性を持たない、請求項12に記載の方法。
  14. 前記固体支持体上の前記固定化オリゴヌクレオチドが、第2のプライマー結合配列をさらに含む、請求項1〜13のいずれか一項に記載の方法。
  15. 前記トランスポソーム複合体が多量体であり、前記トランスポソームの単量体単位が、同じ前記トランスポソーム複合体内で互いに結合している、請求項1〜14のいずれか一項に記載の方法。
  16. トランスポソーム単量体単位のトランスポザーゼが、同じトランスポソーム複合体の別のトランスポソーム単量体単位の別のトランスポザーゼに結合している、請求項15に記載の方法。
  17. トランスポソーム単量体単位のトランスポゾンが、同じ前記トランスポソーム複合体の別のトランスポソーム単量体単位の別のトランスポゾンに結合している、請求項15に記載の方法。
  18. 標的核酸配列の前記連続性情報が、ハプロタイプ情報を示す、請求項1〜17のいずれか一項に記載の方法。
  19. 標的核酸配列の前記連続性情報が、ゲノム変異を示す、請求項1〜17のいずれか一項に記載の方法。
  20. 前記ゲノム変異が、欠損、転位、染色体間遺伝子融合、重複、及びパラログからなる群から選択される、請求項19に記載の方法。
  21. 前記固体支持体上に固定化された前記オリゴヌクレオチドが、部分的二本鎖領域及び部分的一本鎖領域を含む、請求項1〜20のいずれか一項に記載の方法。
  22. 前記オリゴヌクレオチドの前記部分的一本鎖領域が、前記第2のバーコード配列及び前記第2のプライマー結合配列を含む、請求項21に記載の方法。
  23. 前記バーコードを含む標的核酸フラグメントが、前記標的核酸フラグメントの配列を決定する前に増幅される、請求項1〜22のいずれか一項に記載の方法。
  24. 前記ステップ(a)〜(d)及びその後の前記増幅が、前記標的核酸フラグメントの配列を決定する前に、単一の反応区画で行われる、請求項23に記載の方法。
  25. 前記増幅の間に、第3のバーコード配列が前記標的核酸フラグメントに挿入される、請求項23に記載の方法。
  26. 前記ステップ(d)の前記バーコードを含む前記標的核酸フラグメントを、複数の第1のセットの反応区画から前記バーコードを含む標的核酸フラグメントのプールにまとめるステップと、
    前記バーコードを含む標的核酸フラグメントの前記プールを複数の第2のセットの反応区画に再分配するステップと、
    前記標的核酸フラグメントを前記第2のセットの反応区画内でシークエンシング前に増幅することにより、第3のバーコードを前記標的核酸フラグメントに導入するステップと
    をさらに含む、請求項1〜24のいずれか一項に記載の方法。
  27. 前記標的核酸をトランスポソーム複合体と接触させる前に、前記標的核酸をプレフラグメント化するステップをさらに含む、請求項1〜26のいずれか一項に記載の方法。
  28. 前記標的核酸をプレフラグメント化するステップが、超音波処理及び制限消化からなる群から選択される方法により行われる、請求項27に記載の方法。
  29. (a)その上にトランスポソーム複合体を固定化している複数の固体支持体を提供するステップであって、前記トランスポソーム複合体は多量体であり、同じ前記トランスポソーム複合体の前記トランスポソームの単量体単位が互いに結合しており、前記トランスポソームの単量体単位が、第1のポリヌクレオチドに結合したトランスポザーゼを含み、前記第1のポリヌクレオチドは、
    (i)トランスポゾン末端配列を含む3’部分と、
    (ii)第1のバーコードを含む第1のアダプターと
    を含む、ステップと、
    (b)標的DNAを、前記標的DNAが前記トランスポソーム複合体によりフラグメントされ、前記第1のポリヌクレオチドの前記3’トランスポゾン末端配列が前記フラグメントの少なくとも1つの鎖の5’末端に転移される条件下で、前記複数の固体支持体に適用し、それにより、少なくとも1つの鎖が前記第1のバーコードで5’タグ化されている二本鎖フラグメントの固定化ライブラリーを作製するステップと、
    を含む、タグ化DNAフラグメントの固定化ライブラリーを調製する方法。
  30. トランスポソーム単量体単位の前記トランスポザーゼが、同じ前記トランスポソーム複合体の別のトランスポソーム単量体単位の別のトランスポザーゼに結合している、請求項29に記載の方法。
  31. トランスポソーム単量体単位の前記トランスポゾンが、同じ前記トランスポソーム複合体の別のトランスポソーム単量体単位の別のトランスポゾンに結合している、請求項29に記載の方法。
  32. (a)標的核酸を2つ又はそれ以上のフラグメントにフラグメント化するステップと、
    (b)第1の共通アダプター配列を前記標的核酸の前記フラグメントの5’末端に組み込むステップであって、前記アダプター配列が第1のプライマー結合配列と親和性部分とを含み、前記親和性部分が結合ペアの1つのメンバーに存在する、ステップと、
    (c)前記標的核酸フラグメントを変性させるステップと、
    (d)前記標的核酸フラグメントを固体支持体上に固定化するステップであって、前記固体支持体は、前記結合ペアの他のメンバーを含み、前記標的核酸の固定化が前記結合ペアの結合により行われる、ステップと、
    (e)前記固定化標的核酸フラグメントを亜硫酸水素塩処理に付すステップと、
    (f)第2の共通アダプター配列を前記亜硫酸水素塩処理固定化標的核酸フラグメントに組み込むステップであって、前記第2の共通アダプターが第2のプライマー結合部位を含む、ステップと、
    (g)固体支持体上に固定化された前記亜硫酸水素塩処理標的核酸フラグメントを、第1及び第2のプライマーを用いて増幅させ、それにより標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを作製する、ステップと、
    を含む、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを調製する方法。
  33. 前記第1の共通アダプター配列が、片側転位により前記標的核酸の5’末端フラグメントに組み込まれる、請求項32に記載の方法。
  34. 前記第1の共通アダプター配列が、ライゲーションにより前記標的核酸の5’末端フラグメントに組み込まれる、請求項32に記載の方法。
  35. 前記第2の共通アダプター配列を前記亜硫酸水素塩処理固定化標的核酸フラグメントに組み込むステップが、
    (i)前記固定化標的核酸フラグメントの3’末端を、前記固定化標的核酸フラグメントの3’末端がホモポリマーテイルを含むように、ターミナルトランスフェラーゼを用いて伸長させるステップと、
    (ii)第1の部分及び第2の部分を含むオリゴヌクレオチドをハイブリダイズさせるステップであって、前記第1の部分が、前記固定化標的核酸フラグメントの前記ホモポリマーテイルと相補的な一本鎖ホモポリマー部分を含み、前記第2の部分が、前記第2の共通アダプター配列を含む二本鎖部分を含む、ステップと、
    (iii)前記第2の共通アダプター配列を前記固定化標的核酸フラグメントにライゲートし、それにより前記第2の共通アダプター配列を前記亜硫酸水素塩処理固定化標的核酸フラグメントに組み込むステップと
    を含む、請求項32〜34のいずれか一項に記載の方法。
  36. 前記標的核酸が単一の細胞に由来する、請求項1〜35のいずれか一項に記載の方法。
  37. 前記標的核酸が単一の細胞小器官に由来する、請求項1〜36のいずれか一項に記載の方法。
  38. 前記標的核酸がゲノムDNAである、請求項1〜37のいずれか一項に記載の方法。
  39. 前記標的核酸が他の核酸に架橋する、請求項1〜38のいずれか一項に記載の方法。
  40. 前記標的核酸が無細胞腫瘍DNAである、請求項1〜39のいずれか一項に記載の方法。
  41. 前記無細胞腫瘍DNAが胎盤液から得られる、請求項40に記載の方法。
  42. 前記無細胞腫瘍DNAが血漿から得られる、請求項40に記載の方法。
  43. 前記血漿が、前記血漿用の採取ゾーンを含む膜分離装置を用いて全血から採取される、請求項42に記載の方法。
  44. 前記項血漿用の前記採取ゾーンが、固体支持体上に固定化されたトランスポソーム複合体を含む、請求項43に記載の方法。
  45. 前記標的核酸がcDNAである、請求項1〜37のいずれか一項に記載の方法。
  46. 前記標的核酸がホルマリン固定パラフィン包埋サンプルに由来する、請求項1〜37のいずれか一項に記載の方法。
  47. 前記標的核酸がヒストンに保護されたDNAである、請求項1〜37のいずれか一項に記載の方法。
  48. 前記固体支持体がビーズである、請求項1〜47のいずれか一項に記載の方法。
  49. 前記複数の固体支持体が複数のビーズであり、前記複数のビーズが様々なサイズを有する、請求項1〜31のいずれか一項に記載の方法。
  50. (a)その上に固定化された固定化トランスポソーム複合体を含む複数の固体支持体を提供するステップであって、前記トランスポソーム複合体はトランスポゾン及びトランスポザーゼを含み、前記トランスポゾンは転移鎖及び非転移鎖を含み、前記転移鎖は、
    (i)トランスポザーゼ認識配列を含む3’末端の第1の部分と、
    (ii)第1のアダプター配列及び結合ペアの第1のメンバーを含み、5’から前記第1の部分に位置する第2の部分であって、前記結合ペアの前記第1のメンバーは固体支持体上で前記結合ペアの第2のメンバーに結合し、それによりトランスポゾンを前記固体支持体に固定化し、前記第1のアダプター配列は第1のプライマー結合配列を含む、第2の部分とを含み、
    前記非転移鎖は、
    (i)前記トランスポザーゼ認識配列を含む5’末端の第1の部分と、
    (ii)第2のアダプター配列を含み、3’から前記第1の部分に位置する第2の部分であって、3’末端の末端ヌクレオチドはブロックされ、前記第2のアダプターは第2のプライマー結合配列を含む、第2の部分とを含む、ステップと、
    (b)標的核酸を、固定化トランスポソーム複合体を含む前記複数の固体支持体に接触させるステップと、
    (c)前記標的核酸を複数のフラグメントにフラグメント化し、複数の転移鎖を前記フラグメントの少なくとも1つの鎖の5’末端に挿入し、それにより前記標的核酸フラグメントを前記固体支持体に固定化するステップと、
    (d)DNAポリメラーゼで前記フラグメント化標的核酸の3’末端を伸長させるステップと、
    (e)前記非転移鎖を前記フラグメント化標的核酸の3’末端にライゲートするステップと、
    (f)前記固定化標的核酸フラグメントを亜硫酸水素塩処理に付すステップと、
    (g)前記亜硫酸水素塩処理中に損傷した前記固定化標的核酸フラグメントの3’末端をDNAポリメラーゼを用いて伸長させて、前記固定化標的核酸フラグメントの3’末端がホモポリマーテイルを含むようにするステップと、
    (h)前記亜硫酸水素塩処理中に損傷した前記固定化標的核酸フラグメントの3’末端に第2のアダプター配列を組み込むステップと、
    (i)前記固体支持体上に固定化された前記亜硫酸水素塩処理標的核酸フラグメントを、第1及び第2のプライマーを用いて増幅させ、それにより標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを作製するステップと、
    を含む、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを調製する方法。
  51. (a)標的核酸をトランスポソーム複合体に接触させるステップであって、
    前記トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、前記トランスポゾンは、転移鎖及び非転移鎖を含み、前記転移鎖は、
    (i)トランスポザーゼ認識配列を含む3’末端の第1の部分と、
    (ii)第1のアダプター配列及び結合ペアの第1のメンバーを含み、5’から前記第1の部分に位置する第2の部分であって、前記結合ペアの第1のメンバーは前記結合ペアの第2のメンバーに結合する、第2の部分とを含み、
    前記非転移鎖は、
    (i)前記トランスポザーゼ認識配列を含む5’末端の第1の部分と、
    (ii)第2のアダプター配列を含み、3’から前記第1の部分に位置する第2の部分であって、3’末端の末端ヌクレオチドはブロックされ、前記第2のアダプターは第2のプライマー結合配列を含む、第2の部分とを含む、ステップと、
    (b)前記標的核酸を複数のフラグメントにフラグメント化し、複数の転移鎖を前記フラグメントの少なくとも1つの鎖の5’末端に挿入し、それにより前記標的核酸フラグメントを前記固体支持体に固定化するステップと、
    (c)トランスポゾン末端を含む標的核酸フラグメントを、前記結合ペアの第2のメンバーを含む前記複数の固体支持体に接触させるステップであって、前記結合ペアの前記第1のメンバーと前記結合ペアの前記第2のメンバーとの結合により前記標的核酸を前記固体支持体に固定化する、ステップと、
    (d)DNAポリメラーゼで前記フラグメント化標的核酸の3’末端を伸長させるステップと、
    (e)前記非転移鎖を前記フラグメント化標的核酸の3’末端にライゲートするステップと、
    (f)前記固定化標的核酸フラグメントを亜硫酸水素塩処理に付すステップと、
    (g)前記亜硫酸水素塩処理中に損傷した前記固定化標的核酸フラグメントの3’末端をDNAポリメラーゼを用いて伸長させて、前記固定化標的核酸フラグメントの3’末端がホモポリマーテイルを含むようにするステップと、
    (h)前記亜硫酸水素塩処理中に損傷した前記固定化標的核酸フラグメントの3’末端に第2のアダプター配列を組み込むステップと、
    (i)前記固体支持体上に固定化された前記亜硫酸水素塩処理標的核酸フラグメントを、第1及び第2のプライマーを用いて増幅させ、それにより標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを作製するステップと、
    を含む、標的核酸のメチル化状態を決定するためのシークエンシングライブラリーを調製する方法。
  52. 前記固体支持体がビーズである、請求項50又は51に記載の方法。
  53. 前記結合ペアの前記第1及び第2のメンバーが、ビオチン及びストレプトアビジンである、請求項50〜52のいずれか一項に記載の方法。
  54. 前記第1のアダプターがバーコードをさらに含む、請求項50又は51に記載の方法。
  55. 前記第2のアダプターがバーコードをさらに含む、請求項50又は51に記載の方法。
  56. 前記第1及び第2のアダプターが第1及び第2のバーコードを含む、請求項50又は51に記載の方法。
  57. 前記亜硫酸水素塩処理中に損傷した前記固定化標的核酸フラグメントの3’末端の伸長を、ターミナルトランスフェラーゼにより行う、請求項50又は51に記載の方法。
  58. 前記第2のアダプターの3’末端の末端ヌクレオチドが、ジデオキシヌクレオチド、リン酸基、チオリン酸基、及びアジド基からなる群から選択されるメンバーによりブロックされる、請求項50〜57のいずれか一項に記載の方法。
JP2017520884A 2014-10-17 2015-10-16 連続性を維持した転位 Active JP6808617B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201462065544P 2014-10-17 2014-10-17
US62/065,544 2014-10-17
US201562157396P 2015-05-05 2015-05-05
US62/157,396 2015-05-05
US201562242880P 2015-10-16 2015-10-16
PCT/US2015/056040 WO2016061517A2 (en) 2014-10-17 2015-10-16 Contiguity preserving transposition
US62/242,880 2015-10-16

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020204004A Division JP7127104B2 (ja) 2014-10-17 2020-12-09 連続性を維持した転位

Publications (2)

Publication Number Publication Date
JP2018501776A true JP2018501776A (ja) 2018-01-25
JP6808617B2 JP6808617B2 (ja) 2021-01-06

Family

ID=55747561

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2017520884A Active JP6808617B2 (ja) 2014-10-17 2015-10-16 連続性を維持した転位
JP2020204004A Active JP7127104B2 (ja) 2014-10-17 2020-12-09 連続性を維持した転位
JP2022129859A Pending JP2022172158A (ja) 2014-10-17 2022-08-17 連続性を維持した転位

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2020204004A Active JP7127104B2 (ja) 2014-10-17 2020-12-09 連続性を維持した転位
JP2022129859A Pending JP2022172158A (ja) 2014-10-17 2022-08-17 連続性を維持した転位

Country Status (10)

Country Link
US (3) US11873480B2 (ja)
JP (3) JP6808617B2 (ja)
KR (2) KR102643955B1 (ja)
AU (2) AU2015331739B2 (ja)
BR (3) BR122021026779B1 (ja)
CA (1) CA2964799A1 (ja)
IL (3) IL251737B (ja)
RU (2) RU2736728C2 (ja)
SG (2) SG11201703139VA (ja)
WO (1) WO2016061517A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021522797A (ja) * 2018-05-03 2021-09-02 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company ハイスループットマルチオミクスサンプル解析
JP2022544662A (ja) * 2019-08-19 2022-10-20 ユニバーサル シーケンシング テクノロジー コーポレイション 核酸シーケンシングの核酸フラグメント起源を追跡するための方法および組成物
JP7489455B2 (ja) 2019-10-25 2024-05-23 チャンピン ナショナル ラボラトリー 哺乳類dnaのメチル化の検出及び分析

Families Citing this family (134)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
CA2826131C (en) 2011-02-02 2019-11-05 Jay Ashok Shendure Massively parallel continguity mapping
GB2504240B (en) 2012-02-27 2015-05-27 Cellular Res Inc Compositions and kits for molecular counting of nucleic acids
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US20140155295A1 (en) 2012-08-14 2014-06-05 10X Technologies, Inc. Capsule array devices and methods of use
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2014124338A1 (en) 2013-02-08 2014-08-14 10X Technologies, Inc. Polynucleotide barcode generation
ES2724824T3 (es) 2013-03-13 2019-09-16 Illumina Inc Métodos para la secuenciación de ácidos nucleicos
JP6545682B2 (ja) 2013-08-28 2019-07-17 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company 大規模並列単一細胞分析
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
WO2015157567A1 (en) 2014-04-10 2015-10-15 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
MX2016016902A (es) 2014-06-26 2017-03-27 10X Genomics Inc Metodos para analizar acidos nucleicos de celulas individuales o poblaciones de celulas.
EP3174980A4 (en) 2014-08-01 2018-01-17 Dovetail Genomics, LLC Tagging nucleic acids for sequence assembly
CN114807307A (zh) 2014-10-29 2022-07-29 10X 基因组学有限公司 用于靶核酸测序的方法和组合物
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
CN107427808B (zh) 2015-01-12 2020-10-23 10X基因组学有限公司 用于制备核酸测序文库的方法和系统以及用其制备的文库
WO2016134034A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
US10697000B2 (en) 2015-02-24 2020-06-30 10X Genomics, Inc. Partition processing methods and systems
WO2016138148A1 (en) 2015-02-24 2016-09-01 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
US11807896B2 (en) 2015-03-26 2023-11-07 Dovetail Genomics, Llc Physical linkage preservation in DNA storage
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
US11390914B2 (en) 2015-04-23 2022-07-19 Becton, Dickinson And Company Methods and compositions for whole transcriptome amplification
EP3303621A1 (en) 2015-05-28 2018-04-11 Illumina Cambridge Limited Surface-based tagmentation
US12018314B2 (en) 2015-07-02 2024-06-25 Arima Genomics, Inc. Accurate molecular deconvolution of mixture samples
WO2017034970A1 (en) * 2015-08-21 2017-03-02 The General Hospital Corporation Combinatorial single molecule analysis of chromatin
CN108026524A (zh) 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物
WO2017070123A1 (en) 2015-10-19 2017-04-27 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
ES2926495T3 (es) 2015-12-04 2022-10-26 10X Genomics Inc Métodos y composiciones para el análisis de ácidos nucleicos
WO2017120531A1 (en) 2016-01-08 2017-07-13 Bio-Rad Laboratories, Inc. Multiple beads per droplet resolution
EP3402883A4 (en) * 2016-01-12 2019-09-18 Seqwell, Inc. COMPOSITIONS AND METHODS FOR NUCLEIC ACID SEQUENCING
WO2017138984A1 (en) 2016-02-11 2017-08-17 10X Genomics, Inc. Systems, methods, and media for de novo assembly of whole genome sequence data
CA3014911A1 (en) 2016-02-23 2017-08-31 Dovetail Genomics, Llc Generation of phased read-sets for genome assembly and haplotype phasing
US20170283864A1 (en) 2016-03-31 2017-10-05 Agilent Technologies, Inc. Use of transposase and y adapters to fragment and tag dna
KR102379048B1 (ko) 2016-05-02 2022-03-28 엔코디아, 인코포레이티드 암호화 핵산을 사용한 거대분자 분석
EP3954771A1 (en) * 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10894990B2 (en) 2016-05-17 2021-01-19 Shoreline Biome, Llc High throughput method for identification and sequencing of unknown microbial and eukaryotic genomes from complex mixtures
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
EP3485034B1 (en) * 2016-07-12 2021-08-18 Kapa Biosystems, Inc. System and method for transposase-mediated amplicon sequencing
US11535883B2 (en) * 2016-07-22 2022-12-27 Illumina, Inc. Single cell whole genome libraries and combinatorial indexing methods of making thereof
RU2019106038A (ru) * 2016-08-10 2020-09-17 Президент Энд Фэллоуз Оф Харвард Коллидж Способы de novo сборки баркодированных фрагментов геномной днк
WO2018057779A1 (en) * 2016-09-23 2018-03-29 Jianbiao Zheng Compositions of synthetic transposons and methods of use thereof
KR102522023B1 (ko) 2016-09-26 2023-04-17 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
CN110139932B (zh) 2016-12-19 2024-05-17 生物辐射实验室股份有限公司 液滴加标的相邻性保留的标签化dna
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
GB201622219D0 (en) * 2016-12-23 2017-02-08 Cs Genetics Ltd Methods and reagents for molecular barcoding
CN117512066A (zh) 2017-01-30 2024-02-06 10X基因组学有限公司 用于基于微滴的单细胞条形编码的方法和系统
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
US10995333B2 (en) 2017-02-06 2021-05-04 10X Genomics, Inc. Systems and methods for nucleic acid preparation
IL263118B2 (en) * 2017-02-21 2023-12-01 Illumina Inc Tegumentation using fixed transpososomes with linkers
AU2018262331A1 (en) 2017-05-05 2019-11-21 Scipio Bioscience Methods for trapping and barcoding discrete biological units in hydrogel
US10400235B2 (en) 2017-05-26 2019-09-03 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CN109526228B (zh) * 2017-05-26 2022-11-25 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
ES2959047T3 (es) * 2017-06-07 2024-02-19 Univ Oregon Health & Science Bibliotecas de genoma completo de célula individual para la secuenciación de metilación
WO2019060722A2 (en) 2017-09-22 2019-03-28 X Gen Us Co. METHODS AND COMPOSITIONS FOR USE IN PREPARING POLYNUCLEOTIDES
US10837047B2 (en) 2017-10-04 2020-11-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
WO2019076768A1 (en) * 2017-10-16 2019-04-25 Tervisetehnoloogiate Arenduskeskus As METHOD AND KIT FOR PREPARING DNA BANK
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
EP4241882A3 (en) 2017-10-27 2023-12-06 10X Genomics, Inc. Methods for sample preparation and analysis
MX2020004559A (es) 2017-10-31 2020-10-05 Encodia Inc Kits para análisis utilizando codificación y/o etiqueta de ácido nucleico.
CN118186055A (zh) 2017-11-02 2024-06-14 生物辐射实验室股份有限公司 基于转座酶的基因组分析
WO2019099751A1 (en) 2017-11-15 2019-05-23 10X Genomics, Inc. Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
US11873481B2 (en) 2017-11-21 2024-01-16 Arima Genomics, Inc. Preserving spatial-proximal contiguity and molecular contiguity in nucleic acid templates
WO2019108851A1 (en) 2017-11-30 2019-06-06 10X Genomics, Inc. Systems and methods for nucleic acid preparation and analysis
EP3752832A1 (en) 2018-02-12 2020-12-23 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
EP3775271A1 (en) 2018-04-06 2021-02-17 10X Genomics, Inc. Systems and methods for quality control in single cell processing
CN112243461B (zh) 2018-05-03 2024-07-12 贝克顿迪金森公司 在相对的转录物末端进行分子条形码化
US20210115595A1 (en) * 2018-05-08 2021-04-22 Mgi Tech Co., Ltd. Single tube bead-based dna co-barcoding for accurate and cost-effective sequencing, haplotyping, and assembly
CA3067435C (en) * 2018-05-17 2023-09-12 Illumina, Inc. High-throughput single-cell sequencing with reduced amplification bias
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
US11703427B2 (en) 2018-06-25 2023-07-18 10X Genomics, Inc. Methods and systems for cell and bead processing
US20200032335A1 (en) 2018-07-27 2020-01-30 10X Genomics, Inc. Systems and methods for metabolome analysis
CN113166807B (zh) 2018-08-20 2024-06-04 生物辐射实验室股份有限公司 通过分区中条码珠共定位生成核苷酸序列
CN112739829A (zh) * 2018-09-27 2021-04-30 深圳华大生命科学研究院 测序文库的构建方法和得到的测序文库及测序方法
WO2020072380A1 (en) 2018-10-01 2020-04-09 Cellular Research, Inc. Determining 5' transcript sequences
SG11202102722SA (en) * 2018-10-25 2021-04-29 Illumina Inc Methods and compositions for identifying ligands on arrays using indexes and barcodes
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
US11459607B1 (en) 2018-12-10 2022-10-04 10X Genomics, Inc. Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes
CN113195717A (zh) 2018-12-13 2021-07-30 贝克顿迪金森公司 单细胞全转录组分析中的选择性延伸
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
BR112021006038A2 (pt) 2019-01-11 2021-10-26 Illumina Cambridge Limited Complexos de stranspossomas ligados à superfície do complexo
US11661631B2 (en) 2019-01-23 2023-05-30 Becton, Dickinson And Company Oligonucleotides associated with antibodies
TW202100247A (zh) 2019-01-29 2021-01-01 美商伊路米納有限公司 流通槽
TW202043486A (zh) 2019-01-29 2020-12-01 美商伊路米納有限公司 定序套組
EP3918088B1 (en) * 2019-01-29 2024-03-13 MGI Tech Co., Ltd. High coverage stlfr
TW202045709A (zh) 2019-01-29 2020-12-16 美商伊路米納有限公司 流體槽
WO2020168013A1 (en) 2019-02-12 2020-08-20 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11851683B1 (en) 2019-02-12 2023-12-26 10X Genomics, Inc. Methods and systems for selective analysis of cellular samples
CA3128098A1 (en) 2019-02-14 2020-08-20 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Haplotagging - haplotype phasing and single-tube combinatorial barcoding of nucleic acid molecules using bead-immobilized tn5 transposase
US11655499B1 (en) 2019-02-25 2023-05-23 10X Genomics, Inc. Detection of sequence elements in nucleic acid molecules
US11920183B2 (en) 2019-03-11 2024-03-05 10X Genomics, Inc. Systems and methods for processing optically tagged beads
CA3138367A1 (en) 2019-04-30 2020-11-05 Encodia, Inc. Methods for preparing analytes and related kits
AU2020312787A1 (en) 2019-07-12 2021-06-17 Illumina Cambridge Limited Nucleic acid library preparation using electrophoresis
JP2022540268A (ja) * 2019-07-12 2022-09-15 イルミナ ケンブリッジ リミテッド 固体支持体上で固定化されたcrispr/cas9を使用する核酸シークエンシングライブラリを調製するための組成物及び方法
US11377655B2 (en) 2019-07-16 2022-07-05 Pacific Biosciences Of California, Inc. Synthetic nucleic acids having non-natural structures
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
SG11202113372WA (en) * 2019-09-20 2021-12-30 Illumina Inc Methods and compositions for identifying ligands on arrays using indexes and barcodes
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
ES2944559T3 (es) * 2019-12-02 2023-06-22 Illumina Cambridge Ltd Formación de imágenes de grupos basadas en el tiempo de fragmentos de bibliotecas de ADN genómico con la contigüidad preservada
CA3134746A1 (en) 2019-12-19 2021-06-24 Illumina, Inc. High-throughput single-cell libraries and methods of making and of using
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
CN115151654A (zh) * 2020-02-12 2022-10-04 通用测序技术公司 用于胞内条码化和空间条码化的方法
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11851700B1 (en) 2020-05-13 2023-12-26 10X Genomics, Inc. Methods, kits, and compositions for processing extracellular molecules
US11661625B2 (en) 2020-05-14 2023-05-30 Becton, Dickinson And Company Primers for immune repertoire profiling
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
IL302207A (en) * 2020-10-21 2023-06-01 Illumina Inc Sequencing templates that include several additions and compositions and methods to improve sequencing output
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
EP4298244A1 (en) 2021-02-23 2024-01-03 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
CN112950101B (zh) * 2021-05-13 2021-08-17 北京富通东方科技有限公司 一种基于产量预测的汽车工厂混流线排产方法
US11753677B2 (en) 2021-11-10 2023-09-12 Encodia, Inc. Methods for barcoding macromolecules in individual cells
EP4272764A1 (en) 2022-05-03 2023-11-08 Scipio Bioscience Method of complexing biological units with particles
WO2023230553A2 (en) * 2022-05-26 2023-11-30 Illumina, Inc. Preparation of long read nucleic acid libraries
WO2023239907A1 (en) * 2022-06-09 2023-12-14 The Regents Of The University Of California Single cell co-sequencing of dna methylation and rna
WO2024137703A1 (en) * 2022-12-20 2024-06-27 Illumina, Inc. Multivalent assemblies for enhanced target hybridization

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013150611A (ja) * 2007-01-19 2013-08-08 Epigenomics Ag 細胞増殖性障害の検出のための方法及び核酸
WO2013131962A1 (en) * 2012-03-06 2013-09-12 Illumina Cambridge Limited Improved methods of nucleic acid sequencing
JP2013535986A (ja) * 2010-08-27 2013-09-19 ジェネンテック, インコーポレイテッド 核酸の捕捉法および配列決定法
JP2014506788A (ja) * 2011-02-02 2014-03-20 ユニヴァーシティ・オブ・ワシントン・スルー・イッツ・センター・フォー・コマーシャリゼーション 大量並列連続性マッピング
WO2014108810A2 (en) * 2013-01-09 2014-07-17 Lumina Cambridge Limited Sample preparation on a solid support
WO2014136930A1 (ja) * 2013-03-07 2014-09-12 積水メディカル株式会社 メチル化dnaの検出方法

Family Cites Families (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
JP2801051B2 (ja) 1988-06-24 1998-09-21 アムジエン・インコーポレーテツド 核酸塩基配列を検出するための方法及び試薬
WO1990001069A1 (en) 1988-07-20 1990-02-08 Segev Diagnostics, Inc. Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
AU635105B2 (en) 1990-01-26 1993-03-11 Abbott Laboratories Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
JP3175110B2 (ja) 1994-02-07 2001-06-11 オーキッド・バイオサイエンシーズ・インコーポレイテッド リガーゼ/ポリメラーゼ媒体された単一ヌクレオチド多型のジェネティックビットアナリシスおよび遺伝子解析におけるその使用
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5552278A (en) 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage
US5641658A (en) 1994-08-03 1997-06-24 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid with two primers bound to a single solid support
DK0889120T3 (da) 1994-12-09 2002-07-22 Imp College Innovations Ltd Virulensgener i VGC2-regionen af Salmonella
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
US5858671A (en) 1996-11-01 1999-01-12 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP1498494A3 (en) 1997-04-01 2007-06-20 Solexa Ltd. Method of nucleic acid sequencing
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
FI103809B1 (fi) 1997-07-14 1999-09-30 Finnzymes Oy In vitro -menetelmä templaattien tuottamiseksi DNA-sekventointia varten
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US20010046669A1 (en) 1999-02-24 2001-11-29 Mccobmie William R. Genetically filtered shotgun sequencing of complex eukaryotic genomes
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US20050191698A1 (en) 1999-04-20 2005-09-01 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
BR0015382B1 (pt) 1999-11-08 2014-04-29 Eiken Chemical Processos e kits para sintetizacao e amplificação do acido nucleico bem como, processos para detectar uma sequencia de nucleotideo alvo e de uma mutacao da dita sequencia
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US6828098B2 (en) 2000-05-20 2004-12-07 The Regents Of The University Of Michigan Method of producing a DNA library using positional amplification based on the use of adaptors and nick translation
CA2415897A1 (en) 2000-07-07 2002-01-17 Susan H. Hardin Real-time sequence determination
US6846658B1 (en) 2000-10-12 2005-01-25 New England Biolabs, Inc. Method for cloning and producing the Msel restriction endonuclease
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US20040110191A1 (en) 2001-01-31 2004-06-10 Winkler Matthew M. Comparative analysis of nucleic acids using population tagging
US7138267B1 (en) 2001-04-04 2006-11-21 Epicentre Technologies Corporation Methods and compositions for amplifying DNA clone copy number
US6777187B2 (en) 2001-05-02 2004-08-17 Rubicon Genomics, Inc. Genome walking by selective amplification of nick-translate DNA library and amplification from complex mixtures of templates
GB0115194D0 (en) 2001-06-21 2001-08-15 Leuven K U Res & Dev Novel technology for genetic mapping
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
US20040002090A1 (en) 2002-03-05 2004-01-01 Pascal Mayer Methods for detecting genome-wide sequence variations associated with a phenotype
DK3363809T3 (da) 2002-08-23 2020-05-04 Illumina Cambridge Ltd Modificerede nukleotider til polynukleotidsekvensering
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
WO2004042078A1 (en) 2002-11-05 2004-05-21 The University Of Queensland Nucleotide sequence analysis by quantification of mutagenesis
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
EP1594971B1 (en) 2003-02-10 2011-02-02 Max-Delbrück-Centrum für Molekulare Medizin (MDC) Transposon-based targeting system
WO2005003304A2 (en) 2003-06-20 2005-01-13 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
EP1682680B2 (en) 2003-10-31 2018-03-21 AB Advanced Genetic Analysis Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
EP1701785A1 (en) 2004-01-07 2006-09-20 Solexa Ltd. Modified molecular arrays
US7595160B2 (en) 2004-01-13 2009-09-29 U.S. Genomics, Inc. Analyte detection using barcoded polymers
US7727744B2 (en) 2004-03-30 2010-06-01 Epicentre Technologies Corporation Methods for obtaining directionally truncated polypeptides
US20080268507A1 (en) 2004-05-25 2008-10-30 Airbus Deutschland Gmbh Recombinant Dna Nicking Endonuclease and Uses Thereof
US7319142B1 (en) 2004-08-31 2008-01-15 Monsanto Technology Llc Nucleotide and amino acid sequences from Xenorhabdus and uses thereof
CN101914620B (zh) 2004-09-17 2014-02-12 加利福尼亚太平洋生命科学公司 核酸测序的方法
US7449297B2 (en) 2005-04-14 2008-11-11 Euclid Diagnostics Llc Methods of copying the methylation pattern of DNA during isothermal amplification and microarrays
EP1910537A1 (en) 2005-06-06 2008-04-16 454 Life Sciences Corporation Paired end sequencing
EP1907571B1 (en) 2005-06-15 2017-04-26 Complete Genomics Inc. Nucleic acid analysis by random mixtures of non-overlapping fragments
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20070128610A1 (en) 2005-12-02 2007-06-07 Buzby Philip R Sample preparation method and apparatus for nucleic acid sequencing
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
EP2021503A1 (en) 2006-03-17 2009-02-11 Solexa Ltd. Isothermal methods for creating clonal single molecule arrays
US8241573B2 (en) 2006-03-31 2012-08-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2008005459A2 (en) 2006-06-30 2008-01-10 Nugen Technologies, Inc. Methods for fragmentation and labeling of nucleic acids
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US20090088331A1 (en) 2006-11-07 2009-04-02 Government Of The United States Of America, As Represented By The Secretary, Dept. Of Health And Influenza virus nucleic acid microarray and method of use
US20080242560A1 (en) 2006-11-21 2008-10-02 Gunderson Kevin L Methods for generating amplified nucleic acid arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
ES2923759T3 (es) 2006-12-14 2022-09-30 Life Technologies Corp Aparato para medir analitos utilizando matrices de FET
CA2693059A1 (en) 2007-07-13 2009-01-22 The Board Of Trustees Of The Leland Stanford Junior University Method and apparatus using electric field for improved biological assays
EP2188389A4 (en) 2007-08-15 2011-12-07 Univ Hong Kong METHOD AND COMPOSITIONS FOR BISULFIT DNA SEQUENCING WITH HIGH PERFORMANCE AND BENEFITS
US8415099B2 (en) 2007-11-05 2013-04-09 Complete Genomics, Inc. Efficient base determination in sequencing reactions
WO2009092035A2 (en) 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
JP5539325B2 (ja) 2008-04-30 2014-07-02 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド 修飾されたrna単量体を用いるrnアーゼhを基礎とするアッセイ
JP5730762B2 (ja) 2008-06-30 2015-06-10 バイオナノ ジェノミックス、インク. 単一分子全ゲノム解析のための方法及び装置
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
EP2787565B1 (en) 2008-10-24 2015-09-16 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
WO2010099301A2 (en) 2009-02-25 2010-09-02 The Johns Hopkins University Piggybac transposon variants and methods of use
WO2010115122A2 (en) 2009-04-03 2010-10-07 Illumina, Inc. Generation of uniform fragments of nucleic acids using patterned substrates
ES2565563T3 (es) 2010-02-25 2016-04-05 Advanced Liquid Logic, Inc. Método para preparar bibliotecas de ácidos nucleicos
US9029103B2 (en) 2010-08-27 2015-05-12 Illumina Cambridge Limited Methods for sequencing polynucleotides
GB2497912B (en) 2010-10-08 2014-06-04 Harvard College High-throughput single cell barcoding
WO2012058096A1 (en) 2010-10-27 2012-05-03 Illumina, Inc. Microdevices and biosensor cartridges for biological or chemical analysis and systems and methods for the same
WO2012061832A1 (en) 2010-11-05 2012-05-10 Illumina, Inc. Linking sequence reads using paired code tags
US8829171B2 (en) * 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
AU2012211081B2 (en) 2011-01-28 2016-02-04 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
WO2012108864A1 (en) 2011-02-08 2012-08-16 Illumina, Inc. Selective enrichment of nucleic acids
EP2702175B1 (en) 2011-04-25 2018-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
US20130017978A1 (en) 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
JP6509723B2 (ja) 2012-03-13 2019-05-08 スウィフト バイオサイエンシーズ, インコーポレイテッド 核酸ポリメラーゼによる基質ポリヌクレオチドの大きさ制御されたホモポリマーテーリングのための方法および組成物
US9968901B2 (en) 2012-05-21 2018-05-15 The Scripps Research Institute Methods of sample preparation
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9644199B2 (en) * 2012-10-01 2017-05-09 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
WO2014124338A1 (en) 2013-02-08 2014-08-14 10X Technologies, Inc. Polynucleotide barcode generation
ES2724824T3 (es) 2013-03-13 2019-09-16 Illumina Inc Métodos para la secuenciación de ácidos nucleicos
JP6545682B2 (ja) 2013-08-28 2019-07-17 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company 大規模並列単一細胞分析
JP6608368B2 (ja) 2013-12-30 2019-11-20 アトレカ インコーポレイテッド 核酸バーコードを用いた単一細胞と関連づけられた核酸の分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013150611A (ja) * 2007-01-19 2013-08-08 Epigenomics Ag 細胞増殖性障害の検出のための方法及び核酸
JP2013535986A (ja) * 2010-08-27 2013-09-19 ジェネンテック, インコーポレイテッド 核酸の捕捉法および配列決定法
JP2014506788A (ja) * 2011-02-02 2014-03-20 ユニヴァーシティ・オブ・ワシントン・スルー・イッツ・センター・フォー・コマーシャリゼーション 大量並列連続性マッピング
WO2013131962A1 (en) * 2012-03-06 2013-09-12 Illumina Cambridge Limited Improved methods of nucleic acid sequencing
WO2014108810A2 (en) * 2013-01-09 2014-07-17 Lumina Cambridge Limited Sample preparation on a solid support
WO2014136930A1 (ja) * 2013-03-07 2014-09-12 積水メディカル株式会社 メチル化dnaの検出方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021522797A (ja) * 2018-05-03 2021-09-02 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company ハイスループットマルチオミクスサンプル解析
JP7407128B2 (ja) 2018-05-03 2023-12-28 ベクトン・ディキンソン・アンド・カンパニー ハイスループットマルチオミクスサンプル解析
JP2022544662A (ja) * 2019-08-19 2022-10-20 ユニバーサル シーケンシング テクノロジー コーポレイション 核酸シーケンシングの核酸フラグメント起源を追跡するための方法および組成物
JP7489455B2 (ja) 2019-10-25 2024-05-23 チャンピン ナショナル ラボラトリー 哺乳類dnaのメチル化の検出及び分析

Also Published As

Publication number Publication date
IL299976A (en) 2023-03-01
RU2019138705A3 (ja) 2020-05-22
US20220282242A1 (en) 2022-09-08
BR122021026779B1 (pt) 2023-12-19
RU2736728C2 (ru) 2020-11-19
AU2022201205A1 (en) 2022-03-17
IL287853A (en) 2022-01-01
RU2017116989A (ru) 2018-11-19
IL287853B2 (en) 2023-06-01
KR20220162873A (ko) 2022-12-08
SG10201903408VA (en) 2019-05-30
US20190048332A1 (en) 2019-02-14
US11873480B2 (en) 2024-01-16
BR112017007912A2 (pt) 2018-01-23
IL251737A0 (en) 2017-06-29
SG11201703139VA (en) 2017-07-28
RU2017116989A3 (ja) 2019-05-20
IL251737B (en) 2021-12-01
BR122021026781B1 (pt) 2023-11-14
KR20170107423A (ko) 2017-09-25
RU2709655C2 (ru) 2019-12-19
WO2016061517A2 (en) 2016-04-21
CA2964799A1 (en) 2016-04-21
WO2016061517A3 (en) 2016-06-23
JP7127104B2 (ja) 2022-08-29
RU2019138705A (ru) 2020-01-27
US20190040382A1 (en) 2019-02-07
JP2022172158A (ja) 2022-11-15
IL299976B1 (en) 2024-07-01
AU2015331739A1 (en) 2017-05-11
JP2021052779A (ja) 2021-04-08
AU2015331739B2 (en) 2021-12-02
KR102643955B1 (ko) 2024-03-07
KR102472027B1 (ko) 2022-11-30
JP6808617B2 (ja) 2021-01-06

Similar Documents

Publication Publication Date Title
JP7127104B2 (ja) 連続性を維持した転位
CN107969137B (zh) 接近性保留性转座
KR102640255B1 (ko) 감소된 증폭 편향을 갖는 고속-대량 단일 세포 서열분석
JP6483249B2 (ja) 単離されたオリゴヌクレオチドおよび核酸の配列決定におけるその使用
AU2012212148B8 (en) Massively parallel contiguity mapping
JP6925424B2 (ja) 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法
ES2900102T3 (es) Composiciones para la secuenciación de ácidos nucleicos en mezclas
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191029

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200129

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200609

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201209

R150 Certificate of patent or registration of utility model

Ref document number: 6808617

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250