JP2020501554A - 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法 - Google Patents

短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法 Download PDF

Info

Publication number
JP2020501554A
JP2020501554A JP2019531621A JP2019531621A JP2020501554A JP 2020501554 A JP2020501554 A JP 2020501554A JP 2019531621 A JP2019531621 A JP 2019531621A JP 2019531621 A JP2019531621 A JP 2019531621A JP 2020501554 A JP2020501554 A JP 2020501554A
Authority
JP
Japan
Prior art keywords
adapter
molecule
target
nucleic acid
stranded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019531621A
Other languages
English (en)
Other versions
JP6925424B2 (ja
Inventor
シュレヒト,ウルリヒ
モク,ジャニーン
ソー,オースティン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2020501554A publication Critical patent/JP2020501554A/ja
Application granted granted Critical
Publication of JP6925424B2 publication Critical patent/JP6925424B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/08Liquid phase synthesis, i.e. wherein all library building blocks are in liquid phase or in solution during library creation; Particular methods of cleavage from the liquid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B80/00Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Structural Engineering (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本発明は、短いDNA分子のプールから長い連結した鋳型を生成することにより、一分子シーケンス(SMS)プラットフォームのスループットを増加するシーケンスライブラリー調製の新規の方法および組成物を含む。【選択図】なし

Description

本発明は、核酸シーケンスの分野に関する。より具体的には、本発明は、一分子シーケンスのための核酸のライブラリーを作製する分野に関する。
一分子シーケンス(SMS)プラットフォーム、例えばナノポア式プラットフォームは、塩基配列がリアルタイムでDNAの個々の鎖から直接読まれることを可能にする。長いリード長が可能だが、SMSプラットフォームは現在、競合するショートリードシーケンスプラットフォームと比較して低いスループットの問題がある。同時に、多くのシーケンス用途、例えば腫瘍学および出生前検査は、本質的に、短い核酸断片、例えば母体血液またはがん患者の血液に微量で存在する無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を使用する(Newman,A.ら(2014)An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage、Nature Medicine doi:10.1038/nm.3519参照)。SMSプラットフォームの長いリード長の利点の利用のために、様々な核酸標的を適応させる方法が必要である。
いくつかの実施形態では、本発明は、試料から、連結した標的核酸分子のライブラリーを作製する方法であって、少なくとも1つの二本鎖領域を有する第1のアダプターを二本鎖標的分子の各末端に付加するステップ;試料をエキソヌクレアーゼと接触させ、標的分子の末端に、部分的に一本鎖のアダプター領域を生成するステップ;標的分子の各鎖上の部分的に一本鎖のアダプター領域をハイブリダイズさせることによって少なくとも2つの標的分子を接合させて二本鎖アダプター領域を形成し、および標的分子の鎖を共有結合させることにより、連結した標的分子を生成するステップ;1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプターを、連結した分子に付加して、それにより連結した標的核酸分子のライブラリーを生成するステップを含む方法である。第1のアダプターは、アダプター配列が組み込まれたプライマーにより標的核酸分子を増幅することによって、または標的核酸分子の末端へのライゲーションによって付加され得る。エキソヌクレアーゼは、5’−3’活性を持ち得、3’−5’活性を欠く。標的分子の接合はポリメラーゼの代用を含んでよく、ポリメラーゼは3’−5’エキソヌクレアーゼ活性を欠き得る。いくつかの実施形態では、標的分子の接合はライゲーションステップを含み得る。いくつかの実施形態では、連結した産物は、第2のアダプターを付加するステップの前に精製され得る。
いくつかの実施形態では、方法は、連結した標的核酸分子のライブラリーをシーケンスするステップをさらに含む。連結した標的核酸分子は、シーケンスの前にサイズによって分画され得る。生物学的ナノポア式法、固体ナノポア式法、および一分子リアルタイム(SMRT(登録商標))式法から選択される方法によって得られ得る。
いくつかの実施形態では、第1のアダプターは、両末端がライゲーションできるアダプターおよび1つの末端のみがライゲーションできるアダプターの混合物を含む。第1のアダプターは、5’末端から少なくとも約15塩基の位置にエキソヌクレアーゼ耐性領域を含み得る。いくつかの実施形態では、エキソヌクレアーゼ耐性領域は少なくとも1つのホスホロチオエートヌクレオチドを含む。いくつかの実施形態では、第2のアダプターは、ステムループ構造を含む。いくつかの実施形態では、第2のアダプターは、共にヘアピン構造を形成する少なくとも1つの二本鎖部分および少なくとも1つの一本鎖ループからなる。
いくつかの実施形態では、標的分子は、最初のエキソヌクレアーゼ処置の前に増幅される。いくつかの実施形態では、連結した分子は、第2のアダプターのライゲーションの前に増幅される。
いくつかの実施形態では、本発明は、少なくとも1つの二本鎖領域を有する第1のアダプターを二本鎖標的分子の各末端に付加するステップ;アダプター含有二本鎖標的分子をエキソヌクレアーゼと接触させ、標的分子の末端に、部分的に一本鎖のアダプター領域を生成するステップ;標的分子の各鎖上の部分的に一本鎖のアダプター領域をハイブリダイズさせることによって少なくとも2つの標的分子を接合させて二本鎖アダプター領域を形成し、および標的分子の鎖を共有結合させることにより、連結した標的分子を生成するステップ;1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプターを、連結した分子に付加して、それにより連結した標的核酸分子のライブラリーを生成するステップを含む方法を使用して作製された連結した標的核酸分子のライブラリーである。
いくつかの実施形態では、本発明は、少なくとも1つの二本鎖領域を有する第1のアダプター、1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプター、エキソヌクレアーゼ、核酸ポリメラーゼ、および核酸リガーゼを含む、連結した標的核酸分子のライブラリーを産生するキットである。キットは、第1のアダプター配列に相補的な増幅プライマー、熱安定性核酸ポリメラーゼおよび少なくとも4つのデオキシヌクレオシド三リン酸の混合物をさらに含み得る。
いくつかの実施形態では、本発明は、試料から、連結した標的核酸分子のライブラリーを作製する方法であって、レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;アダプターライゲート標的分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化したアダプターライゲート標的分子を接合させ、それにより連結した標的分子を生成するステップを含む。いくつかの実施形態では、アダプターは、レアカット制限エンドヌクレアーゼ認識部位が組み込まれたプライマーにより標的核酸分子を増幅することによって付加される。いくつかの実施形態では、プライマーは、標的特異的配列と分子バーコードまたは無作為配列と分子バーコードをさらに含む。アダプターは、ライゲーションによって標的核酸分子の末端に付加され得る。レアカット制限エンドヌクレアーゼ認識部位は、10以上の塩基長であり得る。レアカット制限エンドヌクレアーゼは、ホーミング制限エンドヌクレアーゼ、例えばSceIまたはVDEである。
いくつかの実施形態では、エンドヌクレアーゼ消化したアダプターライゲート標的分子は、連結のステップの前に精製される。
いくつかの実施形態では、アダプターはバーコード配列を含む。
いくつかの実施形態では、方法は、第2のアダプターを、連結した分子の少なくとも1つの末端に付加するステップをさらに含み、アダプターは少なくとも1つのシーケンスプライマー結合部位を含む。いくつかの実施形態では、方法は、連結した標的核酸分子のライブラリーをシーケンスするステップをさらに含む。連結した標的核酸分子は、例えば、沈殿剤の添加によってシーケンスの前にサイズによって分画され得る。
配列は、生物学的ナノポア式法、固体ナノポア式法、および一分子リアルタイム(SMRT(登録商標))式法から選択される方法によって得られる。
いくつかの実施形態では、本発明は、試料から、連結した標的核酸分子を作製する方法であって、レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;プライマーをアダプターライゲート標的分子の各鎖にハイブリダイズさせるステップであって、プライマーがレアカット制限エンドヌクレアーゼ認識部位を含むステップ;プライマーを伸長して、アダプターライゲート標的分子の各鎖から、各末端でレアカット制限エンドヌクレアーゼ認識部位を含有する新しい分子を形成するステップ、新しい分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化した新しい分子を接合し、それにより連結した標的分子を生成するステップを含む。プライマーは、標的特異的配列および分子バーコードを含み得る。いくつかの実施形態では、方法は、新しい分子を増幅するステップをさらに含む。いくつかの実施形態では、方法は、少なくとも1つのシーケンスプライマー結合部位を含む第2のアダプターを、連結した分子の少なくとも1つの末端に付加して、連結した標的核酸分子をシーケンスするステップをさらに含む。
いくつかの実施形態では、本発明は、レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;アダプターライゲート標的分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化したアダプターライゲート標的分子を接合し、それにより連結した標的分子を生成するステップを含む方法を使用して作製した連結した標的核酸分子のライブラリーである。
いくつかの実施形態では、本発明は、レアカット制限エンドヌクレアーゼ認識部位および分子バーコードを含むアダプター、ユニバーサルプライミング部位を含む第2のアダプター、レアカット制限エンドヌクレアーゼおよび核酸リガーゼを含む、連結した標的核酸分子のライブラリーを産生するキットである。キットは、ユニバーサルプライミング部位に相補的なプライマー、熱安定性核酸ポリメラーゼおよび少なくとも4つのデオキシヌクレオシド三リン酸の混合物をさらに含み得る。
図1a:短いDNAアンプリコンを長いコンカテマーに接合する方法を示す図である。PCRプライマー中のアダプターによる本発明の連結方法の実施形態の図である。 図1b:短いDNAアンプリコンを長いコンカテマーに接合する方法を示す図である。連結体の蓄積を示すゲル電気泳動画像の図である。図1c:短いDNAアンプリコンを長いコンカテマーに接合する方法を示す図である。連結した試料の環状コンセンサス配列リードのサイズを示すヒストグラムである。 図2a:5倍より多くシーケンススループットを増加する本発明の方法を示す図である。異なる配列特性の型および方向を示す例示的な配列リードの図である。図2b:5倍より多くシーケンススループットを増加する本発明の方法を示す図である。全てのリードで特定されたフォワードおよびリバース相補鎖方向における断片およびアダプターの数を示すヒストグラムである。 図2c:5倍より多くシーケンススループットを増加する本発明の方法を示す図である。各サイズビンにおける断片の頻度を示すヒストグラムである。図2d:5倍より多くシーケンススループットを増加する本発明の方法を示す図である。リード長およびそのリードで特定された断片の数の間の関係を示す散布図である。図2e:5倍より多くシーケンススループットを増加する本発明の方法を示す図である。全てのリードにわたるリードあたり特定された断片の数の頻度を示すヒストグラムである。 図3a:腫瘍学アンプリコンパネルにおいて一塩基変異体(SNV)を正確に特定する本発明の方法を示す図である。本発明で使用した例示的なバイオインフォマティクス分析経路の図である。図3b:腫瘍学アンプリコンパネルにおいて一塩基変異体(SNV)を正確に特定する本発明の方法を示す図である。予測頻度に対してプロットした連結試料の複製において特定された入力DNAにおける公知の一塩基変異体のアリール頻度(AF)の比較を示す散布図である。図3c:腫瘍学アンプリコンパネルにおいて一塩基変異体(SNV)を正確に特定する本発明の方法を示す図である。非連結試料で見いだされる頻度に対してプロットした連結試料の複製において特定されたAFの比較を示す散布図である。 図3d:腫瘍学アンプリコンパネルにおいて一塩基変異体(SNV)を正確に特定する本発明の方法を示す図である。非連結および連結試料の3回の複製においてアンプリコンカバー度を比較する棒プロットである。 図4a:代替の標的濃縮ワークフローへの本発明の方法の適用を示す図である。標的分子がエンドリペアおよびAテーリング(ERAT)によりアダプターライゲーションのために調製される本発明の連結方法の実施形態の図である。 図4b:代替の標的濃縮ワークフローへの本発明の方法の適用を示す図である。連結体の蓄積を示すゲル電気泳動画像を示す図である。図4c:代替の標的濃縮ワークフローへの本発明の方法の適用を示す図である。コンカテマーリードの連結解除後の断片長の頻度を示すヒストグラムである。 連結の間にどのようにアダプターおよび標的配列がアセンブルするかを示す図である。図5aは、一方向の標的−アダプター組合せを示す図である。図5bは、別の方向の標的−アダプター組合せを示す図である。図5cは、図5aおよび図5bに示す「連結単位」が2つの異なる方法でアセンブルできることを示す図である。 図6a:連結した標的配列のシーケンスを示す図である。連結体の蓄積を示すゲル電気泳動画像を示す図である。図6b:連結した標的配列のシーケンスを示す図である。低分子量DNAラダーの電気泳動図を示す図である。 図6c:連結した標的配列のシーケンスを示す図である。アダプターライゲーションおよびアダプターライゲート断片の選択的増幅後の電気泳動図を示す図である。図6d:連結した標的配列のシーケンスを示す図である。LMWコンカテマーシーケンスランとアダプターライゲートおよびPCR増幅LMWによるランからのシーケンス断片の数を比較する散布図である。 アダプターライゲーションによる方法の変化を示す図である。 プライマー伸長による方法の変化を示す図である。 ライゲーションに続くプライマー伸長による方法の変化を示す図である。 サイズ制御連結実験の結果を示す図である。
第1の態様では、本発明は、試料から、連結した標的核酸分子のライブラリーを作製する方法であって、
a.少なくとも1つの二本鎖領域を有する第1のアダプターを二本鎖標的分子の各末端に付加するステップ;
b.試料をエキソヌクレアーゼと接触させ、標的分子の末端に、部分的に一本鎖のアダプター領域を生成するステップ;
c.標的分子の各鎖上の部分的に一本鎖のアダプター領域をハイブリダイズさせることによって少なくとも2つの標的分子を接合させ、二本鎖アダプター領域を形成するステップ、および標的分子の鎖を共有結合させ、それにより連結した標的分子を生成するステップ;ならびに
d.1つまたは複数のバーコード、ユニバーサル増幅プライミング部位、およびシーケンスプライミング部位を含む第2のアダプターを、連結した分子に付加して、それにより連結した標的核酸分子のライブラリーを生成するステップ
を含む方法を提供する。
第1のアダプターは、アダプター配列が組み込まれたプライマーにより標的核酸分子を増幅することによって、または標的核酸分子の末端へのライゲーションによって付加され得る。
ステップbのエキソヌクレアーゼは、5’−3’活性を持ち、3’−5活性を欠き得る。
ステップcの標的分子の接合は、ポリメラーゼの代用を含む。次いでポリメラーゼは3’−5’エキソヌクレアーゼ活性を欠き得る。
ステップcの標的分子の接合はライゲーションステップを含み得る。連結した産物は、第2のアダプターを付加するステップの前に精製される。本発明の方法は、連結した標的核酸分子のライブラリーをシーケンスするステップをさらに含み得る。この場合、連結した標的核酸分子は、シーケンスの前にサイズによって分画され得る。生物学的ナノポア式法、固体ナノポア式法、および一分子リアルタイム(SMRT(登録商標))式法から選択される方法によって得られ得る。
第1のアダプターは、両末端がライゲーションできるアダプターおよび1つの末端のみがライゲーションできるアダプターの混合物を含み得る。第1のアダプターは、5’末端から少なくとも約15塩基の位置にエキソヌクレアーゼ耐性領域も含み、少なくとも1つのホスホロチオエートヌクレオチドを含み得る。第2のアダプターは、ステムループ構造を含んでよく、または共にヘアピン構造を形成する少なくとも1つの二本鎖部分および少なくとも1つの一本鎖ループからなってよい。
標的分子が、ステップbのエキソヌクレアーゼ処置の前に増幅され得る、請求項1に記載の方法。連結した分子は、ステップdの第2のアダプターのライゲーションの前に増幅される。
第2の態様では、本発明は、
a.少なくとも1つの二本鎖領域を有する第1のアダプターを二本鎖標的分子の各末端に付加するステップ;
b.アダプター含有二本鎖標的分子をエキソヌクレアーゼと接触させ、標的分子の末端に、部分的に一本鎖のアダプター領域を生成するステップ;
c.標的分子の各鎖上の部分的に一本鎖のアダプター領域をハイブリダイズさせることによって少なくとも2つの標的分子を接合させて二本鎖アダプター領域を形成し、および標的分子の鎖を共有結合させることにより、連結した標的分子を生成するステップ;
d.1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプターを、連結した分子に付加して、それにより連結した標的核酸分子のライブラリーを生成するステップ
を含む方法を使用して作製された連結した標的核酸分子のライブラリーを提供する。
第3の態様では、本発明は、少なくとも1つの二本鎖領域を有する第1のアダプター、1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプター、エキソヌクレアーゼ、核酸ポリメラーゼ、および核酸リガーゼを含む、連結した標的核酸分子のライブラリーを産生するキットを提供する。キットは、第1のアダプター配列に相補的な増幅プライマー、熱安定性核酸ポリメラーゼおよび少なくとも4つのデオキシヌクレオシド三リン酸の混合物をさらに含み得る。
第4の態様では、本発明は、試料から、連結した標的核酸分子のライブラリーを作製する方法であって、
a.レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;
b.アダプターライゲート標的分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;
c.部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化したアダプターライゲート標的分子を接合させ、それにより連結標的分子を生成するステップ
を含む方法を提供する。
アダプターは、レアカット制限エンドヌクレアーゼ認識部位が組み込まれたプライマーにより標的核酸分子を増幅することによって付加され得る。プライマーは、標的特異的配列および分子バーコードをさらに含み得る。前記レアカット制限エンドヌクレアーゼ認識部位は、少なくとも10塩基長であり得る。レアカット制限エンドヌクレアーゼは、ホーミング制限エンドヌクレアーゼであってよく、またはSceIおよびVDEから選択されてよい。エンドヌクレアーゼ消化したアダプターライゲート標的分子は、連結のステップの前に精製される。アダプターはバーコード配列も含み得る。
前記方法は、第2のアダプターを、連結した分子の少なくとも1つの末端に付加するステップをさらに含んでよく、アダプターは少なくとも1つのシーケンスプライマー結合部位を含む。次いで、連結した標的核酸分子のライブラリーをシーケンスするさらなるステップが実行され得る。この場合、連結した標的核酸分子は、重合体の沈殿剤の添加によってシーケンスの前にサイズによって分画され得る。
第5の態様では、本発明は、試料から、連結した標的核酸分子を作製する方法であって、
a.レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;
b.プライマーをアダプターライゲート標的分子の各鎖にハイブリダイズさせるステップであって、プライマーがレアカット制限エンドヌクレアーゼ認識部位を含むステップ;
c.プライマーを伸長して、アダプターライゲート標的分子の各鎖から、各末端でレアカット制限エンドヌクレアーゼ認識部位を含有する新しい分子を形成するステップ;
d.新しい分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;
e.部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化した新しい分子を接合し、それにより連結標的分子を生成するステップ
を含む方法を提供する。
プライマーは、標的特異的配列を含んでよく、分子バーコードをさらに含み得る。方法は、ステップcの後に新しい分子を増幅するステップをさらに含み得る。方法は、少なくとも1つのシーケンスプライマー結合部位を含む第2のアダプターを、連結した分子の少なくとも1つの末端に付加するステップも含み得る。この場合、連結した標的核酸分子をシーケンスするステップが追加され得る。
第6の態様では、本発明は、
a.レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;
b.アダプターライゲート標的分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;
c.部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化したアダプターライゲート標的分子を接合し、それにより連結した標的分子を生成するステップ
を含む方法を使用して作製した連結した標的核酸分子のライブラリーを提供する。
第7の態様では、本発明は、レアカット制限エンドヌクレアーゼ認識部位および分子バーコードを含むアダプター、ユニバーサルプライミング部位を含む第2のアダプター、レアカット制限エンドヌクレアーゼおよび核酸リガーゼを含む、連結した標的核酸分子のライブラリーを産生するキットを提供する。
定義
以下の定義は本開示の理解を助ける。
用語「試料」は、標的核酸を含有するまたは含有すると推定される任意の組成物を指す。これは個体から単離された組織または体液の試料、例えば、皮膚、血漿、血清、髄液、リンパ液、滑液、尿、涙、血液細胞、臓器および腫瘍、ならびに個々の患者またはモデル生物から採取した細胞から確立されたin vitro培養の試料を含み、ホルマリン固定パラフィン包埋組織(FFPET)およびそこから単離された核酸を含む。試料は、無細胞材料、例えば無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含有する無細胞血液分画も含み得る。
用語「核酸」は、DNA、RNA、およびそれらのサブカテゴリー、例えばcDNA、mRNA等を含む、ヌクレオチド(例えば、リボヌクレオチドおよびデオキシリボヌクレオチド、天然と非天然の両方)のポリマーを指す。核酸は、一本鎖または二本鎖であってよく、通常5’−3’リン酸ジエステル結合を含有するが、いくつかの場合では、ヌクレオチド類似体は他の結合を有し得る。核酸は天然に生じる塩基(アデノシン、グアノシン、シトシン、ウラシルおよびチミジン)ならびに非天然の塩基を含み得る。非天然の塩基のいくつかの例は、例えばSeelaら(1999)Helv.Chim.Acta82:1640に記載のものを含む。非天然の塩基は、例えば核酸二重鎖の安定性を増加し、ヌクレアーゼ消化を阻害し、またはプライマー伸長もしくは鎖の重合を遮断する、特別な機能を有し得る。
用語「コンカテマー(concatemer)」および「連結体(concatenate)」は交換可能に使用され、より短い核酸を共有結合することによって生成された長い連続的な核酸分子を指す。
用語「ポリヌクレオチド」および「オリゴヌクレオチド」は交換可能に使用される。ポリヌクレオチドは一本鎖または二本鎖核酸である。オリゴヌクレオチドは、より短いポリヌクレオチドを記載するために使用されることがある用語である。オリゴヌクレオチドは、少なくとも6個のヌクレオチドまたは約15〜30個のヌクレオチドから構成され得る。オリゴヌクレオチドは、当技術分野で公知の任意の好適な方法、例えば、Narangら(1979)Meth.Enzymol.68:90−99;Brownら(1979)Meth.Enzymol.68:109−151;Beaucageら(1981)Tetrahedron Lett.22:1859−1862;Matteucciら(1981)J.Am.Chem.Soc.103:3185−3191に記載されるように直接化学合成を含む方法によって調製される。
用語「プライマー」は、標的核酸内の配列(「プライマー結合部位」)とハイブリダイズし、そのような合成に好適な条件下で核酸の相補鎖に沿って合成の開始点として作用することができる一本鎖オリゴヌクレオチドを指す。プライマー結合部位は各標的に特有であり、全ての標的に添加され得る(「ユニバーサルプライミング部位」または「ユニバーサルプライマー結合部位」)。
用語「アダプター(adaptor)」または「アダプター(adapter)」は交換可能に使用され、さらなる特性をその配列に持たせるように別の配列に添加され得るヌクレオチド配列を意味する。アダプターは、典型的には、一本鎖または二本鎖であってよく、一本鎖部分と二本鎖部分の両方を有し得るオリゴヌクレオチドである。アダプターは、バーコードおよびユニバーサルプライマーまたはプローブ部位などの配列を含有し得る。
用語「ライゲーション」は、1つの分子の5’−リン酸基が別の分子の3’−ヒドロキシル基と反応する、2つの核酸鎖を接合する縮合反応を指す。ライゲーションは、典型的には、リガーゼまたはトポイソメラーゼによって触媒される酵素反応である。ライゲーションは、2つの一本鎖を接合して1つの一本鎖分子を作製することができる。ライゲーションはまた、それぞれ二本鎖分子に属する2つの鎖を接合することができ、したがって2つの二本鎖分子を接合する。ライゲーションはまた、二本鎖分子の両鎖を別の二本鎖分子の両鎖に接合することができ、したがって2つの二本鎖分子を接合する。ライゲーションはまた、二本鎖分子内の鎖の2つの末端を接合することもでき、したがって二本鎖分子のニックを修復する。
用語「バーコード」は、検出および特定され得る核酸配列を指す。バーコードは、様々な核酸に組み込まれ得る。バーコードは、例えば2、5、10ヌクレオチドなど、十分長く、試料において、バーコードを組み込んだ核酸はバーコードによって区別され、グループ分けされ得る。
用語「マルチプレックス識別子」および「MID」は、標的核酸の供給源(例えば、核酸が由来する試料)を特定するバーコード(複数の試料からの核酸が合わされている場合必要とされる)を指す。同じ試料に由来する全てのまたは実質的に全ての標的核酸は、同じMIDを共有する。異なる供給源または試料由来の標的核酸は混合され、同時にシーケンスされ得る。MIDを使用して、配列リードは、標的核酸が生じる個々の試料に割り当てられ得る。
用語「ユニーク分子識別子」および「UID」は、それが付加される核酸を特定するバーコードを指す。同じ試料由来の全てのまたは実質的に全ての標的核酸は、異なるUIDを有する。同じ起源の標的核酸に由来する全てのまたは実質的に全ての子孫(例えば、アンプリコン)は同じUIDを共有する。
用語「ユニバーサルプライマー」および「ユニバーサルプライミング結合部位」または「ユニバーサルプライミング部位」は、プライマーおよび(典型的には、in vitroで添加される)異なる標的核酸に存在するプライマー結合部位を指す。例えば、ユニバーサルプライミング部位は、複数の標的核酸にライゲートしたアダプターに含まれ得る。ユニバーサルプライミング部位は、例えば標的特異的プライマーの5’末端に添加されることによって標的特異的(非ユニバーサル)プライマーの部分でもあり得る。ユニバーサルプライマーは、ユニバーサルプライミング部位に結合し、ユニバーサルプライミング部位からプライマー伸長を導き得る。
本明細書で使用する場合、用語「標的配列」、「標的核酸」または「標的」は、検出または分析される試料における核酸配列の部分を指す。用語「標的」は、標的配列の全ての変異体、例えば1つまたは複数の変異型変異体および野生型変異体を含む。
用語「シーケンスする」は、標的核酸におけるヌクレオチドの配列を決定する任意の方法を指す。
DNAシーケンスのコストは、ムーアの法則を超える速さでここ10年の間に劇的に減少した。本発明者らは、全ヒトゲノムをシーケンスするのにかかるコストが$1,000より少ない時代に急速に近づいているが、試薬のコスト、インフォーマティクス基盤、試料調製の時間およびシーケンスにより、多くの複雑なゲノムを解読することが依然として実現できていない。このため、目的の情報を含有するゲノムの一部を選択的に濃縮する複数の「標的濃縮」方法が近年開発された。これらの戦略は、シーケンスコストを下げ、シーケンスの深度を上げ、シーケンス時間を短縮し、データ分析を単純にする有効な方法を提供し、ヒトの疾患を引き起こし得るゲノム多型の検出に広く適用される。最も一般的な濃縮方法としては、マルチプレックスPCR、分子反転プローブ、およびハイブリッド捕捉がある。これらの標的濃縮手法は、典型的には、MiSeqおよびHiSeqシステムによって例示されるペアエンドリードによるアレイ式のクラスター生成方法など、ショートリードシーケンスプラットフォームに理想的には好適な、短いDNA分子(100〜300bp)を含有するシーケンスライブラリーを生成する。(Illumina、San Diego、Cal.)しかしながら、一分子リアルタイム(SMRT(登録商標))およびナノポア式シーケンスなど、代替のシーケンスプラットフォームが魅力的になりつつある。
例えば、一分子リアルタイム(SMRT(登録商標))技術(Pacific BioSciences、Menlo Park、Cal.)は、DNAポリメラーゼが両鎖にわたる複数のパスによって数キロベースより長いリードを生成し得る、標的核酸の両鎖を含有する環状鋳型を使用する。これらの多重パスからの情報は単一パスあたりの比較的高いエラー率を軽減し、正確性の高い環状コンセンサス配列(CCS)リードを生成するために使用される。ナノポアベースのシーケンスは、短いリンカーによって膜包埋ナノポアタンパク質に結合した単一DNAポリメラーゼを含む。鋳型および4つのユニークにタグ付けしたヌクレオチドが添加され、DNA合成が開始する。三元複合体の形成の間に、ポリメラーゼは相補的なタグ付けされたヌクレオチドに結合する;ヌクレオチドに特異的なタグは次いでポアに捕捉される。各タグは、異なるサイズ、質量、または電荷を持つように設計され、それらは特徴的な電流遮断特性を生成するため、添加された塩基をユニークに特定する。Strangesら(2016)Design and characterization of a nanopore−coupled polymerase for single−molecule DNA sequencing by synthesis on an electrode array.PNAS113(44):E6749参照。
ロングリード技術、例えばSMRT(登録商標)およびナノポア式法は、de novoゲノムアセンブリ、複雑な構造多型の検出およびゲノムの伸長した繰り返し領域の特徴付けのためのショートリードシーケンサーの現在の制限に立ち向かう。
しかしながら、これらのロングリード技術は現在、低いシーケンススループットの問題がある。いくつかの現在利用可能なシステムでは、ランあたりに生成されるリードの数は典型的には数万である。新世代の装置は、シーケンススループットをおよそ7倍に増加すると予想されるが、依然としてショートリードシーケンサーと比較してかなり低いスループットである。これは、循環腫瘍DNA(ctDNA)またはホルマリン固定したパラフィン包埋組織(FFPET)から抽出されたDNAを含む無細胞DNA(cfDNA)など、短いDNA分子を含む、シーケンス用途を考慮した挑戦を提示する。短いDNA断片が長いDNA鋳型へと連結される新規の試料調製戦略は、一分子シーケンサーのスループットを増加し得る。さらに、そのような方法は、これらのプラットフォームの多用途性を増加し、コスト効率の良い方法で長いおよび短いDNA分子両方をシーケンスする。
近年、合成生物学コミュニティーは、ゲノム工学ならびに高付加価値生体分子、例えば医薬およびバイオ燃料などの産生のために、遺伝子または遺伝子クラスターへとDNA断片を連結する様々な分子生物学的方法を開発してきた。例えば、ギブソン・アセンブリは3つの酵素:5’エキソヌクレアーゼ、DNAポリメラーゼ、およびDNAリガーゼを利用して、単一のワンポット等温反応で相補的な末端とDNA断片を共有結合させる方法である(米国特許第8,968,999号参照)。ほとんどのギブソン・アセンブリ適用では、連結された断片はベクターにクローニングされ、続いて所望の構築物の配列検証のため細菌によって継代される。
一実施形態では、本発明は、シーケンスのための連結された核酸のライブラリーを生成する方法である。図1aおよび図4aは本発明に記載の方法の例を示す。
本発明は、核酸シーケンスのための試料から標的核酸のライブラリーを生成するステップを含む。試料中の全ての核酸を含む複数の核酸は、本明細書に記載の方法および組成物を使用してライブラリー分子へと転換され得る。いくつかの実施形態では、試料は対象または患者に由来する。いくつかの実施形態では、試料は、例えば生検により対象または患者由来の固体組織または固体腫瘍の断片を含み得る。試料はまた、体液(例えば、尿、痰、血清、血漿またはリンパ液、唾液、痰、汗、涙、脳脊髄液、羊水、滑液、心膜液、腹水、胸水、嚢胞液、胆汁、胃液、腸液、または糞便試料)も含み得る。試料は、正常または腫瘍細胞が存在し得る全血または血液分画を含み得る。いくつかの実施形態では、試料、特に液体試料は、無細胞材料、例えば無細胞腫瘍DNAまたは腫瘍RNAを含む無細胞DNAまたはRNAなどを含み得る。いくつかの実施形態では、試料は無細胞試料、例えば無細胞腫瘍DNAまたは腫瘍RNAが存在する無細胞血液由来試料である。他の実施形態では、試料は、培養試料、例えば、培養中の細胞または培養中に存在する感染因子由来の核酸を含有するまたは含有すると考えられる培養または培養上清である。いくつかの実施形態では、感染因子は、細菌、原生動物、ウイルスまたはマイコプラズマである。試料はまた、生物由来の核酸を含有するまたは含有すると考えられる環境試料であってもよい。
標的核酸は、試料中に存在し得る目的の核酸である。いくつかの実施形態では、標的核酸は遺伝子または遺伝子断片である。いくつかの実施形態では、全ての遺伝子、遺伝子断片および遺伝子間領域(全ゲノム)が標的核酸を構成する。いくつかの実施形態では、ゲノムの部分のみ、例えばゲノムのコード領域(エクソーム)のみが標的核酸を構成する。いくつかの実施形態では、標的核酸は、一塩基多型もしくは変異体(SNVのSNP)、または例えば遺伝子融合をもたらす遺伝的再編成を含む、遺伝的変異体、例えば多型の遺伝子座を含有する。いくつかの実施形態では、標的核酸は、バイオマーカー、すなわちその変異体が疾患または症状と関連する遺伝子を含む。他の実施形態では、標的核酸は特定の生物に特有であり、生物、または薬物感受性もしくは薬物耐性など病原菌の特性の特定に役立つ。さらに他の実施形態では、標的核酸は、例えば、対象のユニークなHLAまたはKIR遺伝子型を規定するHLAまたはKIR配列など、ヒト対象に特有である。
本発明の実施形態では、1つまたは複数の標的核酸は、本発明の鋳型形状に転換される。いくつかの実施形態では、標的核酸は一本鎖形態で天然に生じる(例えば、mRNA、マイクロRNA、ウイルスRNAを含むRNA;または一本鎖ウイルスDNA)。他の実施形態では、標的核酸は二本鎖形態で天然に生じる。当業者は、本発明の方法は複数の実施形態を有すると認識する。一本鎖標的核酸は二本鎖形態に転換され、次いで図1に示したステップに供され得る。より長い標的核酸は配列特異的方法(制限酵素)または非特異的方法(超音波処理)によって断片化され得るが、いくつかの適用では、より長い標的核酸はより長いリードを達成することが望まれ得る。いくつかの実施形態では、標的核酸は、例えば、環状無細胞DNA(cfDNA)または化学的に保存もしく保管された試料に見いだされるものなどの化学的に分解されたDNAなど、自然に断片化される。
第1のステップでは、複数の二本鎖DNA分子が提供される。いくつかの実施形態では、二本鎖DNA分子は、単離されたゲノムDNAまたは複雑度が低減されたゲノムDNAであってよい(例えば、ゲノムの増幅した選択領域またはゲノムの捕捉した選択領域、例えばエクソーム)。いくつかの実施形態では、二本鎖DNAはRNAの逆転写、または一本鎖核酸を二本鎖核酸にコピーする他の方法の結果である。
次のステップでは、二本鎖DNA分子は第1のアダプターに各末端で付加される。
一実施形態では、アダプターは制限酵素認識配列を含有する。アダプターは、ゲノム中でまれに生じるレアカット認識配列を含有することが好ましい。いくつかの実施形態では、認識配列は10以上の塩基長である。いくつかの実施形態では、認識配列は、制限消化断片の方向性接合を確実にする非パリンドロームである。多くのそのような酵素が当技術分野で公知である。Bhagwat,A.、(1992)Restriction enzymes:Properties and use、Methods in Enzymology216:199参照。いくつかの実施形態では、制限エンドヌクレアーゼは、SceIまたはVDEなど、ホーミングイントロンコードエンドヌクレアーゼである。これらのエンドヌクレアーゼは、極端に長い認識配列(18塩基対まで)を有し、これは哺乳動物のゲノムにおいて1度より多く起こらないようであり、さらにこれらのエンドヌクレアーゼは、断片の方向性接合を確実にする非対称のカットを生成する、Jasin,M.(1996)Genetic manipulation of genomes with rare−cutting endonucleases、Trends in Genetics12:224参照。
いくつかの実施形態では、鋳型DNA分子はアダプターに各末端でライゲートされ、両側に制限酵素認識配列を有する。制限酵素消化後、複数の鋳型DNA分子は互いに接合され得る。(図1)。アダプターは、分子バーコードおよびユニバーサルプライマー部位を含むさらなる配列を含み得る。いくつかの実施形態では、アダプターは最適な長さおよびGC含量を有するように設計される。いくつかの実施形態では、約10、15、20、30または40bp長のアダプターが使用される。いくつかの実施形態では、アダプター配列のGC含量は約30%、40%または50%である。
いくつかの実施形態では、アダプターは、標的特異的部分およびアダプター部分を含む伸長するプライマーを介して付加される。いくつかの実施形態では、プライマーが使用され、プライマー伸長産物またはアンプリコンがアダプター配列を含有するプライマー伸長またはDNA増幅(例えば、PCR)が実施される。いくつかの実施形態では、1回のプライマー伸長または増幅が実施される。他の実施形態では、1回のプライマー伸長または増幅は、標的特異的部分およびユニバーサルプライマー結合部位を含むプライマーを使用する。2回目のプライマー伸長または増幅は、アダプター配列を含むユニバーサルプライマーを使用する。
いくつかの実施形態では、アダプターは二本鎖標的核酸にライゲートされる。アダプターは、少なくとも1つのライゲート可能な二本鎖部分を含む。標的核酸は、ライゲーションに好適な末端を含み、または酵素的に処理されそのような末端を獲得する。いくつかの実施形態では、標的核酸の端は「研磨され」、すなわち核酸ポリメラーゼによって伸長され二本鎖末端を確実にした。いくつかの実施形態では、標的核酸の5’末端がリン酸化される。いくつかの実施形態では、ライゲーションは平滑末端ライゲーションである。いくつかの実施形態では、ライゲーションは粘着末端ライゲーションである。標的核酸の3’末端は、単一ヌクレオチド(例えばA)によって伸長され、アダプターは工学的に操作され、3’末端に相補的なオーバーハング(例えばT)を含有する。
いくつかの実施形態では、制限酵素認識配列は、標的特異的部分および制限酵素認識配列を含む伸長するプライマーを介して付加される。(図8)。いくつかの実施形態では、ハイブリッド手法が使用される。二本鎖アダプターは、所望の方向で制限酵素認識配列を持つように設計される。アダプターはDNA断片の両末端にライゲートされる(図9)。アダプターライゲーション後、標的特異的伸長プライマーが各鎖((+)または(−)鎖)に使用され、鎖特異的ID(SID)と制限酵素認識配列の両方を所望の方向で持つ。プライマーは、1つの鎖にハイブリダイズされるか、または2つのプライマーがアダプターライゲート標的分子の各鎖に別々にハイブリダイズされる。標的特異的プライマーおよびアダプターに存在するプライマー結合部位にハイブリダイズするプライマーは、試料から所望の標的分子のみの増幅、例えばPCRによる、を可能にする。増幅産物は、制限酵素認識配列に対して所望の方向で標的DNA断片を含む。
制限エンドヌクレアーゼが導入され、アダプター−ライゲート分子またはプライマー伸長の産物の末端が消化される。消化は、特定の方向でのみ接合され得る部分的に一本鎖の末端を有する非対称の分子を生成する。
次のステップでは、アダプター−ライゲート標的分子が接合され、連結体が形成される。いくつかの実施形態では、少なくとも2つ、少なくとも3つ、および最大5、10以上まで、標的分子は連結体に接合される。この戦略は、各単位が所望の方向を持つ連結体の作製を可能にし、下流における特定および連結体内の各標的分子における配列情報のデコンボリューションを促進する。例えば、UIDの使用は、分子のコンセンサスが得られるように、同じオリジナル配列由来の分子の特定を可能にする。そのような手法は、がんと関連する変異体の検出のため、臨床由来の材料を典型的に表す短いDNA断片からの情報の照合に幅広い適用を有する。
いくつかの実施形態では、より短い核酸のプール(一緒に連結される)は1つの特定の種のみからなり、したがって生成される「コンカテマー」または「連結体」は、複数コピーの同じ短い核酸分子を含有する。いくつかの実施形態では、より短い核酸のプール(一緒に連結される)は、複数の異なる核酸種からなり、したがって生成される「コンカテマー」または「連結体」は、異なる短い核酸分子からなる(いくつかの場合では、それは複数コピーで生じ得る)。いくつかの実施形態では、より短い核酸のプールは、コンカテマーへとそれらを一緒に連結させる前に、標的濃縮手法(例えば、限定はされないが、ハイブリッド捕捉、マルチプレックスPCR、分子反転プローブ(MIP)技術)によって事前に選択される。いくつかの実施形態では、短い核酸のプールは、特定の標的領域を濃縮されず、試料の核酸分子の全集団を表す(例えば、ゲノムDNAまたは無細胞DNA)。
いくつかの実施形態では、連結は無作為な形式で生じる;新しい単位は増殖するコンカテマーの両末端に添加され得る。単量体は徐々に枯渇され、高度なコンカテマー(例えば、二量体、三量体、四量体等、総称してn量体と呼ばれる)が生成される。図1bに示した実施形態では、n量体の観察された長さはほぼ正確に予測されたサイズであった。
いくつかの実施形態では、接合ステップは、別々の分子の相補的または少なくとも部分的に相補的な一本鎖末端の生成およびハイブリダイゼーションを含む。いくつかの実施形態では、相補的または少なくとも部分的に相補的な一本鎖末端は、アダプター−ライゲート標的核酸分子を、5’−3’活性を有するエキソヌクレアーゼと接触させることによって生成される。いくつかの実施形態では、エキソヌクレアーゼは検出可能な3’−5’活性を欠損する。いくつかの実施形態では、エキソヌクレアーゼは、エキソヌクレアーゼT5、エキソヌクレアーゼT7、ラムダエキソヌクレアーゼ、エキソヌクレアーゼVIIIトランケートおよびそれらの混合物から選択される。
いくつかの実施形態では、接合ステップは、DNAポリメラーゼを利用して、別々の分子の相補的または少なくとも部分的に相補的な一本鎖末端のハイブリダイゼーションによって形成される構造のギャップを埋める。いくつかの実施形態では、DNAポリメラーゼは検出可能な3’−エキソヌクレアーゼ活性を欠損する。いくつかの実施形態では、DNAポリメラーゼは熱安定性である。いくつかの実施形態では、DNAポリメラーゼは、Taqポリメラーゼ、AmpliTaqポリメラーゼおよびAmpliTaq Gold(登録商標)ポリメラーゼから選択される。
いくつかの実施形態では、接合ステップは、DNAリガーゼを利用して、DNAポリメラーゼによって伸長された鎖をシールする。いくつかの実施形態では、DNAリガーゼは熱安定性である。いくつかの実施形態では、DNAリガーゼは、T4 DNAリガーゼ、T3 DNAリガーゼおよびそれらの混合物から選択される。
いくつかの実施形態では、連結された標的分子は、サイズによって分画され、好ましいサイズがさらなる分析のために選択される。いくつかの実施形態では、より大きい断片を濃縮する分画は(より高次の連結体)、例えば密集剤の存在下での磁気ビーズ捕捉など磁気ビーズ捕捉(固相可逆的固定化(SPRI)技術)、パルスフィールドゲル電気泳動を含む分取ゲル電気泳動による。
いくつかの実施形態では、本発明は連結反応の間に生成されたコンカテマーの最大長を制御する手段を含む。いくつかの実施形態では、連結は、両末端がライゲート可能なアダプターと1つの末端のみがライゲート可能な「有毒な」アダプターの混合物を使用することによって制限される。好適な(典型的にははるかにより少ない)濃度の「有毒な」アダプターを封じることにより、さらなるライゲーションによってもはや伸長され得ない、キャッピングされた連結体を生じる。いくつかの実施形態では、「有毒な」アダプターは、ライゲート可能な二本鎖末端およびライゲート不可能な閉ループのヘアピン末端を含む。いくつかの実施形態では、「有毒な」アダプターは、ライゲート可能なリン酸化末端およびライゲート不可能な非リン酸化末端を含む。いくつかの実施形態では、「有毒な」アダプターは、本方法のシーケンスステップに使用される第2のアダプターである(以下にさらに詳細に記載する)。さらに別の実施形態では、コンカテマーの長さは、アルカリフォスファターゼ活性を有する酵素を反応に導入することによって制御され、ライゲーションに利用可能なアダプターのリン酸化末端の数を制限する。
さらに他の実施形態では、連結体のサイズはサイズ依存的沈殿によって制御される。例えば、ポリマー沈殿剤の存在下でのライゲーション反応のインキュベーション。いくつかの実施形態では、沈殿剤は、所望のサイズを超える沈殿DNAに公知の濃度のポリエチレングリコール(PEG)、例えばPEG2000、4000、6000または8000である。いくつかの実施形態では、沈殿は固体支持体上で起こり、添加剤、例えばMg2+などの陽イオンによって制御または増強され得る。いくつかの実施形態では、MgCl(例えば、5mM、10mM、20mMまたはそれ以上の濃度)の添加は、連結体が特定のサイズに達する場合、固体支持体上で連結体の沈殿を駆動する。
次のステップでは、連結した標的分子は第2のアダプターと接合される。いくつかの実施形態では、第2のアダプターは、アダプターライゲート連結標的分子のシーケンスを可能にする。いくつかの実施形態では、第2のアダプターは、特定のシーケンスプラットフォーム、例えば、シーケンスプライマー結合部位に必要なエレメントを含有する。いくつかの実施形態では、アダプターは、例えば米国特許第8455193号に記載のように、二本鎖ステム部分と一本鎖ループ部分を含むヘアピンアダプターである。
いくつかの実施形態では、アダプターは、1つまたは複数のバーコードを含む。バーコードは、試料が混合(マルチプレックス)される場合、試料の起源を特定するために使用されるマルチプレックス試料ID(MID)であり得る。バーコードはまた、各オリジナル分子およびその子孫を特定するために使用されるユニーク分子ID(UID)としても寄与し得る。バーコードはまた、UIDとMIDの組合せでもあり得る。いくつかの実施形態では、単一のバーコードは、UIDとMIDの両方として使用される。別の型のバーコードは、標的分子の各鎖、例えば(+)および(−)鎖をマークするように設計された鎖バーコード(SID)である。
いくつかの実施形態では、各バーコードは、前定義された配列を含む。他の実施形態では、バーコードは無作為配列を含む。バーコードは1〜20ヌクレオチド長であってよい。
いくつかの実施形態では、アダプターは、少なくとも1つのユニバーサルプライマーのプライマー結合部位をさらに含む。プライマー結合部位はプライマーに相補的な配列であり、プライマーが結合し鎖の伸長を促進し得る。
いくつかの実施形態では、アダプターは1つより多くの、例えば2つのプライマー結合部位を有する。いくつかの実施形態では、1つのプライマーは、例えばPCR(非対称PCRを含む)、線形増幅、またはローリングサークル複製(RCA)による増幅のために使用される。
アダプターライゲート連結標的核酸のライブラリーはシーケンスされ得る。本発明の方法によって作製された鋳型ライブラリーは、長いリードが可能な一分子シーケンス(SMS)技術に特に有利である。そのような技術の例としては、SMRT(登録商標)技術(Pacific Biosciences、Menlo Park、Cal.)を利用するPacific BioSciencesプラットフォーム、またはOxford Nanopore Technologies(Oxford、UK)によって製造された生物学的ナノポア式装置またはRoche Genia(Santa Clara、Cal.)または、例えば、国際出願公開第2016/142925号およびStrangesら(2016)Design and characterization of a nanopore−coupled polymerase for single−molecule DNA sequencing by synthesis on an electrode array.PNAS113(44):E6749に記載の固体ナノポア式装置、ならびに長いリードに好適な任意の他の現在既存のまたは将来的な一分子シーケンス技術が挙げられる。
いくつかの実施形態では、シーケンスステップは配列分析を含む。配列分析は1次および2次分析を含み得る。いくつかの実施形態では、1次分析は、シーケンス装置とインターフェースを取り、装置によって回収されたシグナル(例えば、蛍光または電気的な)をベースコールへと変換するソフトウェアによって実施される分析を含む。いくつかの実施形態では、2次分析は1次配列に実施され、配列アラインを含む。いくつかの実施形態では、2次分析は連結解除をさらに含む。
いくつかの実施形態では、連結解除は慎重なステップを含む。いくつかの実施形態では、方法は、スキャンウィンドウが各リードに沿ってスライドし、予測されるアダプター配列とほぼ一致させるステップを含む。いくつかの実施形態では、使用したアダプターの長さに依存するアダプター配列のマッチングの間の欠失および挿入を含む、1、2、3、4またはそれ以上のミスマッチは許容される。いくつかの実施形態では、各リードのアダプターの位置は、BLASTなどの計算法によって位置づけられる。これらの方法は、全てのリードのアダプターおよび断片位置のリストを生成するステップをさらに含む。いくつかの実施形態では、連結解除後、断片は、ゲノムまたは標的ゲノム領域からの配列のリストなどのサブゲノム画分にアラインされる。
いくつかの実施形態では、試料は類似のサイズの標的核酸を含有する。例えば、いくつかの実施形態では、標的核酸は、試料から単離および増幅された単一遺伝子または遺伝子領域である。他の実施形態では、標的核酸は同じ長さの配列のライブラリー、例えば、母親の血液中に見いだされる無細胞胎児DNAを含むヒト血液に見いだされる無細胞DNAである。そのようなDNAは、平均150bp長である。いくつかの実施形態では、予測されるサイズのリードの数またはパーセンテージが算出され得る。他の実施形態では、連結体の平均の長さが算出され得る。例えば、表1に示した計算は平均して、各リードが5.68断片を含有することを実証する。
いくつかの実施形態では、本発明の方法は、非連結断片のプールのシーケンスと比較して、連結のおかげでシーケンススループットを増加する。例えば、連結の程度に依存して、スループットは2、3、4、5倍またはそれより多く増加され得る。
本発明は、シーケンスライブラリー「ConcatSeq」を調製する新規の方法およびレアカットの制限酵素を利用する関連方法である。「ConcatSeq」。方法は、非連結試料と比較してランあたり5倍より多く一分子シーケンス(SMS)プラットフォームのシーケンススループットを増加することができる。いくつかの実施形態では、全てのシーケンスリードにわたって検出された断片の平均数は、約5と観察され得る。いくつかの実施形態では、最大50断片からなるはるかにより長いコンカテマーが検出された。いくつかの実施形態では、5倍をはるかに超えてシーケンススループットを増加する能力は、シーケンスの前にサイズ選択をライブラリーに適用することによって達成される。
いくつかの実施形態では、配列決定の正確性は標的配列のいくつかのコピーを読むことから得られるコンセンサス配列に依存する。例えば、PacBio’s SMRT(登録商標)技術の正確性は、鋳型の両鎖にわたる複数のパスから決定される環状コンセンサス配列(CCS)リードに依存する。したがって、有用なシーケンス情報を生み出すコンカテマーの長さには固有の上限が存在する。例えば、現在の統計学は、5つの完全なパスによりPacBioの正確性は99%に達することを示し、ポリメラーゼリードの平均長は10〜15kbの間であり、2および4kbの間の理想的な長さの連結したシーケンスライブラリーを作製する。標的濃縮ワークフローによって生成された短い断片が典型的にはおよそ200bpであると仮定すると、本発明者らは、本発明者らの方法はさらに最適化され、PacBioシーケンススループットを10〜20倍に増加することができると推定する。
連結反応の間に生成されたコンカテマーの最大長を制御するため、本発明者らは、(サイズ選択の、上に列挙した戦略に加えて)1つまたは両方の末端の分子をキャッピングするアダプターの急上昇を使用する手法を想定する。そのようなアダプターの非限定的な例は、PacBio特異的ヘアピンアダプターである。有毒なアダプターは、さらなる増殖からの連結を防ぐ。そのような「有毒な」アダプターの出発濃度は、最終ライブラリーのサイズ分布を制御するために使用され得る。
本明細書に記載の実施例は、よく特徴付けられたDNA試料において公知のSNVを正確に検出することによる、本発明の方法の検証を示す。公知のアリール頻度との比較およびオリジナルプールにおける分子の表現は、非連結試料と非常に高い一致を示し、Gibson Assemblyがエラー率またはサンプリングバイアスを著しく増加しないことを実証し、ConcatSeq(図3cおよび図3d参照)の妥当性を確証した。本明細書に記載の方法を使用する配列決定の正確性は、「高品位」リード、例えば少なくとも5パスのCCSリードを含むことのみ、および/またはPCR反応のバランスを取り各アンプリコンの等モル表現を確実にすることによって、さらに改善され得る。本明細書に記載の実施例は、非常に短い断片(80〜220bp長の間)による腫瘍学標的パネルに焦点を当てたが、LMWラダーを使用する実験(図5a〜c)は、ConcatSeqがはるかにより長い断片を連結することに適用することができ、したがって他の研究領域に適用され得ることを実証する。
本発明の方法は、シーケンスアダプターがライゲーション、例えばハイブリッド捕捉などによって組み込まれる、マルチプレックスPCRおよびワークフローによって実証されるように、様々な標的濃縮ワークフローに容易に適用され得る。同様の溶液は、他のアッセイ、例えば分子反転プローブに基づくHEAT−Seq(Roche Sequencing Solutions、Madison、Wisc.)などに適用され得る。この場合、オリジナルプロトコールへの唯一の改変は、環状化標的分子の増幅の間にConcatSeqアダプターまたはレアカット制限酵素部位を有するアダプターを含有するプライマーの使用である。
その容易さにより、本明細書に記載の方法は、それらのオリジナルワークフローを最小限に改変しながら、異なる標的濃縮スキームに適用され、即席の連結方法およびそれらの変更は、限定はされないが、PacBioプラットフォームおよびナノポア式プラットフォームを含む、長いリードシーケンス技術の強力および多用途の新しい試料調製ツールを提供する。
いくつかの実施形態では、本発明はシーケンスに好適な連結した核酸配列のライブラリーである。ライブラリーは、さらに第2のアダプターに隣接する、連結した第1のアダプターライゲート標的核酸を含む。ライブラリーは、レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;アダプターライゲート標的分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;部分的に一本鎖の末端とハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化したアダプターライゲート標的分子を接合させ、それにより連結した標的分子を生成するステップを含む方法によって生成される。
いくつかの実施形態では、本発明は、シーケンスに好適な連結した核酸配列の別のライブラリーである。ライブラリーは、さらに第2のアダプターに隣接する、連結した第1のアダプターライゲート標的核酸を含む。ライブラリーは、少なくとも1つの二本鎖領域を有する第1のアダプターを二本鎖標的分子の各末端に付加するステップ;アダプター含有二本鎖標的分子をエキソヌクレアーゼと接触させ、標的分子の末端に部分的に一本鎖のアダプター領域を生成するステップ;標的分子の各鎖上の部分的に一本鎖のアダプター領域をハイブリダイズさせることによって少なくとも2つの標的分子を接合させて二本鎖アダプター領域を形成し、および標的分子の鎖を共有結合させることにより、連結した標的分子を生成するステップ;ならびに1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプターを、連結した分子に付加して、それにより連結した標的核酸分子のライブラリーを生成するステップを含む方法によって生成される。
いくつかの実施形態では、本発明は、レアカット制限エンドヌクレアーゼ認識部位および分子バーコードを含むアダプター、ユニバーサルプライミング部位を含む第2のアダプター、レアカット制限エンドヌクレアーゼおよび核酸リガーゼ、ならびに任意選択により、ユニバーサルプライミング部位に相補的なプライマー、熱安定性核酸ポリメラーゼおよび少なくとも4つのデオキシヌクレオシド三リン酸の混合物、を含む連結した標的核酸分子のライブラリーを産生するためのキットである。
いくつかの実施形態では、本発明は、少なくとも1つの二本鎖領域を有する第1のアダプター、1つまたは複数のバーコードを含む第2のアダプター、ユニバーサル増幅プライミング部位、およびシーケンスプライミング部位、エキソヌクレアーゼ、核酸ポリメラーゼ、および核酸リガーゼ、ならびに任意選択により、第1のアダプター配列に相補的な増幅プライマー、熱安定性核酸ポリメラーゼおよび少なくとも4つのデオキシヌクレオチド三リン酸の混合物も含む連結した標的核酸分子のライブラリーを産生するための別のキットである。
実施例1 連結した標的分子のライブラリーの作製
DNA、オリゴヌクレオチド、試薬およびキット。この実施例では、市販のKRAS変異ヒト細胞系由来のゲノムDNAをHorizon Discovery(HD701)およびPromega(G1471)から購入した。低分子量DNAラダーはNew England BioLabs(N3233)から購入した。オリゴヌクレオチドおよびNuclease−Free Duplex BufferはIntegrated DNA Technologiesから購入した。1つのオリゴヌクレオチドは、シトシンにおけるアミノ基の組込みによって内部で改変した。NEBuilder HiFi DNA Assembly Master MixおよびPhusion High−Fidelity DNAポリメラーゼはNew England BioLabs(E2621)から購入した。エキソヌクレアーゼIII(M0379)およびエキソヌクレアーゼVII(M0206)はNew England BioLabsから購入した。Buffer IIおよびMgClとAmpliTaq Gold DNAポリメラーゼ(N8080241)、Nuclease−Free Water(AM9937)およびQubit dsDNAアッセイの試薬(Q32850およびQ32851)はThermo Fisher Scientificから購入した。KAPA Hyper Prep Kit(KK8503)およびKAPA Pure Beads(KK8002)はKAPA BioSystemsから購入した。Agilent 2100 BioanalyzerシステムのAgilent DNA 7500 kits(5067−1504)は、Agilent Technologiesから購入した。
PCR増幅および標的分子の連結。図1〜図3に記載の実験では、ゲノムの標的領域をまず、遺伝子特異的プライマーおよび30ngのHD701のゲノムDNAを使用して、AmpliTaq Gold DNAポリメラーゼを使用して増幅した。この1回目のPCRにより、各アンプリコンの両末端に隣接するスペーサーと一緒に標的領域を増幅した。図1a〜cおよび図2a〜eに記載した実験では、生じるPCR産物を、次いで、スペーサー配列からプライミングし、2つの別々のPCR反応で相補的なConcatSeqアダプターを両末端に組み込む2つのプライマー対によって増幅した。図3a〜dに記載した実験では、プライマー不適合により2つの別々のPCR反応で20個の標的領域をまず増幅した(それぞれ、11および9アンプリコン)。相補的なConcatSeqアダプターをそれらの末端に組み込むため、2つのPCR産物を続いて増幅した。生じるPCR産物を、次いでKAPA Pure Beadsを使用して洗浄し、Qubit dsDNA BR Assay Kitを使用して定量した。200〜300ngの2つのPCR産物それぞれを、次いで混合し、最終容積はPCRグレードの水で40μlにした。等量(40μl)のNEBuilder HiFi DNA Assembly Master Mixを添加し、50℃で1時間インキュベートした。Gibson Assembly後、KAPA Pure Beadsを使用するクリーンアップステップ、続いてQubit定量(典型的には、濃度は約10ng/μl)、およびAgilent’s DNA7500アッセイを使用するサイズ範囲分析を行った。
連結前の標的分子へのConcatSeqアダプターのライゲーション。図4a〜cに記載した実験では、2つの異なる相補的なTテールのConcatSeqアダプターを、最終濃度20μMでPCRプライマー配列をアニーリングすることによって生成した。図4aに記載した実験では、EGFR遺伝子座の4つの異なる領域をヒトゲノムDNA(男性)から増幅した。PCR産物の濃度は、Qubit dsDNA BRアッセイを使用して決定し、次いで等モル濃度(約73nM)でプールした。図4bに記載した実験では、NEBのLMW DNAラダーを10ng/μlに希釈し、投入材料として使用した。図4aおよび図4b、両方では、DNA試料を2つの反応に分け(それぞれ約250ngの総DNA量を含む25μl)、KAPA Hyper Prepアッセイ:末端修復、Aテーリング、および2つのTテールのConcatSeqアダプターへのライゲーションに供した。生じたアダプターライゲート断片のプールを、次いで、PCR増幅し、両末端に効果的にライゲートしたアダプターを有する断片を濃縮した。DNA濃度は、Qubit dsDNA BR Assay Kitを使用して定量した。200〜300ngの2つのPCR産物それぞれを、次いで混合し、PCRグレードの水で40μlに合わせた。等量のNEBuilder HiFi DNA Assembly Master Mixを添加し、50℃で30、60、100および120分間インキュベートした。Gibson Assembly後、KAPA Pure Beads(0.8×比)を使用するクリーンアップステップ、続いてQubit定量およびAgilent’s DNA7500アッセイを使用するサイズ範囲のサイズ範囲分析を行った。
所望の方向でUIDおよびSceIの制限部位の両方を持つ二本鎖アダプターを、DNA断片の両末端にライゲートする(図1)。ライゲーション産物をSceIによって消化し、DNAリガーゼによって接合する。
PacBioライブラリー調製。およそ100ngの連結したプールを使用して、PacBioシーケンスライブラリーをKAPA Hyper Prep Kitを使用して調製した。好適なTテールヘアピンアダプターを、Duplex Bufferを使用してアダプターオリゴヌクレオチド(20μM)の自己アニーリングによってまず作製し、80℃に5分間加熱後、25℃にゆっくりと下げた(秒あたり0.2℃)。二本鎖DNAコンカテマーを、次いで、末端修復およびAテーリングに供し、20℃で30分間、ヘアピンアダプターにライゲートした(アダプター対コンカテマーの比はおよそ250:1)。未反応のTテールヘアピンアダプターおよび連結したDNA分子は、試料にエキソヌクレアーゼIIIおよびエキソヌクレアーゼVII(それぞれ1μl)を添加し、37℃で30分間インキュベートすることによって除去した。生じたライブラリー分子は、0.8×比でKAPA Pure Beadsによってクリーンアップし、次いでQubit dsDNA HS Assayを使用して定量した。平均して、シーケンスライブラリーの最終濃度は、0.5および2ng/μlの間であった。
実施例2 連結した標的分子のライブラリーのシーケンス
PacBioシーケンス。Binding Calculator(バージョン2.3.1)を使用して、MagBead one−cell per well(OCPW)プロトコールを使用してPacBioシーケンスのライブラリーを調製し、結合キットP6v2をプレート上濃度0.05nMで使用した。プライマー調節およびアニーリング、ならびにポリメラーゼの鋳型への結合、および磁気ビーズへの複合体の結合は、正確に、Binding Calculatorのプロトコールに示される通りに行った。鋳型複合体は、SMRT細胞にロードする前に4℃で2時間MagBeadとインキュベートした。4時間の動画を記録し、PacBio RSII装置で1次シーケンス分析を実施した。
実施例3 連結した標的核酸のライブラリーを調製する代替の方法
アダプターを付加する代替の方法。図4aは、SeqCap法(Roche Sequencing Solutions、Madison、Wisc.)への適用を示し、ワークフローの変更が2つだけある。1つ目は、プロトコールの最初にDNA断片にライゲートするY−アダプターが、ConcatSeqアダプターによって置き換えられる(図4a、アダプターライゲーションステップ)。2つ目は、連結が起こるように1時間、捕捉およびPCR増幅された標的分子を酵素マスターミックスとインキュベートする新しいステップが導入される。
ConcatSeqアダプターが、PCR増幅によって組み込まれるのではなく、DNA断片にライゲートされる場合、ConcatSeqが作用するかどうか試験するため、本発明者らはまず、ヒトEGFR遺伝子座からの4つのPCR産物からなるプールを生成した。アンプリコンは全て、220bpのサイズを有し、鋳型として男性ヒトゲノムDNA(G1471、Promega)を使用して増幅した(図4b)。プールしたDNAを、2つのアリコットに分け、2つの型のオーバーラップするアダプターは、Aテールライゲーションを介して付加した。本発明者らは、図1aに先に記載したように、連結の前に濃縮のためのPCRステップを実施した。このPCR反応は、標的濃縮ライブラリーがシーケンス前に増幅される現在のワークフローのPCRステップを模倣することに注意されたい。リードあたりの断片の平均数は、先のランと比較してわずかに減少した。しかしながら、オンターゲット率は優れており、ライゲーションベースの手法が有効であることを確認した。連結解除した断片の大部分は、220bpの予測サイズを有した(図4c)。第2の試験のため、本発明者らは、アダプターライゲーションの出発物質として、様々な長さの11の二本鎖DNAを含有する低分子量DNAラダー(LMW)を使用した。この連結実験では、リードあたりの断片の平均数は3.8倍に過ぎず(表1)、これは、混合物中のはるかにより長い分子(766bpまで)の存在により予測されたものである。本発明者らは、LMW断片の内訳が、アダプターライゲーションおよび/またはその後のPCR増幅によって強く影響されたことに気が付いた(図6a〜d)。高い相関性(Pearson’s r=0.971)が、整列したLMW断片の頻度とアダプターライゲーション後の断片濃縮の間に見いだされ(図5d)、本発明者らの方法がアセンブリの間に低バイアスで分子をサブサンプルすることを確認した。
実施例4 シーケンスデータ分析
二次および三次データ分析。インサートのリードは、SMRT Portalのデフォルト設定を使用して決定した:1より多くの全パスでのリードおよび最小予測精度90%のみがCCSリード生成に含まれた。環状コンセンサス配列リードはアダプタースキャン手法を使用して連結解除し、これを、本発明者らはRで実行した。簡潔に言うと、30bpのウィンドウ(ConcatSeqアダプターの長さに相当する)は各リードに沿ってスライドし、agrep関数を使用してConcatSeqアダプター配列(フォワードおよびリバース相補鎖方向)におよそのマッチングを実施し、4つまでのミスマッチ、挿入、および/または欠失を許容する。この方法で特定したアダプターは、連結解除断片を後に残してリードから除去する。この方法によって特定された全てのアダプターおよび断片を列挙する新しいfastqファイルを作成する。断片の参照へのアライメントの前に、1bp長の全ての断片を除去した。スペーサー配列(図1a〜c、図3a〜dに記載の実験において第1のPCR増幅中に導入された)は連結解除後に各断片の一部を残し、bwa memを使用するアライメントの前に特異的に除去されなかった。各断片に隣接するスペーサー配列は、アライメントの間にソフトクリップされた。0または16のいずれかのsamフラグを有するアライメントのみが、それぞれフォワードまたはリバース相補鎖方向での正確なアライメントを示し、さらなる分析のために維持された。図3a〜dでは、本発明者らはsamtoolsでmpileup関数を使用してアラインした断片のパイルアップを生成した。本発明者らは、Perlスクリプトを使用して、パイルアップを分割表に変換し、位置ごとの各ベースコールの頻度を報告した。関連のある位置でのアリール頻度(すなわち、公知のHD701の一塩基変異体)をこれらの表から抽出し、その位置でアラインしたリードの総数の画分としてプロットした。
実施例5 本発明の方法の評価
ConcatSeqシーケンス評価。本発明者らの連結手法が成功したことを確認するため、本発明者らは詳細な検査のためにZMW93から1719bpからなるリードを(無作為に)選択する。その長さに基づき、本発明者らは、それが8量体であると考えた。このリードで3つの循環的な特徴が特定された:30bp ConcatSeqアダプター、標的配列、およびスペーサー(図2a)。(簡潔さのために、本発明者らは、これ以降、標的と隣接するスペーサー配列を「標的」または「断片」と呼ぶ。)本発明者らの手法で使用された設計から予測されるように、アダプターはリードに沿ってフォワードおよびリバース相補鎖方向間で交替する。標的の方向は無作為であるが、両方向はほぼ同じ頻度で存在する(すなわち、フォワード方向に5、リバース相補鎖方向に3)。
この型の分析を14,739シーケンスリード全てに広げるため、本発明者らは、バイオインフォマティクス方法を実行し、連結解除を自動化した。この方法は、スキャンウィンドウを各リードに沿ってスライドするアルゴリズムに基づき、予測されるアダプター配列にほぼマッチングさせ(欠失および挿入を含む、4つまでのミスマッチが許容される)、リードごとにアダプターおよび断片位置のリストを生成する。予測されるように、フォワードおよびリバース相補鎖方向の全ての断片の数はほぼ正確に等しかった(図2b)。同じことが両方向のアダプターにも当てはまった。本発明者らは、また、断片と比較して少数のアダプターを観察し、これはコンカテマーの末端に位置するアダプターが、トランケートされることがあり、そのために本発明者らのアダプタースキャン手法によって特定されなかったからであると仮定した。リードの末端のさらなる検査により、この仮定が確かめられた。
合計で、14,739リードで89,496個の断片および75,312個のアダプターを特定した。大多数の標的(n=62,093、74.2%)は、正確に187bpの予測サイズを有するか、または予測サイズに非常に近かった(181〜190bp)(図2c)。特に、1塩基のみからなる断片の第2集団があった(n=5818、6.5%)。これらの断片全てが、リードの開始または末端に位置し、これらのほとんどはアデニンまたはチミジンのいずれかであった(85%)。これらの1塩基断片は、ライブラリー調製中にAテールライゲーションを介してn量体に付加されたヘアピンアダプターのレムナントである可能性が最も高い(図1a)。第3の集団(n=12,783、15.3%)は、予測サイズ(>190bp)よりわずかに長い断片からなった。また、これらの断片の大部分は、リードの末端に位置し、トランケートしたアダプター配列と一緒に標的を含有した。
本発明者らは、5818個の1ヌクレオチド断片をさらなる分析から除外し、連結解除後83,678個の断片を残した(表1)。平均して、各リードは5.68個の断片を含有し、本発明者らの手法が、非連結断片のプールのシーケンスと比較して少なくとも5倍シーケンススループットを増加したことを示した。標的の参照配列へのアライメントは、素晴らしいオンターゲット率(98.0%)を示し、連結が、標的配列の忠実度に干渉しなかったことを示した。これは、さらに、ConcatSeqの有効性を確証する。
本実験で連結された断片は、全て同じサイズであったため(図1b、レーン[N])、リードの長さとリードにおける断片の数の間の直線関係が予測される。この直線関係は大半のリードで観察された(図2d)。残りの22リードにおいて、少数のアダプター配列が、それらが参照配列と4つを超えるミスマッチを有したため、本発明者らのアルゴリズムによって特定されなかった。際立ったことに、多くのリード(70.5%)が、3から7の間の断片を含有し(図2e)、600から1500bpの間の長さであり、本発明者らは、最長では10kbを超えるサイズであり50を超える断片を含有する(図2d)、広範囲なリード長を見いだした。このことは、ConcatSeqは、シーケンスの前により長いコンカテマーをサイズ選択することにより、シーケンススループットをさらに増加させる可能性があることを示す。
腫瘍学アンプリコンパネルにおいて一塩基変異体(SNV)を検出することによるConcatSeqの検証。本発明者らは次に、ConcatSeqを使用して公知のSNVを正確に特定できるかどうか、および生物試料におけるそれらのアリール頻度を調べた。このため、本発明者らは、鋳型として、よく特徴付けられたDNA参照(HD701、Horizon Discovery)を使用するPCRによって腫瘍学標的のセットを増幅した。HD701は、市販の操作された同質遺伝子型の細胞系であり、主な腫瘍標的の正確なアリール頻度はデジタルPCRによって決定した。このDNA試料において、検証した変異体のアリール頻度(AF)は、1%から24.5%の間であり、本発明者らのアッセイの正確性および感度のアセスメントを可能にする。5遺伝子(EGFR、KRAS、NRAS、BRAF、およびPIK3CA)にわたる20のアンプリコンは、2つの別々のマルチプレックスPCRによって生成され(それぞれ11および9標的を含有する)、次いで相補的なConcatSeqアダプターを隣接させた(図1a)。等モル量のこれらの2つのアンプリコンプールを混合し、3つの独立した反応で連結し、続いてPacBioシーケンスし、本発明者らのアッセイの再現性を評価するための3連の試料として働いた。前述のように、これらの試料においてリードあたり平均5より多くの断片が観察された(表1)。本発明者らは、対照として非連結アンプリコンのプールもシーケンスした。次いで、連結解除および非連結断片を20の参照配列にアラインし、各アライメントのパイルアップを生成し、続いてHD701細胞系のDNAの公知の変異体のAFを抽出する、バイオインフォマティクスパイプラインを確立した(図3a)。3つ連結した試料全ておよび非連結対照のオンターゲット率はまた、非常に高かった(>96.1%)。ConcatSeqによって特定されたアリール頻度は、連結した試料の3つの複製物と予測頻度の間に高い相関があり(Pearson’s r=0.959)(図3b)、高い正確性と感度でこの情報を回復するConcatSeqの能力を示した。連結および非連結対照におけるAFの比較は、さらに高い一致を示し(Pearson’s r=0.987)、予測頻度からのずれが、連結またはPacBioシーケンスの間ではなく、アンプリコン生成の間に導入されるようであることを示した。本発明者らの手法が、連結前のプールにおいて示されるアンプリコンの頻度に著しいバイアスを導入しないことを確かめるため、本発明者らは、3つの連結した試料および非連結試料における20アンプリコンそれぞれのカバー率を比較した(図3d)。これらの群間で非常に高い相関が見いだされ(Pearson’s r>0.944)、ConcatSeqが低バイアスでオリジナルプールからアンプリコンをサブサンプリングすることを示した。
実施例6 アダプターライゲーションを介する連結した標的分子のライブラリーの作製
UIDおよび所望の方向のSceIの制限部位の両方を持つ二本鎖アダプターを、DNA断片の両末端にライゲートする(図1)。ライゲーション産物は、SceIによって消化し、DNAリガーゼによって接合する。
実施例7 プライマー伸長を介する連結した標的分子のライブラリーの作製
フォワードおよびリバースプライマーは、所望の方向でSceIの制限部位およびUIDを持つように設計する(図2)。これらのプライマーを使用して、PCRを介して試料内の目的の領域を選択する。PCR増幅に続いて、増幅産物をSceIによって消化し、DNAリガーゼによって接合する。
実施例8 ライゲーションおよびプライマー伸長を介する連結した分子のライブラリーの作製
UIDおよび所望の方向のSceIの制限部位の両方を持つ二本鎖アダプターを、DNA断片の両末端にライゲートする(図3)。(+)または(−)鎖に対して設計され、鎖特異的ID(SID)および所望の方向のSceI制限部位の両方を持つ伸長プライマーは、標的分子の各鎖に別々にハイブリダイズする。PCR後、所望のインサート方向のアダプター付加(adapted)断片分子を生成する。代わりに、両鎖の伸長プライマーは、標的分子に同時にハイブリダイズする。PCR後、無作為なインサート方向を有するアダプター付加断片分子を生成する。両反応から精製したPCR産物は、次いで上記のように処理され得る。
実施例9 所望のサイズ範囲の連結体の作製
標的DNA断片はビオチン化プライマーによってPCR増幅し、ビオチン化アンプリコンを作製する。これらは、制限酵素SceIによる消化に供され、連結のため非パリンドロームオーバーハングを暴露する。全てのビオチン化種は、ストレプトアビジン結合固体支持体とのインキュベーションによって除去し、完全に消化した産物のみを残す。(図10a)カルボキシル化SeraMag Speedbeads(GE Healthcare Bio−Sciences、Pittsburgh、Penn.)および増量のPEG−8000の存在下でT4 DNAリガーゼを使用する標準的なライゲーション反応を実施する。30分後、ビーズを磁化し、上清を除去し、ビーズを70%エタノールで洗浄する。コンカテマーは次いで、TE緩衝液で溶出する。結果は図10bに示す:レーン1〜5は、漸増濃度のPEG8000(6%〜14% w/v)とのライゲーション混合物の電気泳動を示す。レーン6は、沈殿無しの対照である。

Claims (15)

  1. 試料から、連結した標的核酸分子のライブラリーを作製する方法であって、
    a.少なくとも1つの二本鎖領域を有する第1のアダプターを二本鎖標的分子の各末端に付加するステップ;
    b.試料をエキソヌクレアーゼと接触させ、標的分子の末端に部分的に一本鎖のアダプター領域を生成するステップ;
    c.標的分子の各鎖上の部分的に一本鎖のアダプター領域をハイブリダイズさせることによって少なくとも2つの標的分子を接合させて二本鎖アダプター領域を形成し、および標的分子の鎖を共有結合させることにより、連結した標的分子を生成するステップ;ならびに、
    d.1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプターを連結した分子に付加して、それにより連結した標的核酸分子のライブラリーを生成するステップ;
    を含む、前記方法。
  2. 第1のアダプターが、アダプター配列が組み込まれたプライマーにより標的核酸分子を増幅することによって付加される、または第1のアダプターが、標的核酸分子の末端へのライゲーションによって付加される、請求項1に記載の方法。
  3. 第1のアダプターが、両末端がライゲーションできるアダプターおよび1つの末端のみがライゲーションできるアダプターの混合物を含む、請求項1に記載の方法。
  4. 第1のアダプターが、5’末端から少なくとも約15塩基の位置にエキソヌクレアーゼ耐性領域を含む、請求項1に記載の方法。
  5. a.少なくとも1つの二本鎖領域を有する第1のアダプターを二本鎖標的分子の各末端に付加するステップ;
    b.アダプター含有二本鎖標的分子をエキソヌクレアーゼと接触させ、標的分子の末端に、部分的に一本鎖のアダプター領域を生成するステップ;
    c.標的分子の各鎖上の部分的に一本鎖のアダプター領域をハイブリダイズさせることによって少なくとも2つの標的分子を接合させて二本鎖アダプター領域を形成し、および標的分子の鎖を共有結合させることにより、連結した標的分子を生成するステップ;ならびに、
    d.1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプターを連結した分子に付加して、それにより連結した標的核酸分子のライブラリーを生成するステップ;
    を含む方法を使用して作製された、連結した標的核酸分子のライブラリー。
  6. 少なくとも1つの二本鎖領域を有する第1のアダプター、1つまたは複数のバーコード、ユニバーサル増幅プライミング部位およびシーケンスプライミング部位を含む第2のアダプター、エキソヌクレアーゼ、核酸ポリメラーゼ、および核酸リガーゼを含み、任意選択により、第1のアダプター配列に相補的な増幅プライマー、熱安定性核酸ポリメラーゼおよび少なくとも4つのデオキシヌクレオシド三リン酸の混合物をさらに含む、連結した標的核酸分子のライブラリーを産生するキット。
  7. 試料から、連結した標的核酸分子のライブラリーを作製する方法であって、
    a.レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;
    b.アダプターライゲート標的分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;ならびに、
    c.部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化したアダプターライゲート標的分子を接合させ、それにより連結した標的分子を生成するステップ;
    を含む、前記方法。
  8. アダプターが、レアカット制限エンドヌクレアーゼ認識部位が組み込まれたプライマーにより標的核酸分子を増幅することによって付加される、請求項7に記載の方法。
  9. プライマーが、標的特異的配列および分子バーコードをさらに含む、請求項7に記載の方法。
  10. 第2のアダプターを、連結した分子の少なくとも1つの末端に付加するステップをさらに含み、アダプターが少なくとも1つのシーケンスプライマー結合部位を含む、請求項7に記載の方法。
  11. 試料から、連結した標的核酸分子を作製する方法であって、
    a.レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;
    b.プライマーをアダプターライゲート標的分子の各鎖にハイブリダイズさせるステップであって、プライマーがレアカット制限エンドヌクレアーゼ認識部位を含むステップ;
    c.プライマーを伸長して、アダプターライゲート標的分子の各鎖から、各末端でレアカット制限エンドヌクレアーゼ認識部位を含有する新しい分子を形成するステップ;
    d.新しい分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;ならびに、
    e.部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化した新しい分子を接合し、それにより連結した標的分子を生成するステップ;
    を含む、前記方法。
  12. プライマーが、標的特異的配列を含み、および任意選択により分子バーコードをさらに含む、請求項11に記載の方法。
  13. 第2のアダプターを、連結した分子の少なくとも1つの末端に付加するステップをさらに含み、アダプターが少なくとも1つのシーケンスプライマー結合部位を含む、請求項11に記載の方法。
  14. a.レアカット制限エンドヌクレアーゼ認識部位を含むアダプター分子を、二本鎖標的核酸分子の少なくとも1つの末端に付加して、アダプターライゲート標的分子を形成するステップ;
    b.アダプターライゲート標的分子をレアカット制限エンドヌクレアーゼによって消化し、部分的に一本鎖の末端を形成するステップ;ならびに、
    c.部分的に一本鎖の末端をハイブリダイズおよび共有結合させることによって少なくとも2つのエンドヌクレアーゼ消化したアダプターライゲート標的分子を接合し、それにより連結した標的分子を生成するステップ;
    を含む方法を使用して作製した、連結した標的核酸分子のライブラリー。
  15. レアカット制限エンドヌクレアーゼ認識部位および分子バーコードを含むアダプター、ユニバーサルプライミング部位を含む第2のアダプター、レアカット制限エンドヌクレアーゼおよび核酸リガーゼを含む、連結した標的核酸分子のライブラリーを産生するキット。
JP2019531621A 2016-12-16 2017-04-04 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法 Active JP6925424B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201662435517P 2016-12-16 2016-12-16
US62/435,517 2016-12-16
US201762475148P 2017-03-22 2017-03-22
US62/475,148 2017-03-22
US201762481035P 2017-04-03 2017-04-03
US62/481,035 2017-04-03
PCT/EP2017/057975 WO2018108328A1 (en) 2016-12-16 2017-04-04 Method for increasing throughput of single molecule sequencing by concatenating short dna fragments

Publications (2)

Publication Number Publication Date
JP2020501554A true JP2020501554A (ja) 2020-01-23
JP6925424B2 JP6925424B2 (ja) 2021-08-25

Family

ID=58489011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019531621A Active JP6925424B2 (ja) 2016-12-16 2017-04-04 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法

Country Status (6)

Country Link
US (2) US20200010875A1 (ja)
EP (1) EP3555305B1 (ja)
JP (1) JP6925424B2 (ja)
CN (1) CN110036117A (ja)
ES (1) ES2866896T3 (ja)
WO (1) WO2018108328A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10961573B2 (en) 2016-03-28 2021-03-30 Boreal Genomics, Inc. Linked duplex target capture
KR102521152B1 (ko) 2016-11-16 2023-04-13 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터 저장용 시스템
CA3048420A1 (en) 2016-12-09 2018-06-14 Boreal Genomics, Inc. Linked ligation
US20200080143A1 (en) * 2017-05-14 2020-03-12 Foresee Genomic Ltd Dna construct for sequencing and method for preparing the same
KR20200132921A (ko) 2018-03-16 2020-11-25 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터를 저장하기 위한 화학적 방법들
US12005704B2 (en) 2018-05-16 2024-06-11 Catalog Technologies, Inc. Printer-finisher system for data storage in DNA
EP3853362A1 (en) * 2018-09-21 2021-07-28 F. Hoffmann-La Roche AG System and method for modular and combinatorial nucleic acid sample preparation for sequencing
CN113490677A (zh) * 2018-11-14 2021-10-08 佛西吉诺米克公司 用于测序的多聚体和用于制备并且分析所述多聚体的方法
US11473136B2 (en) 2019-01-03 2022-10-18 Ncan Genomics, Inc. Linked target capture
CN110600078B (zh) * 2019-08-23 2022-03-18 北京百迈客生物科技有限公司 一种基于纳米孔测序检测基因组结构变异的方法
WO2021051378A1 (zh) * 2019-09-20 2021-03-25 武汉华大医学检验所有限公司 测序文库的构建方法、测序方法及试剂盒和应用
GB202004469D0 (en) * 2020-03-27 2020-05-13 Olink Proteomics Ab Controls for proximity detection assays
CA3198842A1 (en) * 2020-10-21 2022-04-28 Illumina, Inc. Sequencing templates comprising multiple inserts and compositions and methods for improving sequencing throughput
GB202018503D0 (en) * 2020-11-25 2021-01-06 Olink Proteomics Ab Analyte detection method employing concatamers

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012012037A1 (en) * 2010-07-19 2012-01-26 New England Biolabs, Inc. Oligonucleotide adaptors: compositions and methods of use
WO2013040060A2 (en) * 2011-09-12 2013-03-21 Pathogenica, Inc. Nucleic acids for multiplex detection of hepatitis c virus
WO2013096802A1 (en) * 2011-12-22 2013-06-27 Ibis Biosciences, Inc. Amplification primers and methods
JP2016515384A (ja) * 2013-03-19 2016-05-30 ディレクティド・ジェノミクス・エル・エル・シー 標的配列の濃縮

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US81837A (en) * 1868-09-01 Improvement in head-blocks
EP2049682A2 (en) * 2006-07-31 2009-04-22 Illumina Cambridge Limited Method of library preparation avoiding the formation of adaptor dimers
DK3064599T3 (en) * 2008-02-15 2019-04-08 Synthetic Genomics Inc METHODS IN VITRO FOR COMBINING AND COMBINATORY CONSTRUCTION OF NUCLEIC ACID MOLECULES
GB201418621D0 (en) * 2014-10-20 2014-12-03 Cambridge Epigenetix Ltd Improved nucleic acid sample preparation using concatenation
EP3631010A4 (en) * 2017-06-01 2021-02-24 Myriad Women's Health, Inc. PRODUCTION OF CHAINED POLYNUCLEOTIDES

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012012037A1 (en) * 2010-07-19 2012-01-26 New England Biolabs, Inc. Oligonucleotide adaptors: compositions and methods of use
WO2013040060A2 (en) * 2011-09-12 2013-03-21 Pathogenica, Inc. Nucleic acids for multiplex detection of hepatitis c virus
WO2013096802A1 (en) * 2011-12-22 2013-06-27 Ibis Biosciences, Inc. Amplification primers and methods
JP2016515384A (ja) * 2013-03-19 2016-05-30 ディレクティド・ジェノミクス・エル・エル・シー 標的配列の濃縮

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GIBSON, G.G., ET AL.: ""Enzymatic assembly of DNA molecules up to several hundred kilobases."", NATURE METHODS, vol. 6, no. 5, JPN6020045923, 2009, pages 343 - 345, XP055224105, ISSN: 0004558613, DOI: 10.1038/nmeth.1318 *
SLEIGHT, S.C., ET AL.: ""Randomized BioBrick Assembly: A novel DNA assembly method for randomizing and optimizing genetic ci", ACS SYNTHETIC BIOLOGY, vol. 2, no. 9, JPN6020045921, 2013, pages 506 - 518, XP093165912, ISSN: 0004400016, DOI: 10.1021/sb4000542 *
TAKITA, E., ET AL.: ""Precise sequential DNA ligation on a solid substrate: solid-based rapid sequential ligation of mult", DNA RESEARCH, vol. 20, JPN6020045925, 2013, pages 583 - 592, ISSN: 0004558614 *

Also Published As

Publication number Publication date
EP3555305A1 (en) 2019-10-23
CN110036117A (zh) 2019-07-19
WO2018108328A1 (en) 2018-06-21
EP3555305B1 (en) 2021-02-17
US20200010875A1 (en) 2020-01-09
JP6925424B2 (ja) 2021-08-25
ES2866896T3 (es) 2021-10-20
US20210363570A1 (en) 2021-11-25

Similar Documents

Publication Publication Date Title
US20210363570A1 (en) Method for increasing throughput of single molecule sequencing by concatenating short dna fragments
US20220042090A1 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
US20190024141A1 (en) Direct Capture, Amplification and Sequencing of Target DNA Using Immobilized Primers
KR102643955B1 (ko) 근접 보존 전위
US20120003657A1 (en) Targeted sequencing library preparation by genomic dna circularization
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법
US11001834B2 (en) High-molecular weight DNA sample tracking tags for next generation sequencing
US20220364169A1 (en) Sequencing method for genomic rearrangement detection
JP2023513606A (ja) 核酸を評価するための方法および材料
US11268087B2 (en) Isolation and immobilization of nucleic acids and uses thereof
JP2024035110A (ja) 変異核酸の正確な並行定量するための高感度方法
CN116685696A (zh) 从两端对多核苷酸片段进行测序的方法
Barry Overcoming the challenges of applying target enrichment for translational research

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210803

R150 Certificate of patent or registration of utility model

Ref document number: 6925424

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150