JP6714709B2 - 核酸配列決定のための新規アダプターおよび使用法 - Google Patents

核酸配列決定のための新規アダプターおよび使用法 Download PDF

Info

Publication number
JP6714709B2
JP6714709B2 JP2018539334A JP2018539334A JP6714709B2 JP 6714709 B2 JP6714709 B2 JP 6714709B2 JP 2018539334 A JP2018539334 A JP 2018539334A JP 2018539334 A JP2018539334 A JP 2018539334A JP 6714709 B2 JP6714709 B2 JP 6714709B2
Authority
JP
Japan
Prior art keywords
adapter
nucleic acid
barcode
pool
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018539334A
Other languages
English (en)
Other versions
JP2019504624A (ja
Inventor
クラス,ダニエル・エム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2019504624A publication Critical patent/JP2019504624A/ja
Application granted granted Critical
Publication of JP6714709B2 publication Critical patent/JP6714709B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors

Description

本発明は、核酸分析、より具体的には、核酸配列決定に役立つアダプターに関する。
核酸配列決定の最新の方法、例えば次世代シークエンシング(NGS)としても知られる超並列シークエンシング(MPS)は、試料における個々の分子の分析を伴う。試料における各分子の分析は、普遍的プライマーを必要とする。さらに、単一分子分析の一部は、分子タグ付けまたはバーコード付けであり、それによって各分子はその起源および同一性に関する情報を所持する。アダプターを付加することによって、試料中のターゲット分子に、普遍的プライマー結合部位およびバーコードを付加することも可能である。アダプターは、アダプター配列を含有するプライマーを伸長させるかまたはアダプターを連結させることによって、付加可能である。
分子タグまたはバーコードは、ユニークな同定情報を含有する短い配列である。タグは特定の試料にユニークであってもよいし(試料由来のすべての分子に共有される)、またはタグを用いて個々の分子を同定してもよい(その分子の子孫にのみ共有される)。試料IDタグ(SID)およびユニーク分子IDタグ(UID)が当該技術分野に知られる。試料IDは、配列決定実行において、試料をプールすることを可能にする一方、分子IDは元来の試料中の各分子の子孫を追跡することを可能にする。
本発明は、最小限の資源の消費および最大限の感度で、エラーが減少した核酸配列決定を可能にする経済的なアダプターである。
1つの態様において、本発明は、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含み、そして少なくとも1つのプライマー結合部位および各一本鎖部分中の少なくとも1つのバーコードをさらに含む、アダプターである。プライマー結合部位は一本鎖部分中にあることも可能である。
別の態様において、本発明は、アダプターのプールであって、各アダプターが、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含み、そして少なくとも1つのプライマー結合部位および各一本鎖部分中の少なくとも1つのバーコードをさらに含み、プール中の各アダプター上のバーコードが既知の関係にある、前記プールである。同じアダプターの1つの鎖上のバーコードは少なくとも1編集距離離れていることも可能である。同じアダプター上のバーコード間の関係は逆相補性、相補性であることも可能であるし、あるいは参照表に捉えられていることも可能である。
別の態様において、本発明は、上述のアダプターのプールを含む製品である。プールは単一バイアル中に含有されることも可能である。
さらに別の態様において、本発明は、核酸を配列決定する方法であって:試料中の各核酸に、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含み、そして少なくとも1つのプライマー結合部位ならびに一本鎖部分の第一の鎖上の第一のバーコードおよび第二の鎖上の第二のバーコードをさらに含む、アダプターを連結し、ここでプール中の各アダプター上の第一および第二のバーコードは既知の関係にあり、核酸鎖の少なくとも一部の配列ならびに第一および第二のバーコードの配列を決定し、第一のバーコードを含有する核酸鎖の配列、および第二のバーコードを含有する核酸鎖の配列を比較して、完全には相補性でない配列を同定し、完全には相補性でない配列が、少なくとも1つの実験エラーを含有することを決定する工程を含む、前記方法である。方法は、配列決定の前に、連結された核酸を増幅して、第一および第二のバーコードを含有する別個の二本鎖配列を得る工程をさらに含むことも可能である。少なくとも1つの実験エラーを含有すると決定された配列を、配列決定結果から除外することも可能である。方法は、同じバーコードおよび核酸の同じゲノム座標を含有する配列をグループ分けし、グループ内の配列を比較して、非同一配列を同定し、そして非同一配列が少なくとも1つの実験エラーを含有することを決定する工程をさらに含むことも可能である。方法で用いる試料はセルフリーDNAを含有することも可能である。
さらに別の態様において、本発明は、核酸配列決定のためのアダプターのプールを作製する方法であって、核酸の一本鎖を対になる方式でアニーリングさせて、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含み、そして少なくとも1つのプライマー結合部位および各一本鎖部分中の少なくとも1つのバーコードをさらに含む、アダプターを形成する工程を含む、ここでアニーリングの前に、核酸の一本鎖を、アダプターのプール中のバーコード間に既知の関係を確立する方式で組み合わせる、前記方法である。
試料核酸の両端に連結されたアダプターの図。
定義
用語「アダプター」は、核酸分子の一端または両端に付着可能なポリヌクレオチドを指す。アダプターは、二本鎖領域のみを含むことも可能であるし、または一本鎖領域もまた含むことも可能である。二本鎖領域は、2つの核酸鎖のハイブリダイズ可能な部分によって形成され、一方、一本鎖領域は、同じ2つの核酸鎖のハイブリダイズ不能な部分によって形成される。ハイブリダイズ不能部分はオープンである(Y型アダプター)ことも可能であるし、または未結合5’および3’末端を連結することによって、共有的に閉鎖していることも可能である(ダンベル型アダプター)。Y型アダプターの場合、アダプターの一本鎖部分は、ときに、「フォーク」と称され、一方、二本鎖部分は、ときに、「ステム」と称される。
用語「バーコード」および「インデックス」は、交換可能に用いられ、核酸分子を同定するために用いられる、ポリヌクレオチド内のヌクレオチドの配列を指す。例えば、バーコードは、いくつかの試料を合わせた際(いくつかの超並列シークエンシング技術において一般的であるように)、核酸分子が由来する試料を同定するために使用可能である。バーコードはまた、ユニークな核酸分子および増幅から生じるその子孫を同定するためにも使用可能である。バーコードは、核酸(例えばプライマーまたはアダプター)を合成する時点で合成可能である。バーコードは、あらかじめ定義されたまたはランダムな配列またはその組み合わせを含むことも可能である。用語「あらかじめ定義された」は、バーコードの配列が、バーコードを含む核酸を合成する時点で、知られていることを意味する。用語「ランダム」または「縮重配列」は、核酸内のバーコードを合成する際に、ヌクレオチドのランダムな混合物を用いることを意味する。非ランダム、すなわち塩基の偏向した混合物をオリゴヌクレオチド配列決定中に用いて、特定の塩基を優先的に含有するバーコードを生じてもよい。バーコードは、ときに、改変されないゲノムに存在する、内因性配列を含むことも可能である。内因性バーコードは、ランダムに断片化された核酸およびアダプターの接合部によって形成可能である。合成−内因性バーコードの組み合わせは、ランダムに断片化された核酸の開始および終了位のゲノム座標ならびにアダプター中の合成バーコードの組み合わせによって形成可能である。
用語、例えばアダプター内の、「一本鎖バーコード」は、相補配列にハイブリダイズしていないバーコードを意味する。「二本鎖バーコード」は、相補配列にハイブリダイズしたバーコードを意味する。例えば、一本鎖バーコードは、アダプターの一本鎖部分に位置することも可能であり、そして二本鎖バーコードはアダプターの二本鎖部分に位置することも可能である。
用語「ハイブリダイズ可能」は、二重鎖を形成可能な2つのポリヌクレオチド鎖を指す。二重鎖は、鎖が完全にまたは少なくとも部分的に相補的である場合に、形成可能である。相補性は、ワトソン−クリック水素結合によって定義可能である。完全なワトソン−クリック相補性の非存在下で、さらなる相互作用(例えばフーグスティーン対形成および疎水性相互作用)がハイブリダイゼーションを支持することも可能である。
用語「ハイブリダイズ不能」は、実験条件下で、二重鎖を形成不能な2つのポリヌクレオチド鎖を指す。鎖が部分的にさえ相補性を共有せず、そしてさらなる相互作用(例えばフーグスティーン対形成および疎水性相互作用)が特異的ハイブリダイゼーションを支持するには十分でない場合、二重鎖は形成不能である。
用語、2つの核酸配列間、特に2つのバーコード間の「編集距離」は、1つの配列を別のものに変化させるために必要な変化の数を指し、ここで、変化は、塩基の付加、除去または置換である。
バーコードに関連した用語「対形成した」は、アダプター分子の2つのオリゴ上の2つのバーコード配列間で既知の関係を有することを意味する。該用語には、相補性(塩基対形成)、逆相補性、ならびに任意の他の人工的関係、例えば参照表が含まれ、バーコード化された2つのアダプター鎖が、ハイブリダイゼーション工程中に、意図的に対形成されていることを示す。
用語「増幅」は、核酸配列のコピー数を増加させるための任意の方法を指す。例えば、増幅は、例えば1またはそれより多いポリメラーゼ連鎖反応(PCR)あるいは増幅の別の指数関数的方法または線形法において、ポリメラーゼを用いて実行可能である。用語「アンプリコン」は、増幅反応の核酸産物を意味する。
用語「普遍的プライマー」および「普遍的プライマー部位」は、いかなるターゲット配列中にも存在しないが、すべてのターゲット配列に付加された(例えばターゲット特異的プライマーの一部であることによって、またはアダプターの一部であることによって)、プライマーおよびプライマー結合性配列を指す。普遍的プライマー部位を付加した後、普遍的プライマーを、試料中のすべてのターゲット配列の増幅または配列決定に使用可能である。
用語「重複排除(deduping)」は、核酸配列を、試料中に元来存在した単一分子の子孫からなる群にグループ分けする方法を指す。重複排除は、子孫分子の配列の分析をさらに含み、減少したエラー率で、元来の分子の配列を間接的に決定する。
用語「エラー」は、核酸配列決定の背景において、正しくない塩基読み取りを指す。該用語は、配列決定工程自体のエラーだけでなく、配列決定工程中に現れる任意のエラーを含む。エラーには、プライマー伸長またはターゲット増幅中のDNAポリメラーゼのエラー、配列決定ポリメラーゼのエラー、および配列決定装置、例えば検出装置のエラーが含まれる。人工的な配列を読み取る場合(例えばアダプター配列)、エラーにはまた、in vitro DNA合成(オリゴ合成)のエラーもまた含まれる。エラーには、塩基置換(誤った塩基)、取り込み欠如(塩基欠失)、または塩基付加(挿入塩基)が含まれる。用語「エラー率」は、正しい塩基読み取りあたりのエラー数を指す。用語、エラー防止手段による「エラー率減少」は、手段を伴わないエラー率に比較した、手段を伴うエラー率を指す。
用語「セルフリーDNA(cfDNA)」は、収集した際、細胞内に含有されていない試料中のDNAを指す。該用語は、細胞または組織のin vitro破壊によって、セルフリーとなったDNAを指さない。cfDNAは、正常細胞および癌細胞由来DNAの両方を含むことも可能である。cfDNAは、一般的に血液または血漿(「循環」)から得られる。cfDNAは、分泌あるいは細胞死プロセス、例えば細胞壊死またはアポトーシスを通じて、循環内に放出されうる。いくつかのcfDNAはctDNA(以下を参照されたい)である。
用語「循環腫瘍DNA(ctDNA)」または「循環癌DNA」は、腫瘍から生じるセルフリーDNA(cfDNA)の分画を指す。
用語「試料」は、被験体から単離される任意の生物学的試料を指す。例えば、試料には、体組織または体液が含まれることも可能である。試料はまた、腫瘍試料であることも可能である。試料は、被験体から直接、以前切除されるかまたは抜き取られた試料から、あるいは環境から(例えば法医学試料)得られることも可能である。
用語「血液試料」は、全血、または血球、血清および血漿を含む、任意のその分画を指す。
本発明には、核酸の一分子配列決定のためのアダプターが含まれる。核酸分子にコンジュゲート化されたアダプターを図1に示す。次世代シークエンシング(NGS)または超並列シークエンシング(MPS)と称される現在の核酸配列決定法は、試料中の各個々の分子の捕捉、場合によって増幅および配列決定を伴う。場合による増幅は、捕捉前、捕捉後、またはその両方であることも可能である。NGSは、さらに、普遍的配列決定プライマー、および場合によって普遍的増幅前プライマーを伴う。普遍的プライマー用の結合部位を生成するため、各ターゲット核酸分子をアダプターにコンジュゲート化する。アダプターは、典型的には、ターゲット核酸分子の両側にコンジュゲート化され、そして普遍的プライマー用の結合部位および配列決定に必要な他の配列を含有する。アダプターは、ターゲット分子が由来する試料をユニークに同定するバーコード(試料IDまたはSID)を含有することも可能である。アダプターは、各ターゲット分子をユニークに同定するバーコード(ユニーク分子IDまたはUID)を含有することも可能である。SIDおよびUIDは、別個に存在することも可能であるし、または単一バーコードに統合されることも可能である。
二本鎖ターゲット核酸にアダプターを付着させる好適な方法は、連結を介したものである。連結反応が起こるために、ターゲット核酸およびアダプターは、適合する端を持たなければならない。いくつかの態様において、ターゲット核酸は末端修復されて平滑端を含有し、そしてアダプターは二本鎖平滑端を有する。他の態様において、ターゲット核酸は末端修復されて、そしてターゲット核酸およびアダプターはどちらも、一塩基伸長を有するように操作される。例えば、T−A対を生成する伸長によって、アダプター分子およびターゲット核酸の間の効率的な連結が可能になる。制限消化から生じるDNAオーバーハングもまた、連結効率を改善するために使用可能である。
特に好適であるのは、例えば米国特許第6395887号に記載されるY型アダプターである。これらのアダプターは、一方の端に二本鎖部分を、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含む。二本鎖部分のみが、ターゲット核酸への連結が可能であり、連結された産物の正しい配向が確実になる。
1つの態様において、本発明は、核酸分析のための新規アダプターである(図1)。該アダプターは、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含む。各部分の正確な長さは、アダプターが以下の特性を所持する限り、本質的ではない:1)以下に記載するすべての要素を収容するために十分な長さを有する;2)適切な融点を有する;そして3)一本鎖部分中で、アダプターの性能を妨害しうる、いかなる二次構造も形成しない。当業者は、特定のアッセイの必要性を満たすために、所望の融点を有するオリゴヌクレオチドを設計することも可能である。同様に、当業者は、最新技術のオリゴヌクレオチド設計ツールを用いて、少なくともいくつかの二次構造形成を回避するかまたは軽減することも可能である。いくつかの態様において、一本鎖部分の長さが20ヌクレオチドを超えず、そして二本鎖の長さが室温でハイブリダイズしたままであり、そしてDNAリガーゼの結合を可能にするために十分であることが望ましい。
アダプターは、1またはそれより多いプライマーのための結合部位を含む。プライマーは、配列決定プライマー、増幅プライマーまたはその両方であることも可能である。いくつかの態様において、同じプライマーが、配列決定プライマーおよび増幅プライマーであることも可能である。アダプターはまた、特定の配列決定技術に特異的な配列、例えば配列決定装置における固体支持体にハイブリダイズする配列(例えばIllumina装置におけるクラスター生成配列)も含むことも可能である。
アダプターは、天然存在塩基(例えばアデノシン(A)、チミジン(T)、グアノシン(G)、シトシン(C)、およびウラシル(U))、他の天然塩基、例えばイノシン(I)およびメチル−シトシン(mC)、天然塩基の修飾型、ならびに非天然存在塩基、例えばアミノアリル−ウリジン、イソシトシン、イソグアニン、および2−アミノプリンを含有することも可能である。
本発明のアダプターは、さらにバーコードを含む。バーコードは、上述の天然または非天然ヌクレオチドを含有することも可能である。バーコードは、あらかじめ定義された配列、ランダム配列、または特定の塩基を優先的に含有する非ランダム偏向配列を有することも可能である。いくつかの態様において、偏向配列を用いて、誤りがちな塩基を回避する。他の態様において、偏向配列を用いて、バーコード含有核酸の融点を調節する。図1に示すように、各アダプターは、2つのバーコードまたはインデックスを、一本鎖部分の一本鎖各々の上に1つずつ含む。ターゲットDNA断片および2つのアダプターを含む連結産物は、4つのバーコードを含む。各アダプター中のバーコード(例えばインデックス1Aおよび1B)は、1:1の関係の配列を有する。関係は、相補性;逆相補性;または1つのバーコード配列(例えばインデックス1A)の同定が、第二のバーコード配列(インデックス1B)を明白に決定する任意の関係であってもよい。
いくつかの態様において、本発明は、図1に記載するアダプターのプールである。プール中、各アダプターは、一方の端に二本鎖部分を、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含む。プール中のアダプターは、1またはそれより多いプライマー、例えば配列決定プライマー、増幅プライマーまたはその両方のための結合部位をさらに含む。プール中のアダプターは、さらにバーコードを含む。具体的には、各アダプターは、一本鎖部分の一本鎖各々の上に1つずつ、2つのバーコードを含む。アダプター中のバーコードは、1:1の関係であり、1つのバーコード配列の同定は、第二のバーコード配列を明白に決定する。配列は、相補性、逆相補性であってもよいし、または上述のいずれでなくてもよい。
プール内のアダプターは、少なくとも1または少なくとも3編集距離離れたバーコードを有する。当業者は、特定の実験のために、どの編集距離が最適であるかを決定可能であろう。一般的に、編集距離がより大きいことは、1つのプール中により少ないバーコードが使用可能であることを意味する。しかし、アッセイまたは製造プロセスが高いエラー率を有する場合、より大きい編集距離が必要となるであろう。例えば、アダプターを作製するために用いるオリゴヌクレオチド製造プロセスは、高いエラー率を有しうる。同様に、合成ワークフローによる配列決定におけるDNA増幅またはプライマー伸長で用いる核酸ポリメラーゼは、高いエラー率を有しうる。これらのエラー率は、プールのアダプター中のバーコード間の編集距離を増加させる必要があるであろう。逆に、上述の方法各々の精度を改善すると、プールのアダプター中のバーコード間の編集距離を減少させることが可能であろう。
いくつかの態様において、本発明は、各々2つのアニーリングしたオリゴヌクレオチドからなる、Nの別個のアダプターのプール(プール中に2Nオリゴヌクレオチド)である。アダプター中のバーコードの長さに応じて、各試料は、Aアダプターからなるプールを必要とするであろう。したがって、Nのプールは、N/A=S試料において使用可能である。いくつかの態様において、製品は、アダプターの全プールを含有する単一バイアルを含むことも可能である。あるいは、製品は、プールの1またはそれより多いアダプターが別個のバイアル中に存在するキットを含むことも可能である。
いくつかの態様において、本発明は、核酸分析のためのアダプターを作製する方法である。該方法は、核酸の2つの一本鎖を対方式で合わせ、そしてアニーリングさせて、各アダプターが、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含むアダプターを形成する工程を含む。アダプターを形成する一本鎖は、1またはそれより多いプライマー、例えば配列決定プライマー、増幅プライマーまたは両方のための結合部位を含む。アダプターを形成する一本鎖は、さらにバーコードを含む。具体的には、各鎖は、非相補領域中にバーコードを含み、したがって、各アダプターは、一本鎖部分の各々の一本鎖の上に少なくとも1つずつ、少なくとも2つのバーコードを含む。アダプター中のバーコードが1:1関係であるように、一本鎖を合わせ、そしてアニーリングさせる。配列は、相補的、逆相補的であってもよいし、または上述のいずれでなくてもよく、すなわち2つの異なる配列であってもよい。後者の場合、1つの配列(例えば図1中のインデックス1A)の同定が、第二の配列(図1中のインデックス1B)を明白に決定する参照を生成することを伴う方法において、アダプターを使用可能である。
いくつかの態様において、本発明は、一本鎖バーコードを含むアダプターを用いて、試料中の核酸を配列決定する方法である。該方法は、試料中の核酸に、アダプターのプールを付着させて、アダプター−ターゲット分子のプールを形成する工程を含む。付着は、DNAリガーゼ、例えばT4 DNAリガーゼ、大腸菌(E. coli)DNAリガーゼ、哺乳動物リガーゼ、またはその任意の組み合わせを用いた連結を介してもよい。哺乳動物リガーゼは、DNAリガーゼI、DNAリガーゼIII、またはDNAリガーゼIVであってもよい。リガーゼはまた熱安定性リガーゼであってもよい。いくつかの態様において、連結効率を増加させるため、試料核酸を末端修復(例えばDNAポリメラーゼを用いたもの)およびAテール付加に供してもよく、また、DNAポリメラーゼまたは末端トランスフェラーゼに供してもよい。
各アダプターは、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含む。アダプターは、一本鎖部分の一方の鎖に第一のバーコードを、そして一本鎖部分の他方の鎖に第二のバーコードを含み、そしてここで、各アダプター中の第一および第二のバーコードは、第一のバーコード各々が、第二のバーコード各々と明白に関連しうるように、既知の関係にある。各試料において、バーコードの多数の対を伴う多数のアダプターが存在するが、アダプターは各試料中のターゲット核酸分子よりも少ない。しかし、バーコードのユニークな対を伴うアダプターの数は、試料中の元来の核酸分子のすべて、ほぼすべて、または望ましい割合を同定するために十分である。同定は、以下に記載するように、ユニークなバーコードおよび各ターゲット核酸分子のゲノム座標(ブレイクポイント)の両方を利用する。アダプターは、1またはそれより多いプライマーの結合部位をさらに含む。いくつかの態様において、方法は、配列を決定する前に、アダプター−ターゲット分子の両方の鎖を増幅する工程をさらに含む。方法は、アダプター−ターゲット分子の配列を決定する工程をさらに含む。この工程において、ターゲット核酸の配列の少なくとも一部を決定し、そしてアダプター中のバーコードの配列を決定する。方法は、各々第一のバーコードを含有するアダプター−ターゲット配列を、第一のバーコードと既知の関係にある対応する第二のバーコードを含有するアダプター−ターゲット配列と対形成させる、エラー修正工程をさらに含む。図1に示すように、バーコード1Aを含むアダプターに付着したターゲット配列は、バーコード1Bを含むアダプターに付着したターゲット配列と対形成する。バーコード1Aを含む第一の分子は、元来の分子の第一の鎖に相当し、そしてバーコード1Bを含む第二の分子は、元来の分子の第二の鎖に相当する。バーコード1Aおよび1Bの対形成は、エラー修正のため、元来の鎖のマッチングを可能にする。第一および第二の分子のターゲット配列が同一でない場合、例えば第一の分子にのみ塩基置換が存在するが、第二の分子には存在しない場合、変化は、実験エラーであると見なされる。実験エラーを含有する分子は結果から除外する。いくつかの態様において、生データファイルに見られる、実験エラーを含有する分子は、結果ファイルに含まれない。
同じ起源の配列もまた、同じアダプターバーコードおよびターゲット核酸の同じゲノム座標を有することによって同定される。同じ起源の分子のターゲット配列が同一でない場合、例えば同じ起源の分子の一部にのみ塩基置換が存在する場合、変化は実験エラーと見なされる。
いくつかの態様において、試料はセルフリー核酸、例えばセルフリー血漿核酸を含む。こうしたDNAを断片化してもよく、例えば平均長さ約170ヌクレオチドであってもよく、これは単一ヌクレオソーム周囲に巻き付けられるDNAの長さと一致していてもよい。試料核酸が天然に断片化されない態様において、核酸を、例えば超音波処理または制限消化を用いて、in vitroで断片化してもよい。

Claims (9)

  1. アダプターのプールであって、各アダプターが、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含み、そして少なくとも1つのプライマー結合部位および各一本鎖部分中の少なくとも1つのバーコードをさらに含み、該プール中の各アダプター上のバーコードが既知の関係にあり、バーコード間の該関係が逆相補性または相補性である、前記アダプターのプール。
  2. バーコード間の前記関係が参照表に捉えられている、請求項のアダプターのプール。
  3. 請求項1または2のアダプターのプールを含む製品。
  4. 前記プールが単一バイアル中に含有される、請求項の製品。
  5. 核酸を配列決定する方法であって:
    a)試料中の各核酸に、一方の端に二本鎖部分、そして反対側の端に2つのハイブリダイズ不能鎖を含む一本鎖部分を含み、そして少なくとも1つのプライマー結合部位ならびに一本鎖部分の第一の鎖上の第一のバーコードおよび第二の鎖上の第二のバーコードをさらに含む、請求項1または2のアダプターのプールに由来するアダプターを連結し、ここでプール中の各アダプター上の該第一および該第二のバーコードは既知の関係にある、
    b)核酸鎖の少なくとも一部ならびに第一および第二のバーコードの配列を決定し、
    c)第一のバーコードを含有する核酸鎖の配列、および第二のバーコードを含有する核酸鎖の配列を比較して、完全には相補性でない配列を同定し、
    d)完全には相補性でない配列が、少なくとも1つの実験エラーを含有することを決定する
    工程を含む、前記方法。
  6. 配列決定の前に、連結された核酸を増幅して、第一および第二のバーコードを含有する別個の二本鎖配列を得る工程をさらに含む、請求項の方法。
  7. 少なくとも1つの実験エラーを含有すると決定された配列を、配列決定結果から除外する、請求項の方法。
  8. 同じバーコードおよび核酸の同じゲノム座標を含有する配列をグループ分けし、グループ内の配列を比較して、非同一配列を同定し、そして該非同一配列が少なくとも1つの実験エラーを含有することを決定する工程をさらに含む、請求項の方法。
  9. 前記試料がセルフリーDNAを含有する、請求項の方法。
JP2018539334A 2016-01-29 2017-01-26 核酸配列決定のための新規アダプターおよび使用法 Active JP6714709B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662288903P 2016-01-29 2016-01-29
US62/288,903 2016-01-29
PCT/EP2017/051588 WO2017129647A1 (en) 2016-01-29 2017-01-26 A novel adaptor for nucleic acid sequencing and method of use

Publications (2)

Publication Number Publication Date
JP2019504624A JP2019504624A (ja) 2019-02-21
JP6714709B2 true JP6714709B2 (ja) 2020-06-24

Family

ID=57890833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018539334A Active JP6714709B2 (ja) 2016-01-29 2017-01-26 核酸配列決定のための新規アダプターおよび使用法

Country Status (6)

Country Link
US (2) US20180334709A1 (ja)
EP (1) EP3408406B1 (ja)
JP (1) JP6714709B2 (ja)
CN (1) CN108474026A (ja)
ES (1) ES2924487T3 (ja)
WO (1) WO2017129647A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019002366A1 (en) * 2017-06-27 2019-01-03 F. Hoffmann-La Roche Ag MODULAR ADAPTERS OF NUCLEIC ACID
CN112041462A (zh) * 2018-03-23 2020-12-04 德克萨斯州立大学董事会 具有极低的错误水平的dsDNA有效测序
US11555185B2 (en) 2018-12-19 2023-01-17 New England Biolabs, Inc. Target enrichment
WO2022008578A1 (en) 2020-07-08 2022-01-13 F. Hoffmann-La Roche Ag Targeted depletion of non-target library molecules using poison primers during target capture of next-generation sequencing libraries
JPWO2022131285A1 (ja) 2020-12-15 2022-06-23
WO2024046992A1 (en) 2022-09-02 2024-03-07 F. Hoffmann-La Roche Ag Improvements to next-generation target enrichment performance

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6395887B1 (en) 1995-08-01 2002-05-28 Yale University Analysis of gene expression by display of 3'-end fragments of CDNAS
JP4708029B2 (ja) * 2002-10-11 2011-06-22 エラスマス・ユニバーシティー・ロッテルダム Pcrベースのクローン性研究のための核酸増幅プライマー
JP4517114B2 (ja) * 2003-03-28 2010-08-04 国立障害者リハビリテーションセンター総長 cDNA合成方法
US20060223122A1 (en) * 2005-03-08 2006-10-05 Agnes Fogo Classifying and predicting glomerulosclerosis using a proteomics approach
GB2424946A (en) * 2005-04-05 2006-10-11 Stratec Biomedical Systems Ag A detection system for substance binding using up-converting fluorescent probes
US8029993B2 (en) * 2008-04-30 2011-10-04 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US10388403B2 (en) * 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
CN102725424B (zh) * 2010-01-25 2014-07-09 Rd生物科技公司 靶核酸的自折叠扩增
EP2531608B1 (en) * 2010-02-05 2020-08-19 Siemens Healthcare Diagnostics Inc. Methods for increasing multiplex level by externalization of passive reference in polymerase chain reactions
ES2623859T3 (es) * 2010-03-04 2017-07-12 Miacom Diagnostics Gmbh FISH múltiple mejorada
EP2702175B1 (en) * 2011-04-25 2018-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
WO2012162161A1 (en) * 2011-05-20 2012-11-29 Phthisis Diagnostics Microsporidia detection system and method
CA2858070C (en) * 2011-12-09 2018-07-10 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
EP3305918B1 (en) * 2012-03-05 2020-06-03 President and Fellows of Harvard College Methods for epigenetic sequencing
AU2013267609C1 (en) * 2012-05-31 2019-01-03 Board Of Regents, The University Of Texas System Method for accurate sequencing of DNA
DK3553175T3 (da) * 2013-03-13 2021-08-23 Illumina Inc Fremgangsmåde til fremstilling af et nukleinsyresekvenseringsbibliotek
CN106062214B (zh) * 2013-12-28 2020-06-09 夸登特健康公司 用于检测遗传变异的方法和系统
EP4039811B1 (en) * 2014-01-31 2023-09-20 Integrated DNA Technologies, Inc. Improved methods for processing dna substrates
US9745614B2 (en) * 2014-02-28 2017-08-29 Nugen Technologies, Inc. Reduced representation bisulfite sequencing with diversity adaptors
EP3155127B1 (en) * 2014-06-13 2020-07-22 Life Technologies Corporation Multiplex nucleic acid amplification
ES2925014T3 (es) * 2014-09-12 2022-10-13 Univ Leland Stanford Junior Identificación y uso de ácidos nucleicos circulantes
US10844428B2 (en) * 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)

Also Published As

Publication number Publication date
EP3408406B1 (en) 2022-06-15
ES2924487T3 (es) 2022-10-07
WO2017129647A1 (en) 2017-08-03
US20230124718A1 (en) 2023-04-20
EP3408406A1 (en) 2018-12-05
US20180334709A1 (en) 2018-11-22
CN108474026A (zh) 2018-08-31
JP2019504624A (ja) 2019-02-21

Similar Documents

Publication Publication Date Title
US11725241B2 (en) Compositions and methods for identification of a duplicate sequencing read
US10907207B2 (en) Methods for analyzing nucleic acids
JP6714709B2 (ja) 核酸配列決定のための新規アダプターおよび使用法
JP2021168659A (ja) 次世代ゲノムウォーキングのための方法ならびに関連する組成物およびキット
JP7051677B2 (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
US20220364169A1 (en) Sequencing method for genomic rearrangement detection
US20130053253A1 (en) Region of Interest Extraction and Normalization Methods
US20240141426A1 (en) Compositions and methods for identification of a duplicate sequencing read
JP2022553164A (ja) 3’オーバーハングを修復する方法
CN116685696A (zh) 从两端对多核苷酸片段进行测序的方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200605

R150 Certificate of patent or registration of utility model

Ref document number: 6714709

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250