JP2022521766A - 次世代シーケンシングのための組成物および方法 - Google Patents

次世代シーケンシングのための組成物および方法 Download PDF

Info

Publication number
JP2022521766A
JP2022521766A JP2021549708A JP2021549708A JP2022521766A JP 2022521766 A JP2022521766 A JP 2022521766A JP 2021549708 A JP2021549708 A JP 2021549708A JP 2021549708 A JP2021549708 A JP 2021549708A JP 2022521766 A JP2022521766 A JP 2022521766A
Authority
JP
Japan
Prior art keywords
polynucleotide
region
adapter
examples
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021549708A
Other languages
English (en)
Other versions
JPWO2020176362A5 (ja
Inventor
ガント,リチャード
チェン,シユアン
Original Assignee
ツイスト バイオサイエンス コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ツイスト バイオサイエンス コーポレーション filed Critical ツイスト バイオサイエンス コーポレーション
Publication of JP2022521766A publication Critical patent/JP2022521766A/ja
Publication of JPWO2020176362A5 publication Critical patent/JPWO2020176362A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/15Nucleic acids forming more than 2 strands, e.g. TFOs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3231Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/107Temperature of melting, i.e. Tm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【解決手段】本明細書には、ユニバーサル・ポリヌクレオチド・アダプタを使用する次世代シーケンシングのための組成物と方法が提供される。さらに、ロックド核酸または架橋核酸を使用するユニバーサルアダプタが提供される。また、ユニバーサルアダプタの伸長のために長さを短くしたバーコード化プライマーが提供される。さらに本明細書にはユニバーサルアダプタブロッカーが提供される。【選択図】図1A

Description

相互参照
本出願は、2019年2月25日出願の米国仮特許出願第62/810,321号、2019年10月14日出願の米国仮特許出願第62/914,904号、および2019年10月25日出願の米国仮特許出願第62/926,336号に基づく利益を主張するものであり、これら出願はすべてその全体を参照することで本明細書に引用される。
高忠実度かつ低コストでの非常に効率的な化学的遺伝子合成には、バイオテクノロジー、医療、および基礎的な生物学的研究において中心的な役割がある。デノボ遺伝子合成は、基礎的な生物学的研究およびバイオテクノロジー用途に対して強力なツールである。小規模での比較的短いフラグメントの合成の様々な方法が知られているが、これらの技法には、スケーラビリティ、自動化、速度、精度、およびコストの点でしばしば問題がある。
参照による引用
本明細書で言及される刊行物、特許、および特許出願はすべて、あたかも個々の刊行物、特許、または特許出願がそれぞれ参照により引用されるように具体的かつ個々に指示されるのと同じ程度にまで、参照により本明細書に引用される。
本明細書には、次世代シーケンシングのための組成物と方法が提供される。
本明細書にはポリヌクレオチドが提供され、該ポリヌクレオチドは、第1の末端アダプター領域、第1の非相補的領域、および第1のヨーク領域(yoke region)を含む第1の鎖と、第2の末端アダプター領域、第2の非相補的領域、および第2のヨーク領域を含む第2の鎖とを含み、前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的ではなく、前記第1のヨーク領域または前記第2のヨーク領域は少なくとも1つの核酸塩基アナログを含む。本明細書ではさらに、前記核酸塩基アナログが、前記第1ヨーク領域を前記第2のヨーク領域に結合するTを増加させる、ポリヌクレオチドが提供される。本明細書ではさらに、前記核酸塩基アナログがロックド核酸(LNA)または架橋核酸(BNA)である、ポリヌクレオチドが提供される。本明細書ではさらに、相補的な前記第1のヨーク領域と前記第2のヨーク領域が、長さ15未満の塩基である、ポリヌクレオチドが提供される。本明細書ではさらに、相補的な前記第1のヨーク領域と前記第2のヨーク領域が、長さ10未満の塩基である、ポリヌクレオチドが提供される。相補的な前記第1のヨーク領域と前記第2のヨーク領域が、長さ6未満の塩基である、ポリヌクレオチドが提供される。本明細書ではさらに、前記アダプターがバーコードまたはインデックス配列を含まない、ポリヌクレオチドが提供される。
本明細書にはポリヌクレオチドが提供され、該ポリヌクレオチドは、二重試料核酸(duplex sample nucleic acid)と、前記二重試料核酸の5’末端にライゲートされる第1のポリヌクレオチドと、前記二重試料核酸の3’末端にライゲートされる第2のポリヌクレオチドとを含み、前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドは、第1の末端アダプター領域、第1の非相補的領域、および第1のヨーク領域を含む第1の鎖と、第2の末端アダプター領域、第2の非相補的領域、および第2のヨーク領域を含む第2の鎖とを含み、前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的ではなく、前記第1のヨーク領域または前記第2のヨーク領域は少なくとも1つの核酸塩基アナログを含む。本明細書ではさらに、前記二重試料核酸がDNAである、ポリヌクレオチドが提供される。本明細書ではさらに、前記二重試料核酸がゲノムDNAである、ポリヌクレオチドが提供される。本明細書ではさらに、前記ゲノムDNAがヒト由来のものである、ポリヌクレオチドが提供される。本明細書ではさらに、前記第1ポリヌクレオチドまたは前記第2のポリヌクレオチドが少なくとも1つのバーコードを含む、ポリヌクレオチドが提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ8の塩基である、ポリヌクレオチドが提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ12の塩基である、ポリヌクレオチドが提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ16の塩基である、ポリヌクレオチドが提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ8~12の塩基である、ポリヌクレオチドが提供される。本明細書ではさらに、前記第1のポリヌクレオチドが第1のバーコードと第2のバーコードを含み、前記第2のポリヌクレオチドが第3のバーコードと第4のバーコードを含む、ポリヌクレオチドが提供される。本明細書ではさらに、前記第1のバーコードと前記第3のバーコードが同じポリヌクレオチドを有し、前記第2のバーコードと前記第4のバーコードが同じ配列を有する、ポリヌクレオチドが提供される。本明細書ではさらに、ポリヌクレオチドの各バーコードが固有の配列を含む、ポリヌクレオチドが提供される。
本明細書には、試料核酸を標識する方法が提供され、該方法は、(1)アダプターでライゲートされた試料核酸を生成するために少なくとも1つのポリヌクレオチドを少なくとも1つの試料核酸にライゲートする工程であって、前記ポリヌクレオチドは、第1のプライマー結合領域、第1の非相補的領域、および第1のヨーク領域を含む第1の鎖と、第2のプライマー結合領域、第2の非相補的領域、および第2のヨーク領域を含む第2の鎖とを含み、前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的でない、工程と、(2)少なくとも1つのアダプターでライゲートされた試料核酸を第1のプライマーおよびポリメラーゼと接触させる工程であって、前記第1のプライマーは、第3のプライマー結合部位と、第4のプライマー結合部位と、少なくとも1つのバーコードとを含み、前記第3のプライマー結合部位は、少なくとも1つのポリヌクレオチドアダプターの長さ未満に対して相補的であり、前記第1のプライマー結合部位に相補的である、工程と、(3)少なくとも1つのアダプターでライゲートされた増幅試料核酸を生成するために前記ポリヌクレオチドを伸長させる工程であって、前記アダプターでライゲートされた増幅試料核酸は少なくとも1つのバーコードを含む、工程とを含む。本明細書ではさらに、前記プライマーが長さ30未満の塩基である、方法が提供される。本明細書ではさらに、前記プライマーが長さ20未満の塩基である、方法が提供される。本明細書ではさらに、前記ポリヌクレオチドがバーコードを含まない、方法が提供される。本明細書ではさらに、前記プライマーが1つのバーコードを含む、方法が提供される。本明細書ではさらに、前記少なくとも1つのバーコードがインデックス配列を含む、方法が提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ8の塩基である、方法が提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ12の塩基である、方法が提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ16の塩基である、方法が提供される。本明細書ではさらに、前記少なくとも1つのバーコードが、少なくとも長さ8~12の塩基である、ポリヌクレオチドが提供される。本明細書ではさらに、前記インデックス配列が、同じソース由来の試料核酸のライブラリによくみられるものである、方法が提供される。本明細書ではさらに、前記少なくとも1つのバーコードが固有の分子識別子(UMI)を含む、方法が提供される。本明細書ではさらに、2つのポリヌクレオチドが核酸をサンプリングするためにライゲートされる、方法が提供される。本明細書ではさらに、第1ポリヌクレオチドが前記試料核酸の5’末端に、前記第2のポリヌクレオチドが前記試料核酸の3’末端にライゲートされる、方法が提供される。本明細書ではさらに、前記方法が、(4)少なくとも1つのアダプターでライゲートされた試料核酸を第2のプライマーおよびポリメラーゼと接触させる工程であって、前記第2のプライマーは、第5のプライマー結合部位と、第6のプライマー結合部位と、少なくとも1つのバーコードとを含み、前記第6のプライマー結合部位は、少なくとも1つのポリヌクレオチドの長さ未満に対して相補的であり、前記第2のプライマー結合部位に相補的である、工程と、(5)少なくとも1つのアダプターでライゲートされた増幅試料核酸を生成するために前記ポリヌクレオチドを伸長させる工程であって、前記アダプターでライゲートされた増幅試料核酸は少なくとも1つのバーコードを含む、工程とをさらに含む、方法が提供される。本明細書ではさらに、前記アダプターでライゲートされた試料核酸を配列決定する工程をさらに含む、方法が提供される。
本明細書に組成物が提供され、該組成物は、アダプターでライゲートされた試料核酸の1つ以上の領域に結合するよう構成される少なくとも3つのポリヌクレオチドブロッカーであって、前記アダプターでライゲートされた試料核酸は、第1の非相補的領域、第1のインデックス領域、第2の非相補的領域、第1のヨーク領域、第3の非相補的領域、第2のインデックス領域、第4の非相補的領域、および第2のヨーク領域を含み、前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的でない、ポリヌクレオチドブロッカーと、前記第1のヨーク領域および前記第2のヨーク領域に隣接するゲノムインサートとを含み、少なくとも1つのポリヌクレオチドブロッカーは、前記第1のヨーク領域または前記第2のヨーク領域に相補的ではなく、かつ、前記ポリヌクレオチドブロッカーと前記アダプターでライゲートされた試料核酸との結合を増大させるように構成される少なくとも1つのヌクレオチドアナログを含む。本明細書ではさらに、少なくとも2つのポリヌクレオチドブロッカーが、前記第1のヨーク領域または前記第2のヨーク領域に相補的ではなく、かつ、それぞれ、前記ポリヌクレオチドブロッカーと前記アダプターでライゲートされた試料核酸との結合を増大させるように構成される少なくとも1つの修飾核酸塩基を含む、組成物が提供される。本明細書ではさらに、少なくとも1つのインデックス領域がバーコードまたは固有の分子識別子を含む、組成物が提供される。本明細書ではさらに、少なくとも1つのインデックス領域が長さ5~15の塩基である、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーの少なくとも1つが少なくとも1つのユニバーサル塩基を含む、組成物が提供される。本明細書ではさらに、前記少なくとも1つのユニバーサル塩基が5-ニトロインドールまたは2-デオキシイノシンである、組成物が提供される。本明細書ではさらに、前記少なくとも1つのユニバーサル塩基が、少なくとも1つのインデックス配列と重なるように構成される、組成物が提供される。本明細書ではさらに、前記少なくとも2つのユニバーサル塩基が、少なくとも2つのインデックス配列と重なるように構成される、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーの少なくとも2つが少なくとも1つのユニバーサル塩基を含み、前記少なくとも1つのユニバーサル塩基はそれぞれ、少なくとも1つのインデックス配列と重なる、組成物が提供される。本明細書ではさらに、重なりが長さ2~10の塩基である、組成物が提供される。本明細書ではさらに、4つ以下のポリヌクレオチドブロッカーを含む、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーが1つ以上のロックド核酸(LNA)または1つ以上の架橋核酸(BNA)を含む、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーが少なくとも5つのヌクレオチドアナログを含む、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーが少なくとも10のヌクレオチドアナログを含む、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーのTmが少なくとも78℃である、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーのTmが少なくとも80℃である、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーのTmが少なくとも82℃である、組成物が提供される。本明細書ではさらに、前記ポリヌクレオチドブロッカーのTmが80~90℃である、組成物が提供される。
本明細書には核酸ハイブリダイゼーションのための方法が提供され、該方法は、複数のゲノムインサートを含む、アダプターでライゲートされた試料核酸ライブラリを提供する工程と、前記アダプターでライゲートされた試料核酸ライブラリを、本明細書で提供される組成物の存在下で少なくとも5000のポリヌクレオチドプローブを含むプローブライブラリと接触させる工程と、プローブの少なくとも一部を前記ゲノムインサートにハイブリダイズする工程とを含む。前記試料核酸ライブラリが少なくとも100万の固有ゲノムインサートを含む、請求項54に記載の方法。本明細書ではさらに、前記ゲノムインサートの少なくとも一部がヒトDNAを含む、方法が提供される。本明細書ではさらに、濃縮された試料核酸ライブラリを生成する工程をさらに含む、方法が提供される。本明細書ではさらに、前記濃縮された試料核酸ライブラリを配列決定する工程をさらに含む、方法が提供される。本明細書ではさらに、前記試料核酸ライブラリが、次世代シーケンシングのために構成されるアダプターを含む、方法が提供される。
ユニバーサルアダプターまたは「太くて短い(stubby)」アダプターを表す。 試料核酸の末端にライゲートされる2つのユニバーサルアダプターを表す。 ユニバーサルアダプターを伸長させるのに使用されるバーコード化プライマーを表す。 試料ポリヌクレオチドの末端にライゲートされる2つのユニバーサルアダプター(伸長/バーコード追加後)を表す。 バーコード化され、アダプターでライゲートされた試料ポリヌクレオチドを生成するためにユニバーサルアダプターに結合する、バーコード化プライマーを表す。 バーコード化され、アダプターでライゲートされた試料ポリヌクレオチドを生成するためにユニバーサルアダプターに結合する、バーコード化プライマーを表す。 シーケンシング前にバーコード化アダプターをライゲートし、かつプローブライブラリにより試料ポリヌクレオチドを濃縮するための概略図を表す。 シーケンシング前にユニバーサルアダプターをライゲートし、該アダプターにバーコードを付し、プローブライブラリにより試料ポリヌクレオチドを濃縮するための概略図を表す。 標準のバーコード化Yアダプターまたはユニバーサルアダプターに対する、アダプターでライゲートされた試料ポリヌクレオチドの濃度を表す。 全ゲノムシーケンシング中の標準のバーコード化YアダプターまたはユニバーサルアダプターのATドロップアウト率(AT dropout rates)を表す。 様々な試料インデックス番号に対し特定されるリード数を表す。前記試料指数はユニバーサルアダプターに追加される。 バーコードを伴う従来のYアダプター、ユニバーサルアダプター(PCRにより追加されるバーコードを伴う)、UMIを伴う従来のYアダプター、およびUMIを伴うユニバーサルアダプターを使用して生成されるライブラリに対する、HSライブラリのサイズを表す。 バーコードを伴う従来のYアダプター、ユニバーサルアダプター(PCRにより追加されるバーコードを伴う)、UMIを伴う従来のYアダプター、およびUMIを伴うユニバーサルアダプターを使用して生成されるライブラリに対する、30倍のリード深さでの標的塩基の割合を表す。 プローブによる試料ポリヌクレオチドのキャプチャーと濃縮を表す。 クラスター増幅からのポリヌクレオチドライブラリ生成の概略図を表す。 標的化と濃縮を行うための一対のポリヌクレオチドを表す。このポリヌクレオチドは、相補的標的結合(インサート)配列のほか、プライマー結合部位を含む。 標的化と濃縮を行うための一対のポリヌクレオチドを表す。このポリヌクレオチドは、相補的標的結合(インサート)配列、プライマー結合部位、および非標的配列を含む。 より大きなポリヌクレオチドの標的配列に対するポリヌクレオチド結合構成を表す。この標的配列は前記ポリヌクレオチド結合領域よりも短く、前記ポリヌクレオチド結合領域(またはインサート配列)は標的配列に対してオフセットされ、隣接する配列の一部にも結合する。 より大きなポリヌクレオチドの標的配列に対するポリヌクレオチド結合構成を表す。この標的配列の長さは前記ポリヌクレオチド結合領域以下であり、前記ポリヌクレオチド結合領域は前記標的配列の中心に位置し、隣接する配列の一部にも結合する。 より大きなポリヌクレオチドの標的配列に対するポリヌクレオチド結合構成を表す。この標的配列は前記ポリヌクレオチド結合領域よりもわずかに長く、前記ポリヌクレオチド結合領域は、両側で緩衝液領域により標的配列の中心に位置する。 より大きなポリヌクレオチドの標的配列に対するポリヌクレオチド結合構成を表す。この標的配列は前記ポリヌクレオチド結合領域よりも長く、2つのポリヌクレオチドの結合領域は前記標的配列に及ぶように重なっている。 より大きなポリヌクレオチドの標的配列に対するポリヌクレオチド結合構成を表す。この標的配列は前記ポリヌクレオチド結合領域よりも長く、2つのポリヌクレオチドの結合領域は前記標的配列に及ぶように重なっている。 より大きなポリヌクレオチドの標的配列に対するポリヌクレオチド結合構成を表す。この標的配列は前記ポリヌクレオチド結合領域よりも長く、2つのポリヌクレオチドの結合領域は前記標的配列に及ぶように重なっておらず、間隙(405)が残る。 より大きなポリヌクレオチドの標的配列に対するポリヌクレオチド結合構成を表す。この標的配列は前記ポリヌクレオチド結合領域よりも長く、3つのポリヌクレオチドの結合領域は前記標的配列に及ぶように重なっている。 本明細書に開示されるような遺伝子合成の典型的なプロセスワークフローを実証する工程の略図を提示する。 コンピュータシステムを示す。 コンピュータシステムの構造を図示するブロック図である。 複数のコンピュータシステム、複数の携帯電話、個人用携帯情報端末、およびネットワーク接続ストレージ(NAS)を組み込むように構成されるネットワークを実証する図である。 共有仮想アドレスメモリ空間を用いるマルチプロセッサ・コンピュータ・システムのブロック図である。 256個のクラスターを有するプレートの画像である。各クラスターには、座から伸長するポリヌクレオチドを伴う121個の座がある。 240個のクラスターの29,040個の固有のポリヌクレオチド合成からの、プレート全体にわたるポリヌクレオチド表現(ポリヌクレオチド頻度対存在量、測定した吸収度として)のプロットである。各クラスターには121個のポリヌクレオチドがある。 対照クラスターがボックスにより特定されている、個々のクラスター全体にわたるポリヌクレオチド頻度対存在吸収度(測定した吸収度として)の測定のプロットである。 4個それぞれのクラスター全体にわたるポリヌクレオチド頻度対存在量(測定した吸収度として)の測定のプロットである。 240個のクラスターの29,040個の固有のポリヌクレオチド合成からの、プレート全体にわたる頻度対エラー率のプロットである。各クラスターには121個のポリヌクレオチドがある。 対照クラスターがボックスにより特定されている、個々のクラスター全体にわたるポリヌクレオチドエラー率対頻度の測定のプロットである。 4個のクラスター全体にわたるポリヌクレオチド頻度対エラー率の測定のプロットである。 ポリヌクレオチド数対ポリヌクレオチド1つ当たりの割合から測定されるGC含有量のプロットである。 シーケンシングライブラリを生成するために、試料の断片化、末端修復、Aテーリング(A-tailing)、ユニバーサルアダプターのライゲーション、およびPCR増幅によるアダプターへのバーコード付加の概略図を表す。追加の工程として随意に、濃縮、さらなる増幅、および/またはシーケンシングが挙げられる(図示せず)。 10サイクルのPCRにより増幅される完全長の標準Yアダプター、および8サイクルのPCRにより増幅されるユニバーサルアダプターに対するライゲーション産物の濃度(ng/uL)のプロットである。ユニバーサルアダプターにより、少数のPCRサイクルでより高収量のライゲーション産物が得られる。 ライゲーション産物の濃度(蛍光により測定)vsライゲーション産物のサイズ(bp)のプロットを示す。両グラフの矢印は、ゲノムポリヌクレオチドインサートを含まないアダプター二量体に相当するピークを示す。ユニバーサルアダプター(右のグラフ)により、完全長の標準Yアダプター(左のグラフ)より少数のアダプター二量体が得られる。 10bpの二重インデックス配列または8bpの二重インデックス配列(96-plex)を含むユニバーサルプライマーによる最終増幅に関する、未調整の相対的シーケンシングパフォーマンスに対する数のプロットである。相対的シーケンシングパフォーマンスは、各デザインでの完全なインデックスリードの合計数を標準化することで算出した。10bpの二重インデックスプライマーは、より厳格な相対的パフォーマンス、およびより均一なシーケンシング表現を示した。 10bpの二重インデックス配列または8bpの二重インデックス配列(96-plex)を含むユニバーサルプライマーによる最終増幅に関する、平均の中心的相対的シーケンシングパフォーマンスに対する数のプロットである。相対的シーケンシングパフォーマンスは、各デザインでの完全なインデックスリードの合計数を標準化し、最上部のパフォーマーに対して標準化することで算出した。結果、各集団の分布は、直接の比較のためにそれらの算出平均に集中した。10bpの二重インデックスプライマーは、より厳格な相対的パフォーマンス、およびより均一なシーケンシング表現を示した。 10bpの二重インデックス配列または8bpの二重インデックス配列(96-plex)を含むユニバーサルプライマーによる最終増幅に関する、相対的バーコードパフォーマンス対各バーコード配列のプロットである。 ユニバーサルアダプターから生成され、かつ単一プールとして配列決定される、一組の1,152のUDIプライマーペアの初期スクリーニングのプロットである。 ユニバーサルアダプターから生成され、かつ単一プールとして配列決定される、一組の384のUDIプライマーペアのプロットである。 ユニバーサルアダプターから生成され、かつ独立して配列決定される、96のUDIプライマーペアの個々のプールのプロットである。 ユニバーサルアダプターから生成され、かつ独立して配列決定される、96のUDIプライマーペアの個々のプールのプロットである。 ユニバーサルアダプターから生成され、かつ独立して配列決定される、96のUDIプライマーペアの個々のプールのプロットである。 ユニバーサルアダプターから生成され、かつ独立して配列決定される、96のUDIプライマーペアの個々のプールのプロットである。 均一なカバレッジ(上のパネル)と不均一なカバレッジ(下のパネル)のプロットを表す。 様々な対照薬パネル(対照薬A1、対照薬A2、および対照薬D)およびライブラリ4Aのfold 80 base penaltyのグラフである。 オンターゲット率、ニアターゲット率、およびオフターゲット率の概略図を表す。 様々な対照薬パネル(対照薬A1、対照薬A2、および対照薬D)およびライブラリ4Aのオンターゲット率のグラフである。 様々な対照薬パネル(対照薬A1、対照薬A2、および対照薬D)およびライブラリ4Aの重複率のグラフを表す。図28EはHSライブラリサイズを表す。 様々な対照薬パネル(対照薬A1、対照薬A2、および対照薬D)およびライブラリ4Aの重複率のグラフを表す。図28Fは、複製としてマーキングされるリードにあるためフィルタ処理された位置合わせ済み塩基の画分の割合を表す。 様々な対照薬パネル(対照薬A1、対照薬A2、および対照薬D)およびライブラリ4Aの深度カバレッジのグラフである。 内容物のカスタムパネルへの添加または濃縮の第1の概略図である。 内容物のカスタムパネルへの添加または濃縮の第2の概略図である。 補足プローブを伴うパネルと伴わないパネルとを比較する、均一性(80倍)のグラフである。 補足プローブを伴うパネルと伴わないパネルとを比較する、重複率のグラフである。 補足プローブを伴うパネルと伴わないパネルとを比較する、率に対する割合(percent on rate)のグラフである。 補足プローブを伴うパネルと伴わないパネルとを比較する、標的カバレッジの割合のグラフである。 補足プローブを伴うパネルと伴わないパネル、および対照薬濃縮キットを比較する、80-fold base penaltyのグラフである。 パネルの調整可能な標的カバレッジのグラフを表す。 RefSeqデザインの概略図である。 エクソームパネル単独、またはRefSeqパネルを加えたエクソームパネルのカバレッジにおける標的塩基の割合としての、深度カバレッジのグラフを表す。図31Bは第1の実験を表す。 エクソームパネル単独、またはRefSeqパネルを加えたエクソームパネルのカバレッジにおける標的塩基の割合としての、深度カバレッジのグラフを表す。図31Cは第2の実験を表す。 標準エクソームパネルvsシングルプレックスと8-plex実験両方のRefSeqパネルと組み合わせたエクソームパネルに関する、様々な濃縮/キャプチャーシーケンシング基準のグラフを表す。図31Dは、エクソームパネル単独、またはRefSeqパネルを加えたエクソームパネルに関する、オフターゲット割合としての特異性のグラフを示す。 標準エクソームパネルvsシングルプレックスと8-plex実験両方のRefSeqパネルと組み合わせたエクソームパネルに関する、様々な濃縮/キャプチャーシーケンシング基準のグラフを表す。図31Eは、エクソームパネル単独、またはRefSeqパネルを加えたエクソームパネルに関する、均一性のグラフを示す。 標準エクソームパネルvsシングルプレックスと8-plex実験両方のRefSeqパネルと組み合わせたエクソームパネルに関する、様々な濃縮/キャプチャーシーケンシング基準のグラフを表す。図31Fは、エクソームパネル単独、またはRefSeqパネルを加えたエクソームパネルに関する、ライブラリサイズのグラフを示す。 標準エクソームパネルvsシングルプレックスと8-plex実験両方のRefSeqパネルと組み合わせたエクソームパネルに関する、様々な濃縮/キャプチャーシーケンシング基準のグラフを表す。図31Gは、エクソームパネル単独、またはRefSeqパネルを加えたエクソームパネルに関する、重複率のグラフを示す。 標準エクソームパネルvsシングルプレックスと8-plex実験両方のRefSeqパネルと組み合わせたエクソームパネルに関する、様々な濃縮/キャプチャーシーケンシング基準のグラフを表す。図31Hは、エクソームパネル単独、またはRefSeqパネルを加えたエクソームパネルに関する、カバレッジ率のグラフを示す。 30倍カバレッジを達成する各カスタムパネルにおけるリードの割合のグラフである。 各カスタムパネルに関する30倍超の標的塩基の画分のグラフである。 各カスタムパネルの均一性(80倍)のグラフである。 高速濃縮ワークフローの概略図である。 高速ハイブリダイゼーションと洗浄ワークフロー、およびハイブリダイゼーションと洗浄ワークフローを使用した、カバレッジでの標的塩基の割合としてのパフォーマンスを表す。 ナノボールシーケンシングを使用した、標的上の塩基の割合のグラフである。 ナノボールシーケンシングを使用した均一性のグラフである。 ナノボールシーケンシングを使用した重複率のグラフである。 30倍以上のカバレッジでの標的塩基のグラフである。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図35A-35Eの説明文を図35Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図35Aは、単一分子を伴う(「J」と「L」)インデックスの内部にあるすべてのアダプター領域に結合する一組のブロッカー(「D」、「J」、「L」、および「E」)の結合構成を表す。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図35A-35Eの説明文を図35Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図35Bは、複数のブロッカーを伴うインデックスの内部にあるアダプター領域に結合する、一組のブロッカー(「D」、「M」、「N」、「Q」、および「E」)の結合構成を表す。アダプターのYステムアニーリング部分は単一のブロッカーメンバー「N」と結合することに留意されたい。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図35A-35Eの説明文を図35Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図35Cは、複数のブロッカーを伴うインデックスの内部にあるアダプター領域に結合する、一組のブロッカー(「D」、「M」、「P」、「Q」、および「E」)の代替的な結合構成を表す。アダプターのYステムアニーリング部分は単一のブロッカーメンバー「P」と結合することに留意されたい。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図35A-35Eの説明文を図35Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図35Dは、複数のブロッカーを伴うインデックスの内部にあるアダプター領域に結合する、一組のブロッカー(「R」、「N」、および「S)の結合構成を表す。この場合、外部アダプター配列とインデックスすなわちアダプターインデックスとの結合、および内部アダプター配列とインデックスとの結合は、両側で1つの固有の分子と相互に作用する。アダプターのYステムアニーリング部分は単一のブロッカーメンバー「N」と結合することに留意されたい。単一のアダプターインデックス長さのみが、このような結合構成によりアドレス可能であることに留意されたい。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図35A-35Eの説明文を図35Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図35Eは、複数のブロッカーを伴うインデックスの内部のアダプター領域に結合する、一組のブロッカーの代替的な結合構成を表す。この場合、外部アダプター配列とインデックスすなわちアダプターインデックスとの結合、および内部アダプター配列とインデックスとの結合は、両側で1つの固有の分子と相互に作用する。アダプターのYステムアニーリング部分は単一のブロッカーメンバー「P」と結合することに留意されたい。単一のアダプターインデックス長さのみが、このような結合構成によりアドレス可能であることに留意されたい。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図36A-36Dの説明文を図36Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図36Aは、所望の構成で結合するブロッカーすべてを表す。これは、標的濃縮のワークフローの最適なパフォーマンスを生じさせる所望の集団である。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図36A-36Dの説明文を図36Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図36Bは、所望の構成で結合する外部ブロッカーを表す。これは望ましくない集団である。内部ブロッカーは、望まれない他の分子上にアダプター配列を含む他の分子を動員することができる未結合領域に、望ましくない構成で結合する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図36A-36Dの説明文を図36Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図36Cは、溶液中で互いに結合するブロッカーを表す。これは望ましくない集団である。ブロッカーは互いに結合するが、これらの指定のアダプター領域に結合することはできない。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図36A-36Dの説明文を図36Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図36Dは、溶液中で遊離するブロッカーを表す。これは、標的濃縮ワークフローのパフォーマンスに対する効果が最小である中性集団である。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図37A-37Gの説明文を図37Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図37Aは、(1)二重インデックスアダプターに対してデザインされる一組のブロッカーを表し、その場合、(2)全ブロッカーは一本鎖に結合し、(3)外部領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長せず、(4)内部アダプター領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長しない。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図37A-37Gの説明文を図37Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図37Bは、(1)二重インデックスアダプターに対してデザインされる一組のブロッカーを表し、その場合、(2)全ブロッカーは一本鎖に結合し、(3)外部領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長し、(4)内部アダプター領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長しない。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図37A-37Gの説明文を図37Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図37Cは、(1)二重インデックスアダプターに対してデザインされる一組のブロッカーを表し、その場合、(2)全ブロッカーは一本鎖に結合し、(3)外部領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長せず、(4)内部アダプター領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図37A-37Gの説明文を図37Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図37Dは、(1)二重インデックスアダプターに対してデザインされる一組のブロッカーを表し、その場合、(2)全ブロッカーは一本鎖に結合し、(3)外部領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長し、(4)内部アダプター領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図37A-37Gの説明文を図37Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図37Eは、(1)二重インデックスアダプターに対してデザインされる一組のブロッカーを表し、その場合、(2)ブロッカーは両方の鎖に結合し、(3)外部領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長し、(4)内部アダプター領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図37A-37Gの説明文を図37Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図37Fは、(1)単一インデックスアダプターに対してデザインされる一組のブロッカーを表し、その場合、(2)全ブロッカーは一本鎖に結合し、(3)外部領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックス(存在する場合)をカバーするように伸長し、(4)内部アダプター領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックス(存在する場合)をカバーするように伸長する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図37A-37Gの説明文を図37Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図37Gは、(1)二重インデックスアダプターに対してデザインされる一組のブロッカーを表し、その場合、(2)全ブロッカーは一本鎖に結合し、(3)外部領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長し、(4)内部アダプター領域をインデックスに結合するようデザインされるブロッカーはアダプターインデックスをカバーするように伸長し、(5)内部アダプター領域をインデックスに結合するようデザインされるブロッカーは、固有の分子識別子(または、定義された、もしくは未定義の他のポリヌクレオチド配列)をカバーするように伸長する。 様々な数のインデックス塩基をカバーする複数組のブロッカーの、オフベイトのパーセント(percent off bait)に応じたパフォーマンスのグラフを表す。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図39A-39Cの説明文を図39Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。ここで、両側から3つのアダプターインデックス塩基をカバーするようデザインされる2つのブロッカーに対する異なる結合モードが、アダプターに対する異なる結合モードで示される。図39Aは6bpのアダプターインデックス長さを表し、合計6個のインデックス塩基がオーバーハングにカバーされ、合計0個のインデックス塩基が曝露され、結果曝露されたインデックス塩基の合計割合は0%である。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図39A-39Cの説明文を図39Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。ここで、両側から3つのアダプターインデックス塩基をカバーするようデザインされる2つのブロッカーに対する異なる結合モードが、アダプターに対する異なる結合モードで示される。図39Bは8bpのアダプターインデックス長さを表し、合計6個のインデックス塩基がオーバーハングにカバーされ、合計2個のインデックス塩基が曝露され、結果曝露されたインデックス塩基の合計割合は25%である。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図39A-39Cの説明文を図39Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。ここで、両側から3つのアダプターインデックス塩基をカバーするようデザインされる2つのブロッカーに対する異なる結合モードが、アダプターに対する異なる結合モードで示される。図39Cは10bpのアダプターインデックス長さを表し、合計6個のインデックス塩基がオーバーハングにカバーされ、合計4個のインデックス塩基が曝露され、結果曝露されたインデックス塩基の合計割合は40%である。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Aは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合に対し修飾はなく、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Bは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)両方の鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合に対し修飾はなく、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Cは、(1)単一のインデックスシステムのためのブロッカーを表し、該単一のインデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合に対し修飾はなく、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Dは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合に対し修飾はなく、(4)アダプターインデックスをカバーするように伸長が存在し、(5)固有の分子識別子をカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Eは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合親和性を低減するために修飾が行われ、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Fは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)両方の鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合親和性を低減するために修飾が行われ、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Gは、(1)単一のインデックスシステムのためのブロッカーを表し、該単一のインデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合親和性を低減するために修飾が行われ、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Hは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部への結合親和性を低減するために修飾が行われ、(4)アダプターインデックスをカバーするように伸長が存在し、(5)固有の分子識別子をカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Iは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部に結合する単一の員が存在し、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Jは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)両方の鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部に結合する単一の員が存在し、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Kは、(1)単一のインデックスシステムのためのブロッカーを表し、該単一のインデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部に結合する単一の員が存在し、(4)アダプターインデックスをカバーするように伸長が存在する。 ポリメラーゼ連鎖増幅後の次世代シーケンシングライブラリの1分子の一本鎖を太い棒で表すものであり、「上」と「下」の鎖の5’と3’の末端には方向を示すラベルが付けられている。図40A-40Lの説明文を図40Aに表す。様々な化学修飾および/またはデザイン特徴を伴うブロッカーは細いブロッカーで表される。5’末端と3’末端には方向を示すラベルがつけられ、これらが結合するように設計されるアダプター領域の最も近くに位置決めされる。図40Lは、(1)二重インデックスシステムのためのブロッカーを表し、該二重インデックスシステムは(2)一本鎖に結合するようデザインされ、(3)アダプターのYステムアニーリング部に結合する単一の員が存在し、(4)アダプターインデックスをカバーするように伸長が存在し、(5)固有の分子識別子をカバーするように伸長が存在する。 非メチル化試料(上部)とメチル化試料(下部)のワークフローを表す。 標準のメチル化パネルの3つの異なるサイズに関するシーケンシング基準のグラフを表す。図42Aは、30倍カバレッジでの塩基のパーセントのグラフを表す。 標準のメチル化パネルの3つの異なるサイズに関するシーケンシング基準のグラフを表す。図42Bは、fold-80 base penaltyのグラフを表す。 標準のメチル化パネルの3つの異なるサイズに関するシーケンシング基準のグラフを表す。図42Cは、オフベイトのパーセントのグラフを表す。 標準のメチル化パネルの3つの異なるサイズに関するシーケンシング基準のグラフを表す。図42Dは、重複率のグラフを表す。 ストリンジェンシーが高い、中程度、または低い、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図43Aは、30倍カバレッジでの塩基のパーセントのグラフを表す。 ストリンジェンシーが高い、中程度、または低い、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図43Bは、fold-80 base penaltyのグラフを表す。 ストリンジェンシーが高い、中程度、または低い、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図43Cは、オフベイトのパーセントのグラフを表す。 ストリンジェンシーが高い、中程度、または低い、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図43Dは、重複率のグラフを表す。 0、25、50、75、および100%のメチル化の最終比率に配合される、低メチル化および過剰メチル化細胞株から生成されるgDNAライブラリから標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図44Aは、30倍カバレッジでの塩基のパーセントのグラフを表す。 0、25、50、75、および100%のメチル化の最終比率に配合される、低メチル化および過剰メチル化細胞株から生成されるgDNAライブラリから標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図44Bは、fold-80 base penaltyのグラフを表す。 0、25、50、75、および100%のメチル化の最終比率に配合される、低メチル化および過剰メチル化細胞株から生成されるgDNAライブラリから標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図44Cは、オフベイトのパーセントのグラフを表す。 0、25、50、75、および100%のメチル化の最終比率に配合される、低メチル化および過剰メチル化細胞株から生成されるgDNAライブラリから標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図44Dは、重複率のグラフを表す。 臨床的に関連するサイクリンD2座における標的と個々CpG部位に沿った様々なDNAメチル化レベルの検出を表す。この座は、特定の癌(例えば乳癌)のメチル化状態を変化させると知られている。図45Aは、4,268kb~4,276kbのゲノム座でのメチル化を表す。 臨床的に関連するサイクリンD2座における標的と個々のCpG部位に沿った様々なDNAメチル化レベルの検出を表す。この座は、特定の癌(例えば乳癌)のメチル化状態を変化させると知られている。図45Bは、4,275.2kb~4,276.4kbのゲノム座でのメチル化を表す。 バイサルファイト変換法または酵素変換法を使用して標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図46Aは、30倍カバレッジでの塩基のパーセントのグラフを表す。 バイサルファイト変換法または酵素変換法を使用して標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図46Bは、fold-80 base penaltyのグラフを表す。 バイサルファイト変換法または酵素変換法を使用して標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図46Cは、オフベイトのパーセントのグラフを表す。 バイサルファイト変換法または酵素変換法を使用して標的をキャプチャーするために厳密に使用される媒体の、最適化された1Mbメチル化パネルに関するシーケンシング基準のグラフを表す。図46Dは、重複率のグラフを表す。 変換率のボックスグラフを表す。非CpG部位で変換されるシトシンの画分は、バイサルファイト変換法と酵素変換法の両方で99.5%超であったと測定される。
本明細書には、ポリヌクレオチドアダプターとハイブリダイゼーションブロッカーを含む、次世代シーケンシングのための組成物と方法が記載される。従来のアダプターは、試料のインデックス/起源に関連する情報を含むバーコード領域、または固有の分子識別子を含むことが多い。このようなバーコードは核酸をサンプルするために直接ライゲートされる。しかし場合により、バーコード化アダプターを産生する際に高純度で顕著な合成オーバーヘッドが求められるため、次世代シーケンシング用途におけるパフォーマンスは制限されてしまう。代替的に、バーコードを含まないトランケート型「ユニバーサル」(または太くて短い)アダプターが核酸をサンプリングするためにライゲートされ、バーコードのライブラリはシーケンシング前の後期段階で加えられる。このようなユニバーサルアダプターは、いくつかの例では、安価で製造することができ、従来のバーコード化アダプターよりも高度なライゲーション効率をもたらす。いくつかの例では、ライゲーション効率が高度になることで、増幅のためのPCR回路は少なくなり、その結果、PCRにより誘導された増幅誤差が低下する。いくつかの例では、ユニバーサルアダプターに加えられるバーコードライブラリは、より多くのバーコード、または一般的なバーコード化アダプターよりも長いバーコードを含む。加えて、ユニバーサルアダプターは、広範囲の異なるシーケンシングプラットフォームに適合可能である。本明細書では、核酸塩基アナログを含むユニバーサルアダプターが提供される。本明細書ではさらに、前記プライマーのユニバーサルアダプター結合領域の長さがユニバーサルアダプターの長さ未満である、バーコード化プライマーが提供される。本明細書には、濃縮効率基準を増大させるために不要なアダプター間相互作用を防ぐ、ハイブリダイゼーションブロッカーが記載される。本明細書ではさらに、様々なアダプター結合構成を伴うハイブリダイゼーションブロッカーが記載される。本明細書ではさらに、メチル化修飾をゲノムDNAに同定する方法が記載される。
定義
本開示の全体にわたり、数的な特徴が範囲表示形式で提示される。範囲表示形式での記載は利便性と簡潔さのみを目的とするものであり、任意の実施形態の範囲に対する確固たる限定として解釈するべきではないことを理解されたい。したがって、範囲の記載は、前後関係から明らかでない限り、可能な下位範囲すべて、ならびに下限値の単位の10分の1までその範囲内の個々の数値を具体的に開示したものと考慮する必要がある。例えば、1~6などの範囲の記載は、1~3、1~4、1~5、2~4、2~6、3~6などの下位範囲と、その範囲内の個々の数値、例えば1.1、2、2.3、5、5.9を具体的に開示したものと考慮する必要がある。このことは範囲の広さに関係なく適用される。このような介入する範囲の上限と下限は、より小さな範囲内に独立して含まれてもよく、更に、定められた範囲内の任意の具体的に除外された限度に従って本発明内に包含される。定められた範囲が上限と下限の1つ又はその両方を含む場合、このような含まれた上限と下限の何れか又は両方を除く範囲も、文脈が明らかに他に指示しない限り、本発明内に包含される。
本明細書で使用される用語は、特定の実施形態のみの説明を目的とするものであり、任意の実施形態を制限することを意図していない。本明細書では、単数形「a」、「an」、および「the」は、前後関係から明らかでない限り、同様に複数形を含むことを意図している。本明細書では、用語「含む(comprises)」および/または「含むこと(comprising)」は、明示された特徴、整数、工程、操作、要素、および/または構成要素の存在を特定するが、1以上の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在あるいは追加を妨げるものではないことが、さらに理解される。本明細書では、用語「および/または」は、関連する列記された項目の1つ以上のあらゆる組み合わせを含む。
別段の定めのない限り、または前後関係から明らかでない限り、本明細書では、数または数の範囲に関連する用語「約」とは、明示された数およびその数の+/-10%、または、ある範囲で列記された値に対して列記された下限値の10%未満および列記された上限値の10%超を意味する。
本明細書で使用されているように、用語「あらかじめ選択された配列(preselected sequence)」、「あらかじめ定められた配列(predefined sequence)」または「あらかじめ定められた配列(predetermined sequence)」は、交換可能に使用される。用語は、ポリマー配列がポリマーの合成またはアセンブリの前に知られており、選択されていることを意味する。特に、本発明の様々な態様は、主に、核酸分子の合成またはアセンブリの前に既知であり選択される、核酸分子の調製、オリゴヌクレオチドまたはポリヌクレオチドの配列に関して、本明細書に記載されている。
核酸という用語は、二本鎖または三本鎖の核酸のほか、一本鎖の分子を包含する。二本鎖または三本鎖の核酸では、核酸の鎖は同一の広がりを持つ必要はない(二本鎖核酸は両方の鎖の全長に沿った二本鎖である必要はない)。他に明示されない限り、核酸配列は、提供されたときに5’~3’の方向に列記される。本明細書に記載の方法は、単離された核酸の生成を提供する。本明細書に記載の方法はさらに、単離かつ精製された核酸の生成を提供する。提供される場合、ポリヌクレオチドの長さは塩基の数として記載され、nt(ヌクレオチド)、bp(塩基)、kb(キロベース)、mb(メガベース)、またはGb(ギガベース)のように省略される。
本明細書には、合成(デノボ合成または化学合成された)ポリヌクレオチドの産生のための方法と組成物が提供される。オリゴ核酸、オリゴヌクレオチド、オリゴ、およびポリヌクレオチドという用語は、全体にわたり同義であると定められる。本明細書に記載の合成ポリヌクレオチドのライブラリは、1つ以上の遺伝子または遺伝子フラグメントをまとめてコードする複数のポリヌクレオチドを含む場合がある。いくつかの例では、前記ポリヌクレオチドライブラリは、コード配列または非コード配列を含む。いくつかの例では、前記ポリヌクレオチドライブラリは複数のcDNA配列をコードする。cDNA配列の基となる参照遺伝子配列はイントロンを含む場合があり、一方でcDNA配列はイントロンを除外している。本明細書に記載のポリヌクレオチドは、生物体からの遺伝子または遺伝子フラグメントをコードする場合がある。例示的な生物体として、原核生物(例えば細菌)および真核生物(例えばマウス、ウサギ、ヒト、および非ヒト霊長類)が挙げられるが、これらに限定されるものではない。いくつかの例では、前記ポリヌクレオチドライブラリは1つ以上のポリヌクレオチドを含む。この1つ以上のポリヌクレオチドの各ポリヌクレオチドは複数のエクソンに対する配列をコードする。本明細書に記載のライブラリ内の各ポリヌクレオチドは、異なる配列、すなわち非同一配列をコードする場合がある。いくつかの例では、本明細書に記載のライブラリ内の各ポリヌクレオチドは、該ライブラリ内の他のポリヌクレオチドの配列に相補的な少なくとも1つの部分を含む。本明細書に記載のポリヌクレオチド配列は、別段の定めのない限り、DNAまたはRNAを含む場合がある。本明細書に記載のポリヌクレオチドライブラリは、少なくとも10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、30,000、50,000、100,000、200,000、500,000、1,000,000、または1,000,000より多くのポリヌクレオチドを含む場合がある。本明細書に記載のポリヌクレオチドライブラリは、多くとも10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、30,000、50,000、100,000、200,000、500,000、または1,000,000より多くのポリヌクレオチドを有する場合がある。本明細書に記載のポリヌクレオチドライブラリは、10~500、20~1000、50~2000、100~5000、500~10,000、1,000~5,000、10,000~50,000、100,000~500,000、または50,000~1,000,000のポリヌクレオチドを含む場合がある。本明細書に記載のポリヌクレオチドライブラリは、約370,000、400,000、500,000以上の異なるポリヌクレオチドを含む場合がある。
ユニバーサルアダプター
図1Aに表されるように、いくつかの例では、本明細書に開示されるユニバーサルアダプターは、第1の鎖(101a)と第2の鎖(101b)を含む、ユニバーサル・ポリヌクレオチド・アダプター(100)を含む場合がある。いくつかの例では、第1の鎖(101a)は、第1のプライマー結合領域(102a)、第1の非相補的領域(103a)、および第1のヨーク領域(104a)を含む。いくつかの例では、第2の鎖(101b)は、第2のプライマー結合領域(102b)、第2の非相補的領域(103b)、および第2のヨーク領域(104b)を含む。いくつかの例では、プライマー結合領域(例えば102a/102b)は、ポリヌクレオチドアダプター(100)のPCR増幅を可能にする。いくつかの例では、プライマー結合領域(例えば102a/102b)は、ポリヌクレオチドアダプター(100)のPCR増幅、およびポリヌクレオチドアダプターへの1つ以上のバーコードの同時追加を可能にする。いくつかの例では、第1のヨーク領域(104a)は第2のヨーク領域(104b)に相補的である。いくつかの例では、第1の非相補的領域(103a)は第2の非相補的領域(103b)に相補的ではない。いくつかの例では、ユニバーサルアダプター(100)は、Y字状、または二叉状のアダプターである。いくつかの例では、1つ以上のヨーク領域は、第1のヨーク領域と第2のヨーク領域との間のTmを上昇させる核酸塩基アナログを含む。本明細書に記載されるようなプライマー結合領域は、ポリヌクレオチドの末端アダプター領域の形態を呈していてもよい。いくつかの例では、ユニバーサルアダプターは1つのインデックス配列を含む。いくつかの例では、ユニバーサルアダプターは1つの固有の分子識別子を含む。
ユニバーサル(ポリヌクレオチド)アダプター(100)は、一般的なバーコード化アダプター(例えば完全長の「Yアダプター」)に比べて短くされてもよい。例えば、ユニバーサルアダプター鎖(101a)または(101b)は、長さ20~45の塩基である。いくつかの例では、ユニバーサルアダプター鎖は、長さ25~40の塩基である。いくつかの例では、ユニバーサルアダプター鎖は、長さ30~35の塩基である。いくつかの例では、ユニバーサルアダプター鎖は、長さ50以下の塩基、長さ45以下の塩基、長さ40以下の塩基、長さ35以下の塩基、長さ30以下の塩基、または長さ25以下の塩基である。いくつかの例では、ユニバーサルアダプター鎖は、長さ約25、27、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、または60の塩基である。いくつかの例では、ユニバーサルアダプター鎖は、長さ約60の塩基対である。いくつかの例では、ユニバーサルアダプター鎖は、長さ25~40の塩基対である。いくつかの例では、ユニバーサルアダプター鎖は、長さ25~40の塩基対である。いくつかの例では、ユニバーサルアダプター鎖は、長さ25~40の塩基対である。
ユニバーサルアダプターは、試料ポリヌクレオチドでのライゲーションを容易にするために修飾することができる。例えば、5’末端がリン酸化される。いくつかの例では、ユニバーサルアダプターは、ホスホロチオエート結合など1つ以上の非天然核酸塩基結合を含む。例えば、ユニバーサルアダプターは、3’末端塩基間にホスホロチオエート、および3’末端塩基に隣接する塩基を含む。いくつかの例では、試料ポリヌクレオチドは、ヒト、細菌、植物、動物、真菌、もしくはウイルス由来のDNAまたはRNAなど、様々なソースの核酸を含む。図1Bに表されるように、アダプターでライゲートされた試料ポリヌクレオチド(110)は、いくつかの例では、試料ポリヌクレオチド(105a)/(105b)の5’末端と3’末端の両方にライゲートされるアダプター(100)を伴う試料ポリヌクレオチド(例えば試料核酸)(105a/105b)を含む。二本鎖試料ポリヌクレオチドは、第1の鎖(フォワード)(105a)および第2の鎖(リバース)(105b)の療法を含む。
ユニバーサルアダプターは、あらゆる数の異なる核酸塩基(DNA、RNAなど)、核酸塩基アナログ、または非核酸塩基リンカーもしくはスペーサーを含有する場合がある。例えばアダプターは、アダプターの2つの鎖間のハイブリダイゼーション(T)を増強させる1つ以上の核酸塩基アナログまたは他の基を含む。いくつかの例では、核酸塩基アナログは、アダプターのヨーク領域に存在する。核酸塩基アナログおよび他の基として、ロックド核酸(LNA)、二環式核酸(BNA)、C5修飾ピリミジン塩基、2’-O-メチル置換RNA、ペプチド核酸(PNA)、グリコール核酸(GNA)、トレオース核酸(TNA)、ゼノ核酸(XNA)、モルホリノバックボーン修飾塩基、マイナーグルーブバインダー(MGB)、スペルミン、G-クランプ、またはアントラキノン(Uaq)キャップが挙げられるが、これらに限定されるものではない。いくつかの例では、アダプターは、表1から選択される1つ以上の核酸塩基アナログを含む。
Figure 2022521766000002
ユニバーサルアダプターは、所望のハイブリダイゼーションTに応じて、あらゆる数の核酸塩基アナログ(LNAまたはBNAなど)を含む場合がある。例えば、アダプターは1~20の核酸塩基アナログを含む。いくつかの例では、アダプターは1~8の核酸塩基アナログを含む。いくつかの例では、アダプターは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、または少なくとも12の核酸塩基アナログを含む。いくつかの例では、アダプターは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、または16の核酸塩基アナログを含む。いくつかの例では、核酸塩基アナログの数は、アダプター中の塩基の合計数の割合として表される。例えば、アダプターは少なくとも1%、2%、5%、10%、12%、18%、24%、30%、または30%超の核酸塩基アナログを含む。いくつかの例では、本明細書に記載のアダプター(例えばユニバーサルアダプター)は、メチル化シトシンなどのメチル化核酸塩基を含む。
バーコード化プライマー
ポリヌクレオチドプライマーは、図1Cに表されるように、バーコード(またはインデックス)などの規定の配列を含む。バーコードは、例えばバーコード、アダプターでライゲートされた試料ポリヌクレオチド(図1D、108)を生成するために、PCRとバーコード化プライマー(113a)または(113b)を使用して、ユニバーサルアダプターに付けることができる。図1Cと1Dに表されるユニバーサルプライマー結合部位(107a)または(107b)などのプライマー結合部位は、バーコード・プライマー・ライブラリのすべての員、または員の部分集団を同時に増幅することを促す。いくつかの例では、プライマー結合部位(107a)または(107b)は、次世代シーケンシング中にフローセルまたは他の固体担体に結合する領域を含む。いくつかの例では、バーコード化プライマーは、P5(5’-AATGATACGGCGACCACCGA-3’)またはP7(5’-CAAGCAGAAGACGGCATACGAGAT-3’)配列を含む。いくつかの例では、プライマー結合部位(112a)または(112b)は、ユニバーサルアダプター配列(102a)または(102b)に結合するように構成され、バーコード化アダプターの増幅と生成を促進する。いくつかの例では、バーコード化プライマーは長さ60以下の塩基である。いくつかの例では、バーコード化プライマーは長さ55以下の塩基である。いくつかの例では、バーコード化プライマーは長さ50~60の塩基である。いくつかの例では、バーコード化プライマーは長さ約60の塩基である。いくつかの例では、本明細書に記載のバーコードは、メチル化シトシンなどのメチル化核酸塩基を含む。
図1Cと1Dに表されるように、バーコード化プライマーは1つ以上のバーコード(106a)または(106b)を含む。いくつかの例では、このバーコードはPCR反応によりユニバーサルアダプターに加えられる。バーコードは、該バーコードが関連付けられるポリヌクレオチドの一部特徴が同定されるのを可能にする核酸配列である。いくつかの例では、バーコードはインデックス配列を含む。いくつかの例では、インデックス配列は、試料、または配列決定されるべき核酸の固有ソースの同定を可能にする。シーケンシング後、バーコード(またはバーコード領域)は、コード領域または試料ソースに関連する特徴を同定するための指標を提供する。バーコードは、十分な程度の同定を可能にするのに適切な長さ、例えば長さが少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、またはそれより多くの塩基でデザインすることができる。約2、3、4、5、6、7、8、9、10、またはそれより多くのバーコードなどの複数のバーコードは、同じ分子に対して使用され、場合により非バーコード配列により分離されてもよい。いくつかの例では、複数のバーコード中の各バーコードは、少なくとも約3、4、5、6、7、8、9、10、またはそれより多くの位置など、少なくとも3つの塩基位置にある複数のバーコードにおける1つおきのバーコードとは異なる。バーコードの使用により、シーケンシング(マルチプレックス)などの下流の用途のために複数のライブラリのプールと同時処理が可能となる。いくつかの例では、少なくとも4、8、16、32、48、64、128、または512より多くのライブラリが使用される。バーコード化プライマーまたはアダプターは、固有の分子識別子(UMI)を含む場合がある。このようなUMIは、いくつかの例では独自に試料中の核酸すべてにタグを付ける。いくつかの例では、試料中で少なくとも60%、70%、80%、90%、95%、または95%より多くの核酸が、UMIでタグ付けされる。いくつかの例では、試料中で少なくとも85%、90%、95%、97%、または少なくとも99%の核酸が、固有のバーコードまたはUMIでタグ付けされる。バーコード化プライマーは、いくつかの例では、インデックス配列と1つ以上のUMIを含む。UMIにより、バイアスを導入可能な下流の試料処理(例えばPCRまたは濃縮の工程)の前に、初期試料濃度または化学量論の内部測定が可能となる。いくつかの例では、UMIは1つ以上のバーコード配列を含む。いくつかの例では、アダプターでライゲートされた試料ポリヌクレオチドの各鎖(フォワードvsリバース)は、1つ以上の固有のバーコードを持つ。このようなバーコードは随意に、独自に試料ポリヌクレオチドの各鎖にタグを付けるために使用される。いくつかの例では、バーコード化プライマーは、インデックスバーコードおよびUMIバーコードを含む。いくつかの例では、少なくとも2つのバーコード化プライマーによる増幅後、結果として生じるアンプリコンは、2つのインデックス配列および2つのUMIを含む。いくつかの例では、少なくとも1つのバーコード化プライマーによる増幅後、結果として生じるアンプリコンは、2つのインデックスバーコードおよび1つのUMIバーコードを含む。いくつかの例では、ユニバーサルアダプター-試料ポリヌクレオチドの複製における各鎖は、UMIまたはインデックスバーコードなどの固有のバーコードでタグを付けられる。
図1Eと1Fに表されるように、ライブラリ中のバーコード化プライマーは、ユニバーサルアダプター上のプライマー結合領域(102a)/(102b)に相補的な領域(112a)/(112b)を含む。例えば、ユニバーサルアダプター結合領域(112a)は、ユニバーサルアダプターのプライマー領域(102a)に相補的であり、ユニバーサルアダプター結合領域(112b)は、ユニバーサルアダプターのプライマー領域(102b)に相補的である。このような構成により、(図1Eと1Fに表されるように)PCR中にユニバーサルアダプターの伸長が容易になり、バーコード化プライマーが付けられる。いくつかの例では、プライマーとプライマー結合領域との間のTは、40~65℃である。いくつかの例では、プライマーとプライマー結合領域との間のTは、42~63℃である。いくつかの例では、プライマーとプライマー結合領域との間のTは、50~60℃である。いくつかの例では、プライマーとプライマー結合領域との間のTは、53~62℃である。いくつかの例では、プライマーとプライマー結合領域との間のTは、54~58℃である。いくつかの例では、プライマーとプライマー結合領域との間のTは、40~57℃である。いくつかの例では、プライマーとプライマー結合領域との間のTは、40~50℃である。いくつかの例では、プライマーとプライマー結合領域との間のTは、約40、45、47、50、52、53、55、57、59、61、または62℃である。
ハイブリダイゼーションブロッカー
ブロッカーは、あらゆる数の異なる核酸塩基(DNA、RNAなど)、核酸塩基アナログ(非標準)、または非核酸塩基リンカーもしくはスペーサーを含有する場合がある。いくつかの例では、ブロッカーはユニバーサルブロッカーを含む。いくつかの例では、このようなブロッカーは「セット」として記載される場合がある。いくつかの例では、ユニバーサルブロッカーは、アダプターの少なくとも1つに存在する1つ以上のバーコードに依存しないアダプター間相互作用を妨げる。例えばブロッカーは、ブロッカーとアダプターとの間のハイブリダイゼーション(T)を増強させる1つ以上の核酸塩基アナログまたは他の基を含む。いくつかの例では、ブロッカーは、ブロッカーとアダプター(例えば「ユニバーサル」塩基)との間のハイブリダイゼーション(T)を減少させる、1つ以上の核酸塩基を含む。いくつかの例では、本明細書に記載のブロッカーは、ブロッカーとアダプターとの間のハイブリダイゼーション(T)を増加させる1つ以上の核酸塩基と、ブロッカーとアダプターとの間のハイブリダイゼーション(T)を減少させる1つ以上の核酸塩基の両方を含む。
本明細書には、標的配列(例えばアダプター)への結合を増強する1つ以上の領域と、標的配列(例えばアダプター)への結合を減少させる1つ以上の領域とを含む、ハイブリダイゼーションブロッカーが記載される。いくつかの例では、各領域は、標的濃縮への適用中に、与えられた所望のレベルのオフベイト活性を調整される。いくつかの例では、各領域は、標的配列に対する分子の全体的な親和性を増加または減少させるため、一種類または複数種の化学的修飾/部分により改質することができる。いくつかの例では、ブロッカーセットの個々の員すべての融解温度は、(例えば、LNAおよび/またはBNAなどの部分の追加により)特定温度より上に維持される。いくつかの例では、与えられた一組のブロッカーは、インデックス長さ、インデックス配列、および、どのくらいのアダプターインデックスがハイブリダイゼーションに存在するかに関係なく、オフベイトパフォーマンスを改善する。
ブロッカーは、標的シーケンシングに対する親和性を増大および/または減少させるアダプターなどの部分を含む場合がある。いくつかの例では、このような特定領域は、特定の標的配列に対する親和性を回避または増大するために特定の融解温度へと熱力学的に調整することができる。いくつかの例では、このような修飾の組み合わせは、特異的かつ固有のアダプター配列に対するブロッカー分子の親和性の増大、および反復アダプター配列(例えばアダプターのYステムアニーリング部分)に対するブロッカー分子の親和性の減少を助けるようにデザインされる。いくつかの例では、ブロッカーは、アダプターのYステム領域へのブロッカーの結合を減少させる部分を含む。いくつかの例では、ブロッカーは、アダプターのYステム領域へのブロッカーの結合を減少させる部分、およびアダプターの非Yステム領域へのブロッカーの結合を増大させる部分を含む。
ブロッカー(例えばユニバーサルブロッカー)とアダプターは、ハイブリダイゼーション中に多数の異なる集団を形成する場合がある。いくつかの例では、ブロッカーのYステムアニーリング領域における親和性を減少させるDNAの修飾の数が増えると、集団「A」と「D」が優勢となり、いずれかが所望の効果(A、図36A)または最小効果(D、図36D)を持つ。いくつかの例では、ブロッカーのYステムアニーリング領域における親和性を減少させるDNAの修飾の数が減ると、集団「B」と「C」が優勢となり、他のアダプターへのデイジーチェーニング(daisy-chaining)またはアニーリングが生じるおそれのある望まれない効果を持つか(B、図36B)、または適切に機能できないブロッカーを隔絶する(C、図36C)。
単一インデックスアダプターまたは二重インデックスアダプター両方のデザイン上のインデックスは、アダプターインデックス塩基をカバーするために、特異的にデザインされたDNA修飾により伸長されているユニバーサルブロッカーにより部分的または完全にカバーされる場合がある。いくつかの例では、このような修飾は、インデックスへのアニーリングを減少させるユニバーサル塩基などの部分を含む。いくつかの例では、二重インデックスアダプターのインデックスは、1つ以上のブロッカーにより部分的にカバーされる(または重複される)。いくつかの例では、二重インデックスアダプターのインデックスは、1つ以上のブロッカーにより完全にカバーされる。いくつかの例では、単一インデックスアダプターのインデックスは、1つ以上のブロッカーにより部分的にカバーされる。いくつかの例では、単一インデックスアダプターのインデックスは、1つ以上のブロッカーにより完全にカバーされる。いくつかの例では、ブロッカーは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、または20より多くの塩基によりインデックス配列を重複させる。いくつかの例では、ブロッカーは、多くとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、または25より多くの塩基によりインデックス配列を重複させる。いくつかの例では、ブロッカーは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、または30の塩基によりインデックス配列を重複させる。いくつかの例では、ブロッカーは、1~5、1~3、2~5、2~8、2~10、3~6、3~10、4~10、4~15、1~4、または5~7の塩基によりインデックス配列を重複させる。いくつかの例では、インデックス配列に重複するブロッカーの領域は、少なくとも1つの2-デオキシイノシンまたは5-ニトロインドールの核酸塩基を含む。
1または2つのブロッカーは、アダプター上に存在するインデックス配列に重なる場合がある。いくつかの例では、1または2つのブロッカーは、インデックス配列の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、または20より多くの塩基との重複と組み合わせられる。いくつかの例では、1または2つのブロッカーは、インデックス配列の多くとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、または20より多くの塩基との重複と組み合わせられる。いくつかの例では、1または2つのブロッカーは、インデックス配列の約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、または20より多くの塩基との重複と組み合わせられる。いくつかの例では、1または2つのブロッカーは、インデックス配列の1~5、1~3、2~5、2~8、2~10、3~6、3~10、4~10、4~15、1~4、または5~7の塩基より多くの塩基との重複と組み合わせられる。いくつかの例では、インデックス配列に重複するブロッカーの領域は、少なくとも1つの2-デオキシイノシンまたは5-ニトロインドールの核酸塩基を含む。
第1の構成では、アダプター・インデックス・オーバーハングの長さは変動する場合がある。片側からデザインされると、アダプター・インデックス・オーバーハングは、インデックスの一方の側から0~n個のアダプターインデックスをカバーするように改質される場合がある(図37B~37F)。これにより、単一(図37F)および二重(図37Bと37C)のインデックス・アダプター・システムに対してこのようなアダプターブロッカーをデザインすることができる。
第2の構成では、アダプターインデックス塩基は両側からカバーされる(図37Dと37E)。アダプターインデックス塩基が両側からカバーされると、各ブロッカーのカバー領域の長さは、ブロッカーの単一ペアが一定範囲のアダプターインデックス長さと相互に作用しながら、依然としてインデックス塩基の総数の顕著な部分をカバーするように、選択される場合がある。一例として、アダプターインデックスをカバーする3bpのオーバーハングでデザインされている2つのブロッカーを呈する。6bp、8bp、または10bpのアダプターインデックス長さの観点では、これらブロッカーは、ハイブリダイゼーション中にそれぞれ0bp、2bp、または4bpを残すことになる(図39A~39C)。
第3の構成では、修飾された核酸塩基は、インデックスアダプター塩基をカバーするように選択される。現在市販で入手可能なこれら修飾の例として、縮退性塩基(degenerate base)(A、T、C、Gの混合塩基)、2’-デオキシイノシン、5-ニトロインドールが挙げられる。
第4の構成では、アダプター・インデックス・オーバーハングを伴うブロッカーは、次世代シーケンシングライブラリのセンス(「上部」)鎖またはアンチセンス(「下部」)鎖のいずれかに結合する。
第5の構成では、ブロッカーはさらに、規定の長さと組成を持つ標準アダプターインデックス塩基に加えて、他のポリヌクレオチド配列(例えば、ライゲーションを容易にするために先の生化学工程で、または、規定のアダプター配列、シーケンシング後の生物情報割当て(bioinformatic assignment)のための固有の分子識別子などを導入するための他の方法で追加される、ポリ-Aテール)をカバーするように伸長される(図37G)。このような種類の配列はアダプターの複数の位置に配置することができ、この場合には、最も広く利用された事例(ゲノムインサートの隣に固有の分子インデックス)が提示される。固有の分子識別子(例えばアダプターインデックス塩基の隣)に対する他の位置は、同様の手法により処理することもできる。
第6の構成では、先の構成はすべて、特定条件下での標的濃縮中にオフベイトパフォーマンスに対する標的パフォーマンス基準を満たすために、様々な組み合わせで利用される。いくつかの例では、ブロッカーは、図35Aに示される構成を含む。いくつかの例では、ブロッカーは、図35Bに示される構成を含む。いくつかの例では、ブロッカーは、図35Cに示される構成を含む。いくつかの例では、ブロッカーは、図35Dに示される構成を含む。いくつかの例では、ブロッカーは、図35Eに示される構成を含む。いくつかの例では、ブロッカーは、図37Aに示される構成を含む。いくつかの例では、ブロッカーは、図37Bに示される構成を含む。いくつかの例では、ブロッカーは、図37Cに示される構成を含む。いくつかの例では、ブロッカーは、図37Dに示される構成を含む。いくつかの例では、ブロッカーは、図37Eに示される構成を含む。いくつかの例では、ブロッカーは、図37Fに示される構成を含む。いくつかの例では、ブロッカーは、図37Gに示される構成を含む。いくつかの例では、ブロッカーは、図39Aに示される構成を含む。いくつかの例では、ブロッカーは、図39Bに示される構成を含む。いくつかの例では、ブロッカーは、図39Cに示される構成を含む。いくつかの例では、ブロッカーは、図40Aに示される構成を含む。いくつかの例では、ブロッカーは、図40Bに示される構成を含む。いくつかの例では、ブロッカーは、図40Cに示される構成を含む。いくつかの例では、ブロッカーは、図40Dに示される構成を含む。いくつかの例では、ブロッカーは、図40Eに示される構成を含む。いくつかの例では、ブロッカーは、図40Fに示される構成を含む。いくつかの例では、ブロッカーは、図40Gに示される構成を含む。いくつかの例では、ブロッカーは、図40Hに示される構成を含む。いくつかの例では、ブロッカーは、図40Iに示される構成を含む。いくつかの例では、ブロッカーは、図40Jに示される構成を含む。いくつかの例では、ブロッカーは、図40Kに示される構成を含む。いくつかの例では、ブロッカーは、図40Lに示される構成を含む。
ブロッカーは、核酸塩基アナログなどの部分を含む場合がある。核酸塩基アナログおよび他の基として、ロックド核酸(LNA)、二環式核酸(BNA)、C5修飾ピリミジン塩基、2’-O-メチル置換RNA、ペプチド核酸(PNA)、グリコール核酸(GNA)、トレオース核酸(TNA)、イノシン、2’-デオキシイノシン、3-ニトロピロール、5-ニトロインドール、ゼノ核酸(XNA)、モルホリノバックボーン修飾塩基、マイナーグルーブバインダー(MGB)、スペルミン、G-クランプ、またはアントラキノン(Uaq)キャップが挙げられるが、これらに限定されるものではない。いくつかの例では、核酸塩基アナログはユニバーサル塩基を含み、ここで核酸塩基は、同族の核酸塩基に結合するために低いTを持つ。いくつかの例では、ユニバーサル塩基は5-ニトロインドールまたは2’-デオキシイノシンを含む。ある例では、ブロッカーは、2つのポリヌクレオチド鎖を接続するスペーサー要素を含む。いくつかの例では、ブロッカーは、表1から選択される1つ以上の核酸塩基アナログを含む。いくつかの例では、このような核酸塩基アナログはブロッカーのTを調節するために加えられる。ブロッカーは、所望のハイブリダイゼーションTに応じて、あらゆる数の核酸塩基アナログ(LNAまたはBNAなど)を含む場合がある。例えば、ブロッカーは20~40の核酸塩基アナログを含む。いくつかの例では、ブロッカーは8~16の核酸塩基アナログを含む。いくつかの例では、ブロッカーは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、または少なくとも12の核酸塩基アナログを含む。いくつかの例では、ブロッカーは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、または16の核酸塩基アナログを含む。いくつかの例では、核酸塩基アナログの数は、ブロッカー中の塩基の合計数の割合として表される。例えば、ブロッカーは少なくとも1%、2%、5%、10%、12%、18%、24%、30%、または30%超の核酸塩基アナログを含む。いくつかの例では、核酸塩基アナログを含むブロッカーは、各核酸塩基アナログに対して約2℃~約8℃の範囲でTを上昇させる。いくつかの例では、Tは、各核酸塩基アナログに対して少なくともまたは約1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、12℃、14℃、または16℃まで上昇される。いくつかの例では、このようなブロッカーは、アダプターの上部または「センス」鎖に結合するよう構成される。いくつかの例ではブロッカーは、アダプターの下部または「アンチセンス」鎖に結合するよう構成される。いくつかの例では、一組のブロッカーは、アダプターの上部鎖と下部鎖の両方に結合するよう構成される配列を含む。いくつかの例では、追加のブロッカーは、アダプター配列の補体、リバース、フォワード、またはリバース補体に対して構成される。いくつかの例では、上部鎖(上部に結合する)または下部鎖(あるいは両方)を標的とする一組のブロッカーがデザインかつ試験され、続いて、上部ブロッカーを下部ブロッカーに、または下部ブロッカーを上部ブロッカーに置き換えるなどの最適化が行われる。いくつかの例では、ブロッカーは、アダプター上でインデックスまたはバーコードの塩基と完全または部分的に重複するように構成される。いくつかの例では、一組のブロッカーは、アダプターインデックス配列と重複する少なくとも1つのブロッカーを含む。いくつかの例では、一組のブロッカーは、アダプターインデックス配列と重複する少なくとも1つのブロッカー、およびアダプターインデックス配列と重複しない少なくとも1つのブロッカーを含む。いくつかの例では、一組のブロッカーは、ヨーク領域配列と重複しない少なくとも1つのブロッカーを含む。いくつかの例では、一組のブロッカーは、ヨーク領域配列と重複しない少なくとも1つのブロッカー、およびヨーク領域配列と重複する少なくとも1つのブロッカーを含む。いくつかの例では、一組のブロッカーは、2、3、4、5、6、7、8、9、10、または10より多くのブロッカーを含む。
ブロッカーは、アダプターまたはハイブリダイゼーションTのサイズに応じて任意の長さであってもよい。例えば、ブロッカーは長さ20~50の塩基である。いくつかの例では、ブロッカーは、長さ25~45の塩基、30~40の塩基、20~40の塩基、または30~50の塩基である。いくつかの例では、ブロッカーは長さ25~30の塩基である。いくつかの例では、ブロッカーは、長さが少なくとも25、26、27、28、29、30、31、32、33、34、または35の塩基である。いくつかの例では、ブロッカーは、長さが多くとも25、26、27、28、29、30、31、32、33、34、または35の塩基である。いくつかの例では、ブロッカーは、長さが約25、26、27、28、29、30、31、32、33、34、または35の塩基である。いくつかの例では、ブロッカーは長さ約50の塩基である。いくつかの例では、アダプターでタグを付けられたゲノムライブラリフラグメントを標的とする一組のブロッカーは、長さが1より大きなブロッカーを含む。いくつかの例では、2つのブロッカーがリンカーに繋ぎ止められる。様々なリンカーが当該技術分野で周知であり、いくつかの例では、アルキル基、ポリエーテル基、アミン基、アミド基、または他の化学基を含む。いくつかの例では、リンカーは個別のリンカーユニットを含む。このユニットは、リン酸塩、チオリン酸塩、アミドなどの骨格、またはその他の骨格を介して一体的に接続される(またはブロッカーポリヌクレオチドに付けられる)。典型的な構成では、リンカーは、それぞれアダプター配列の5’末端を標的とする第1のブロッカーと、アダプター配列の3’末端を標的とする第2のブロッカーとの間にあるインデックス領域にまたがる。いくつかの例では、下流増幅を妨げるためにキャッピング基がブロッカーの5’または3’末端に加えられる。キャッピング基は多種多様に、ポリエーテル、多価アルコール、アルカン、または増幅を妨げる他のハイブリダイズ不能な基を含む。いくつかの例では、このような基は、リン酸塩、チオリン酸塩、アミド、または他の骨格を介して接続される。いくつかの例では、1つ以上のブロッカーが使用される。いくつかの例では、少なくとも4つの非同一ブロッカーが使用される。いくつかの例では、第1のブロッカーはアダプター配列の第1の3’末端にまたがり、第2のブロッカーはアダプター配列の第1の5’末端にまたがり、第3のブロッカーはアダプター配列の第2の3’末端にまたがり、第4のブロッカーはアダプター配列の第2の5’末端にまたがる。いくつかの例では、第1のブロッカーは、長さが少なくとも20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、または35の塩基である。いくつかの例では、第2のブロッカーは、長さが少なくとも20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、または35の塩基である。いくつかの例では、第3のブロッカーは、長さが少なくとも20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、または35の塩基である。いくつかの例では、第4のブロッカーは、長さが少なくとも20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、または35の塩基である。いくつかの例では、第1のブロッカー、第2のブロッカー、第3のブロッカー、または第4のブロッカーは、核酸塩基アナログを含む。いくつかの例では、前記核酸塩基アナログはLNAである。
ブロッカーのデザインは、アダプター配列への所望のハイブリダイゼーションTmにより影響を受ける場合がある。いくつかの例では、非標準核酸(例えばロックド核酸、架橋核酸、または他の非標準核酸もしくはアナログ)は、ブロッカーのTを増大または減少させるためにブロッカーへと挿入される。いくつかの例では、ブロッカーのTは、非標準アミノ酸を含むポリヌクレオチドのTを算出するのに特異的なツールを使用して算出される。いくつかの例では、TはExiqon(商標)オンライン予測ツールを使用して算出される。いくつかの例では、本明細書に記載のブロッカーのTは、インシリコで算出される。いくつかの例では、ブロッカーのTはインシリコで算出され、かつ実験上のインビトロ条件と相関される。理論に縛られるものではないが、実験で求められたTはさらに。塩濃度、温度、添加剤の存在、またはその他の因子などの実験パラメータにより影響を受ける場合がある。いくつかの例では、本明細書に記載のTはインシリコで求められたTであり、これを使用してブロッカーパフォーマンスがデザインまたは最適化される。いくつかの例では、T値は、融解曲線解析実験から予測、評価、または決定される。いくつかの例では、ブロッカーのTは70℃~99℃である。いくつかの例では、ブロッカーのTは75℃~90℃である。いくつかの例では、ブロッカーのTは少なくとも85℃である。いくつかの例では、ブロッカーのTは、少なくとも70、72、75、77、80、82、85、88、90、または92℃である。いくつかの例では、ブロッカーのTは、約70、72、75、77、80、82、85、88、90、92、または95℃である。いくつかの例では、ブロッカーのTは78℃~90℃である。いくつかの例では、ブロッカーのTは79℃~90℃である。いくつかの例では、ブロッカーのTは80℃~90℃である。いくつかの例では、ブロッカーのTは81℃~90℃である。いくつかの例では、ブロッカーのTは82℃~90℃である。いくつかの例では、ブロッカーのTは83℃~90℃である。いくつかの例では、ブロッカーのTは84℃~90℃である。いくつかの例では、一組のブロッカーの平均Tは78℃~90℃である。いくつかの例では、一組のブロッカーの平均Tは80℃~90℃である。いくつかの例では、一組のブロッカーの平均Tは少なくとも80℃である。いくつかの例では、一組のブロッカーの平均Tは少なくとも81℃である。いくつかの例では、一組のブロッカーの平均Tは少なくとも82℃である。いくつかの例では、一組のブロッカーの平均Tは少なくとも83℃である。いくつかの例では、一組のブロッカーの平均Tは少なくとも84℃である。いくつかの例では、一組のブロッカーの平均Tは少なくとも86℃である。いくつかの例では、ブロッカーのTは、高速のハイブリダイゼーション緩衝液および/またはハイブリダイゼーション促進剤の使用など、本明細書に記載の他の成分の結果として修飾される。
ブロッカーとアダプター標的とのモル比は、ハイブリダイゼーション中のオフベイト(続いてオフターゲット)率に影響を及ぼす場合がある。ブロッカーの標的アダプターへの結合が効率的になるほど、必要なブロッカーは少なくなる。いくつかの例では、本明細書に記載のブロッカーは、20:1(ブロッカー:標的)未満のモル比で、20%以下のオフターゲットリードのシーケンシング結果を達成する。いくつかの例では、20%以下のオフターゲットリードは、10:1(ブロッカー:標的)未満のモル比で達成される。いくつかの例では、20%以下のオフターゲットリードは、5:1(ブロッカー:標的)未満のモル比で達成される。いくつかの例では、20%以下のオフターゲットリードは、2:1(ブロッカー:標的)未満のモル比で達成される。いくつかの例では、20%以下のオフターゲットリードは、1.5:1(ブロッカー:標的)未満のモル比で達成される。いくつかの例では、20%以下のオフターゲットリードは、1.2:1(ブロッカー:標的)未満のモル比で達成される。いくつかの例では、20%以下のオフターゲットリードは、1.05:1(ブロッカー:標的)未満のモル比で達成される。
ユニバーサルブロッカーは、サイズが変動したパネルライブラリと共に使用されてもよい。いくつかの実施形態では、このパネルライブラリは、少なくともまたは約0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、1.0、2.0、4.0、8.0、10.0、12.0、14.0、16.0、18.0、20.0、22.0、24.0、26.0、28.0、30.0、40.0、50.0、60.0メガベース(Mb)、または60.0Mbを超えるものを含む。
本明細書に記載されるようなブロッカーは、オンターゲットパフォーマンスを改善する場合がある。いくつかの実施形態では、オンターゲットパフォーマンスは、少なくともまたは約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または95%より多く改善する。いくつかの実施形態では、オンターゲットパフォーマンスは、様々なインデックスデザインで少なくともまたは約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または95%より多く改善する。いくつかの実施形態では、オンターゲットパフォーマンスは、様々なパネルサイズで少なくともまたは約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または95%より多く改善する。
シーケンシング方法
本明細書には、シーケンシングの効率と精度を改善する方法が記載される。このような方法は、核酸塩基アナログを含むユニバーサルプライマーの使用、および、核酸をサンプリングするためにライゲーション後のバーコード化アダプターの生成を含む。いくつかの例では、試料が断片化され、フラグメント端部が修復され、1つ以上のアデニンがフラグメント重複部位(fragment duplex)の一本の鎖に加えられ、ユニバーサルアダプターがライゲートされ、フラグメントのライブラリがバーコード化プライマーにより増幅されることで、バーコード化核酸ライブラリが生成される(図22)。いくつかの例では、さらなる工程として、濃縮/キャプチャー、追加のPCR増幅、および/または核酸ライブラリのシーケンシングが挙げられる。
典型的なシーケンシングのワークフローの第1の工程では(図2)、試料核酸を含む試料(208)が機械剪断または酵素剪断により断片化され、フラグメント(209)のライブラリが形成される。インデクシングしたアダプター(215)を断片化試料核酸にライゲートすると、アダプターでライゲートされた試料核酸ライブラリ(210)が形成される。次いでこのライブラリは随意に増幅される。その後、ライブラリ(210)は随意に標的結合ポリヌクレオチド(217)でハイブリダイズされ、標的結合ポリヌクレオチド(217)は試料核酸(211)にハイブリダイズし、試料核酸(217)とアダプター(215)との間でのハイブリダイゼーションを妨げる遮断ポリヌクレオチド(216)でハイブリダイズされる。試料核酸の標的結合ポリヌクレオチドハイブリダイゼーションペア(212)/(218)のキャプチャー、および標的結合ポリヌクレオチド(217)の除去により、試料核酸(213)の単離/濃縮が可能となり、その後随意に増幅され、配列決定される(214)。
典型的なシーケンシングのワークフローの第1の工程では(図3)、試料核酸を含む試料(208)が機械剪断または酵素剪断により断片化され、フラグメント(209)のライブラリが形成される。ユニバーサルアダプター(220)を断片化試料核酸にライゲートすると、アダプターでライゲートされた試料核酸ライブラリ(221)が形成される。次いで、このライブラリをバーコード化プライマーライブラリ(222)(簡潔さのために1つのプライマーのみを示す)で増幅すると、バーコード化アダプターの試料ポリヌクレオチドライブラリ(223)が生成される。その後、ライブラリ(223)は随意に標的結合ポリヌクレオチド(217)でハイブリダイズされ、標的結合ポリヌクレオチド(217)は、プローブポリヌクレオチド(217)とアダプター(220)との間でのハイブリダイゼーションを妨げる遮断ポリヌクレオチド(216)とともに、試料核酸にハイブリダイズする。試料ポリヌクレオチドの標的結合ポリヌクレオチドハイブリダイゼーションペア(212)/(218)のキャプチャー、および標的結合ポリヌクレオチド(217)の除去により、試料核酸(213)の単離/濃縮が可能となり、その後随意に増幅され、配列決定される(214)。ユニバーサルアダプターおよびバーコード化プライマーの様々な組み合わせを使用してもよい。いくつかの例では、バーコード化プライマーは少なくとも1つのバーコードを含む。いくつかの例では、異なる種類のバーコードが、アダプター、バーコード、またはその両方を使用して試料核酸に加えられる。例えばユニバーサルアダプターはインデックスバーコードを含み、ライゲーション後、追加のインデックスバーコードを含むバーコード化プライマーにより増幅される。いくつかの例では、ユニバーサルアダプターは固有の分子識別子バーコードを含み、ライゲーション後、インデックスバーコードを含むバーコード化プライマーにより増幅される。
バーコード化プライマーは、PCRを使用してユニバーサルアダプターでライゲートされた試料ポリヌクレオチドを増幅し、シーケンシングのためにポリ核酸を生成するために使用されてもよい。いくつかの例では、このようなライブラリは増幅後にバーコードを含む。いくつかの例では、バーコード化プライマーでの増幅の結果、標準のYアダプターでライゲートされた試料ポリヌクレオチドライブラリの増幅に比べて多くの増幅収量が得られる。いくつかの例では、ユニバーサルアダプターでライゲートされた試料ポリヌクレオチドライブラリを増幅するために、2、3、4、5、6、7、8、9、10、11、または12のPCRサイクルが使用される。いくつかの例では、ユニバーサルアダプターでライゲートされた試料ポリヌクレオチドライブラリを増幅するために、多くとも2、3、4、5、6、7、8、9、10、11、または12のPCRサイクルが使用される。いくつかの例では、ユニバーサルアダプターでライゲートされた試料ポリヌクレオチドライブラリを増幅するために、2~12、3~10、4~9、5~8、6~10、または8~12のPCRサイクルが使用される。いくつかの例では、このようなライブラリはより少数のPCRベースの誤差を含む。理論に縛られるものではないが、増幅中のPCRサイクルが減少すると、アンプリコン生成物に生じる誤差は少数となる。増幅後、このようなバーコード化アンプリコンライブラリは、いくつかの例では濃縮され、キャプチャー、追加の増幅反応、および/またはシーケンシングにかけられる。いくつかの例では、本明細書に記載のユニバーサルアダプターを使用して生成されるアンプリコン生成物は、標準の完全長Yアダプターの増幅から生成されるアンプリコン生成物よりも誤差が約30%、15%、10%、7%、5%、3%、2%、1.5%、1%、0.5%、0.1%、または0.05%少ない。
本明細書には、ゲノムフラグメントにライゲートされるアダプターへのキャプチャープローブのオフターゲット結合、またはアダプター間ハイブリダイゼーションを防ぐためにユニバーサルブロッカーが使用される方法が、記載される。オフターゲットハイブリダイゼーションを防ぐために使用されるアダプターブロッカーは、アダプターの一部または全体を標的とする場合がある。いくつかの例では、固有のインデックス配列を含むアダプターの一部に相補的である特異的なブロッカーが、使用される。アダプターでタグを付けられたゲノムライブラリが多くの異なるインデックスを含む場合、インデックス配列を標的としないか、またはインデックス配列に強くハイブリダイズしないブロッカーをデザインすることが有益な場合がある。例えば、「ユニバーサル」ブロッカーは、インデックス配列を含まない(インデックスに依存しない)アダプターの一部を標的とし、これにより、利用される様々なインデックス配列の数に関係なく最小数のブロッカーの使用が可能となる。いくつかの例では、多くとも8つのユニバーサルブロッカーが使用される。いくつかの例では、4つのユニバーサルブロッカーが使用される。いくつかの例では、3つのユニバーサルブロッカーが使用される。いくつかの例では、2つのユニバーサルブロッカーが使用される。いくつかの例では、1つのユニバーサルブロッカーが使用される。典型的な構成では、4つのユニバーサルブロッカーは、少なくとも4、8、16、32、64、96、または128の異なるインデックス配列を含むアダプターと共に使用される。いくつかの例では、異なるインデックス配列は、少なくともまたは約4、6、8、10、12、14、16、18、20、または20より多くの塩基対(bp)を含む。いくつかの例では、ユニバーサルブロッカーは、バーコード配列に結合するよう構成されない。いくつかの例では、ユニバーサルブロッカーは、バーコード配列に部分的に結合する。いくつかの例では、バーコード配列に部分的に結合するユニバーサルブロッカーはさらに、アダプターに結合するTを増大させるもの(例えばLNAまたはBNA)など、ヌクレオチドアナログを含む。
メチル化シーケンシングとキャプチャー
メチル化シーケンシングは、脱アミノ化で最高点に達する一連の事象を介して非メチル化シトシンのウラシルへの変換を生じさせる一方で、メチル化シトシンを無傷のままにする、酵素的または化学的な方法を必要とする(図41)。増幅中にウラシルは相補鎖上でアデニンと対になり、これにより非メチル化シトシンの本来の位置にチミンが含まれる。図41では、異なる位置にそれぞれ非メチル化シトシンを有する同一の配列が存在する。最終生成物は非対称的であり、変換後に2つの異なる二本鎖DNA分子をもたらす(上の列、図41)。メチル化DNAに対し同じプロセスを行うと、さらに複数組の配列が得られる(下の列、図41)。
標的の濃縮は、事前または事後のキャプチャー変換により処理することができる。事後のキャプチャー変換は左側の本来の試料DNAを標的とし、事前のキャプチャーは右側の変換された配列の4つの鎖を標的とする(図41)。事後のキャプチャー転換でのプローブデザインに対する困難は少ないが、PCR増幅がメチル化パターンを保存せずキャプチャー前に実行できないため、大量の開始DNA材料が必要となるのが多い。そのため、事前のキャプチャー転換は多くの場合、無細胞DNAなどの低入力で感受性のある用途に対する選択の方法である。
本明細書に記載の方法は、シトシンのウラシルへの変換を促すための、酵素または重亜硫酸塩によるライブラリの処理を含む場合がある。いくつかの例では、本明細書に記載のアダプター(例えばユニバーサルアダプター)は、メチル化シトシンなどのメチル化核酸塩基を含む。
増幅反応のための小ポリヌクレオチド集団のデノボ合成
表面、例えば、プレートからポリヌクレオチドを合成する方法が本明細書に記載される。いくつかの例では、ポリヌクレオチドは、ポリヌクレオチド伸長のための座のクラスター上で合成され、放出され、その後、増幅反応、例えば、PCRに供される。クラスターからのポリヌクレオチドの合成の例示的なワークフローが図8に示される。シリコンプレート(801)は、複数のクラスター(803)を含む。各クラスター内には、複数の座(821)が存在する。ポリヌクレオチドは、クラスター(803)からプレート(801)上でデノボ合成される(807)。ポリヌクレオチドは切断され(811)、プレートから除去されることで(813)、放出されたポリヌクレオチドの集団(815)を形成する。放出されたポリヌクレオチドの集団(815)は、その後、増幅され(817)、増幅されたポリヌクレオチドのライブラリ(819)を形成する。
本明細書で提供される方法は、クラスター上で合成されたポリヌクレオチドの増幅が、そのようなクラスター化された配置を有していない構造体の表面全体にわたるポリヌクレオチドの増幅と比較して、ポリヌクレオチドの表現に対する強化された制御を提供する。いくつかの例では、ポリヌクレオチド伸長のための座のクラスター化された配置を有する表面から合成されたポリヌクレオチドの増幅は、大きなポリヌクレオチド集団の反復合成に起因する表現に対する負の影響を克服するために提供される。大きなポリヌクレオチド集団の反復合成に起因する表現に対する例示的な負の影響としては、限定されないが、高/低GC含有量、反復配列、後方の(trailing)アデニン、二次構造、標的配列結合に対する親和性、またはポリヌクレオチド配列中の修飾されたヌクレオチドに起因する、増幅バイアスが挙げられる。
クラスター化された配置なしでプレート全体にわたってポリヌクレオチドを増幅するのとは対照的なクラスター増幅は、平均の周りのよりタイトな分布をもたらし得る。例えば、10万のリードがランダムにサンプリングされる場合、配列ごとに平均8つのリードにより、平均から約1.5倍の分布を有するライブラリが生成される。場合によっては、単一クラスター増幅により、平均から最大で約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、または約2.0倍がもたらされる。場合によっては、単一クラスター増幅により、平均から少なくとも約1.0倍、1.2倍、1.3倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、または2.0倍がもたらされる。
プレート全体にわたる増幅と比較して、本明細書に記載されるクラスター増幅方法は、等価な配列表現に必要とされるシーケンシングがより少ないポリヌクレオチドライブラリをもたらし得る。いくつかの例では、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%少ないシーケンシングが必要とされる。いくつかの例では、最大10%、最大20%、最大30%、最大40%、最大50%、最大60%、最大70%、最大80%、最大90%、または最大95%少ないシーケンシングが必要とされる。プレート全体にわたる増幅と比較して、クラスター増幅後に、30%少ないシーケンシングが必要とされることもある。いくつかの例では、ポリヌクレオチドのシーケンシングは、次世代シーケンシングなどのハイスループットシーケンシングによって検証される。シーケンシングライブラリのシーケンシングは、限定されないが、単一分子のリアルタイム(SMRT)シーケンシング、ポロニーシーケンシング、ライゲーションによるシーケンシング、可逆的なターミネーターシーケンシング、陽子検出シーケンシング、イオン半導体シーケンシング、ナノポアシーケンシング、電子シーケンシング、パイロシーケンシング、マクサム-ギルバートシーケンシング、連鎖停止反応(例えば、サンガー)シーケンシング、+Sシーケンシング、あるいは合成によるシーケンシングを含む任意の適切なシーケンシング技術を用いて実施されてもよい。単一のヌクレオチドまたはポリヌクレオチドが同定されたか、または「読み取られた」回数は、シーケンシング深度またはリード深度として定義される。場合によっては、リード深度は、フォールドカバレッジ、例えば、55倍(または55×)カバレッジと呼ばれ、随意に、塩基のパーセンテージを記載する。
いくつかの例では、プレート全体にわたる増幅と比較して、クラスター化された配置からの増幅は、より少ないドロップアウト、または増幅産物のシーケンシング後に検出されない配列をもたらす。ドロップアウトは、ATおよび/またはGCであり得る。いくつかの例では、ドロップアウトの数は、ポリヌクレオチド集団の最大約1%、2%、3%、4%、または5%である。場合によっては、ドロップアウトの数はゼロである。
本明細書に記載されるクラスターは、ポリヌクレオチド合成のための離散的で非重複の座の集合体を含む。クラスターは、約50~1000、75~900、100~800、125~700、150~600、200~500、または300~400の座を含み得る。いくつかの例では、各クラスターは121の座を含む。いくつかの例では、各クラスターは、約50~500、約50~200、約100~150の座を含む。いくつかの例では、各クラスターは、少なくとも約50、100、150、200、500、1000、またはそれ以上の座を含む。いくつかの例では、単一のプレートは、100、500、10000、20000、30000、50000、100000、500000、700000、1000000、またはそれ以上の座を含む。座は、スポット、ウェル、マイクロウェル、チャネル、またはポストであり得る。いくつかの例では、各クラスターは、同一の配列を有するポリヌクレオチドの伸長を支持する別の特徴の少なくとも1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、またはそれ以上の冗長性(redundancy)を有する。
配列含量(Sequence Content)の化学量論を制御したポリヌクレオチドライブラリの生成
いくつかの例では、ポリヌクレオチドライブラリは、所望のポリヌクレオチド配列の指定された分布で合成される。いくつかの例では、特定の所望の配列を濃縮するためにポリヌクレオチドライブラリを調節すると、結果として、下流の用途の結果(downstream application outcomes)が改善される。
1つ以上の特定の配列は、下流の用途におけるそれらの評価に基づいて選択され得る。いくつかの例では、評価は、増幅、濃縮、または検出のための標的配列に対する結合親和性、安定性、融解温度、生物学的活性、より大きな断片へと集合する能力、またはポリヌクレオチドの他の特性である。いくつかの例では、評価は、経験的なものであるか、または先行実験および/またはコンピュータアルゴリズムから予測される。例示的な用途には、平均的なリード深度よりも小さいリード深度を有するゲノム標的の領域に対応するプローブライブラリ中の配列を増加させることが含まれる。
ポリヌクレオチドライブラリ中の選択された配列は、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、95%であり得るか、または95%を超える場合がある。いくつかの例では、ポリヌクレオチドライブラリ中の選択された配列は、配列の最大10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または最大100%である。場合によっては、選択された配列は、配列の約5~95%、約10~90%、約30~80%、約40~75%、または約50~70%の範囲である。
ポリヌクレオチドライブラリは、それぞれの選択された配列の頻度で調節することができる。いくつかの例では、ポリヌクレオチドライブラリは、より多くの選択された配列に有利である。例えば、選択された配列のポリヌクレオチド頻度の増加が約40%~約90%の範囲にあるライブラリが設計される。いくつかの例では、ポリヌクレオチドライブラリは、選択された配列の数が少ないものを含む。例えば、ライブラリは、選択された配列のポリヌクレオチド頻度の増加が約10%~約60%の範囲にあるように設計される。ライブラリは、選択された配列のより高い頻度およびより低い頻度に有利であるように設計され得る。いくつかの例では、ライブラリは、均一な配列表現を好む。例えば、ポリヌクレオチドの頻度は、選択された配列の頻度に関して、約10%~約90%の範囲で均一である。いくつかの例では、ライブラリは、配列の約10%~約95%の範囲の選択された配列頻度を有するポリヌクレオチドを含む。
場合によっては、指定された選択された配列頻度を有するポリヌクレオチドライブラリの生成は、異なる選択された配列頻度含量を有する少なくとも2つのポリヌクレオチドライブラリを組み合わせることによって行われる。いくつかの実施形態では、少なくとも2、3、4、5、6、7、10、または10を超えるポリヌクレオチドライブラリが、指定された選択された配列頻度を有するポリヌクレオチドの集団を生成するために組み合わせられる。場合によっては、2以下、3以下、4以下、5以下、6以下、7以下、または10以下のポリヌクレオチドライブラリが、指定された選択された配列頻度を有する非同一ポリヌクレオチドの集団を生成するために組み合わされる。
いくつかの例では、選択された配列頻度は、1つのクラスターあたりより少ないまたはより多くのポリヌクレオチドを合成することによって調整される。例えば、少なくとも約25、50、100、200、300、400、500、600、700、800、900、1000、または1000を超える非同一ポリヌクレオチドが単一のクラスター上で合成される。場合によっては、約50、100、200、300、400、500、600、700、800、900、1000以下の非同一ポリヌクレオチドは、単一のクラスター上では合成されない。いくつかの例では、50~500の非同一ポリヌクレオチドが単一のクラスター上で合成される。いくつかの例では、100~200の非同一ポリヌクレオチドが単一のクラスター上で合成される。いくつかの例では、約100、約120、約125、約130、約150、約175、または約200の非同一ポリヌクレオチドが単一のクラスター上で合成される。
場合によっては、選択された配列頻度は、様々な長さの非同一ポリヌクレオチドを合成することによって調節される。例えば、非同一ポリヌクレオチドの各々の長さは、少なくともまたは少なくとも約10、15、20、25、30、35、40、45、50、100、150、200、300、400、500、2000のヌクレオチド、またはそれ以上であり得る。合成された非同一ポリヌクレオチドの長さは、最大で、または最大で約2000、500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10のヌクレオチド、またはそれ以下である。非同一ポリヌクレオチドの各々の長さは、10~2000、10~500、9~400、11~300、12~200、13~150、14~100、15~50、16~45、17~40、18~35、および19~25の範囲であり得る。
ポリヌクレオチドプローブ構造
ポリヌクレオチドプローブのライブラリは、試料ポリヌクレオチドのより大きな集団において特定の標的配列を濃縮するために使用することができる。いくつかの例では、ポリヌクレオチドプローブはそれぞれ、1つ以上の標的配列に相補的な標的結合配列、1つ以上の非標的結合配列、および1つ以上のプライマー結合部位、例えば、ユニバーサルプライマー結合部位を含む。相補的であるか、または、少なくとも部分的に相補的である標的結合配列は、いくつかの例では、標的配列に結合(ハイブリダイズ)する。ユニバーサルプライマー結合部位などのプライマー結合部位は、プローブライブラリの全メンバー、またはメンバーのサブ集団の同時増幅を容易にする。いくつかの例では、プローブまたはアダプターはさらに、バーコード配列またはインデックス配列を構成する。バーコードは、バーコードが関連付けられるポリヌクレオチドのいくつかの特徴を識別することを可能にする核酸配列である。シーケンシング後、バーコード領域は、コード領域または試料ソースに関連付けられる特徴を識別するための指標を提供する。バーコードは、十分な程度の識別を可能にするために、適切な長さ、例えば、少なくとも約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、またはそれ以上の塩基長で設計することができる。複数のバーコード、例えば、約2、3、4、5、6、7、8、9、10、またはそれ以上のバーコードが、非バーコード配列によって随意に分離された同一の分子上で使用されてもよい。いくつかの例では、複数のバーコードの各バーコードは、少なくとも約3、4、5、6、7、8、9、10、またはそれ以上の位置などの、複数の少なくとも3つの塩基位置の他のすべてのバーコードとは異なる。バーコードを使用すると、シーケンシング(マルチプレックス)などの下流の用途のために、複数のライブラリをプールして同時に処理することが可能になる。いくつかの例では、少なくとも4、8、16、32、48、64、128、512、1024、2000、5000、または5000を超えるバーコード付きライブラリが使用される。いくつかの例では、ポリヌクレオチドは、低分子、ペプチド、抗原、金属、またはタンパク質などの1つ以上の分子(または、親和性)タグにライゲートされて、対象の標的配列をその後キャプチャーするためのプローブを形成する。いくつかの例では、ポリヌクレオチドの一部のみが分子タグにライゲートされる。いくつかの例では、ハイブリダイゼーションが可能な相補的な標的結合配列を有する2つのプローブは、二本鎖プローブ対を形成する。ポリヌクレオチドプローブまたはアダプターは、固有の分子識別子(UMI)を含んでいてもよい。UMIにより、バイアスを導入する可能性がある下流の試料処理(例えば、PCRまたは濃縮の工程)の前に、初期の試料濃度または化学量論の内部測定が可能になる。いくつかの例では、UMIは、1つ以上のバーコード配列を含む。
本明細書に記載されるプローブは、ゲノム中の配列である標的配列に相補的であってもよい。本明細書に記載されるプローブは、ゲノム中のエクソーム配列である標的配列に相補的であってもよい。本明細書に記載されるプローブは、ゲノム中のイントロン配列である標的配列に相補的であってもよい。いくつかの例では、プローブは、(試料核酸の)標的配列に相補的な標的結合配列と、標的に相補的ではない少なくとも1つの非標的結合配列とを含む。いくつかの例では、プローブの標的結合配列は、約120ヌクレオチド長、または少なくとも10、15、20、25、50、75、100、110、120、125、140、150、160、175、200、300、400、500、または500を超えるヌクレオチド長である。いくつかの例では、標的結合配列は、10、15、20、25、50、75、100、125、150、175、200、または500以下のヌクレオチド長である。プローブの標的結合配列は、いくつかの例では、約120ヌクレオチド長、または約10、15、20、25、40、50、60、70、80、85、87、90、95、97、100、105、110、115、117、118、119、120、121、122、123、124、125、126、127、128、129、130、135、140、145、150、155、157、158、159、160、161、162、163、164、165、166、167、168、169、170、175、180、190、200、210、220、230、240、250、300、400、または約500ヌクレオチド長である。標的結合配列は、いくつかの例では、約20~約400ヌクレオチド長、または約30~約175、約40~約160、約50~約150、約75~約130、約90~約120、または約100~約140ヌクレオチド長である。プローブの非標的結合配列は、いくつかの例では、少なくとも約20ヌクレオチド長、または少なくとも約1、約5、約10、約15、約17、約20、約23、約25、約50、約75、約100、約110、約120、約125、約140、約150、約160、約175、または約175を超えるヌクレオチド長である。非標的結合配列はしばしば、約5以下、10、約15以下、約20以下、約25以下、約50以下、約75以下、約100以下、約125以下、約150以下、約175以下、または約200以下のヌクレオチド長である。プローブの非標的結合配列はしばしば、約20ヌクレオチドの長さ、または約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、40、50、60、70、80、90、100、110、120、130、140、150、または約200ヌクレオチドの長さである。 いくつかの例では、非標的結合配列は、約1~約250ヌクレオチド長、または約20~約200ヌクレオチド長、約10~約100ヌクレオチド長、約10~約50ヌクレオチド長、約30~約100ヌクレオチド長、約5~約40ヌクレオチド長、または約15~約35ヌクレオチド長である。非標的結合配列はしばしば、標的配列に相補的ではない配列を含み、および/またはプライマーと結合するために使用されない配列を含む。いくつかの例では、非標的結合配列は、単一ヌクレオチド、例えば、ポリアデニンまたはポリチミジンの繰り返しを含む。プローブはしばしば、非標的結合配列をまったく含まないか、または少なくとも1つの非標的結合配列を含む。いくつかの例では、プローブは1つまたは2つの非標的結合配列を含む。非標的結合配列は、プローブ中の1つ以上の標的結合配列に隣接することもある。例えば、非標的結合配列は、プローブの5’末端または3’末端に位置する。いくつかの例では、非標的結合配列は、分子タグまたはスペーサーに結合する。
いくつかの例では、非標的結合配列はプライマー結合部位であり得る。プライマー結合部位はそれぞれ、しばしば、少なくとも約20ヌクレオチド長、または少なくとも約10、少なくとも約12、少なくとも約14、少なくとも約16、少なくとも約18、少なくとも約20、少なくとも約22、少なくとも約24、少なくとも約26、少なくとも約28、少なくとも約30、少なくとも約32、少なくとも約34、少なくとも約36、少なくとも約38、または少なくとも約40ヌクレオチド長である。いくつかの例では、各プライマー結合部位は、約10以下、約12以下、約14以下、約16以下、約18以下、約20以下、約22以下、約24以下、約26以下、約28以下、約30以下、約32以下、約34以下、約36以下、約38以下、または約40以下のヌクレオチド長である。いくつかの例では、各プライマー結合部位は、約10~約50ヌクレオチド長、または約15~約40ヌクレオチド長、約20~約30ヌクレオチド長、約10~約40ヌクレオチド長、約10~約30ヌクレオチド長、約30~約50ヌクレオチド長、または約20~約60ヌクレオチド長である。いくつかの実施形態では、ポリヌクレオチドプローブは、少なくとも2つのプライマー結合部位を含む。いくつかの例では、プライマー結合部位は、ユニバーサルプライマー結合部位であってもよく、ここで、すべてのプローブは、これらの部位で同一のプライマー結合配列を含む。いくつかの例では、特定の配列およびその逆相補体(例えば、ゲノムDNAの領域)を標的とする一対のポリヌクレオチドプローブは、第1の標的結合配列(901)、第2の標的結合配列(902)、第1の非標的結合配列(903)、および第2の非標的結合配列(904)を含む、図9Aの(900)で表される。例えば、特定の配列(例えば、ゲノムDNAの領域)に相補的な一対のポリヌクレオチドプローブ。
いくつかの例では、第1の標的結合配列(901)は、第2の標的結合配列(902)の逆相補体である。いくつかの例では、両方の標的結合配列は、増幅の前に化学的に合成される。代替的な配置では、特定の配列およびその逆相補体(例えば、ゲノムDNAの領域)を標的とする一対のポリヌクレオチドプローブは、第1の標的結合配列(901)、第2の標的結合配列(902)、第1の非標的結合配列(903)、第2の非標的結合配列(904)、第3の非標的結合配列(906)、および第4の非標的結合配列(907)を含む、図9Bの(905)で表される。いくつかの例では、第1の標的結合配列(901)は、第2の標的結合配列(902)の逆相補体である。いくつかの例では、1つ以上の非標的結合配列は、ポリアデニンまたはポリチミジンを含む。
いくつかの例では、一対の両方のプローブは、少なくとも1つの分子タグで標識される。いくつかの例では、増幅中に(分子タグを含むプライマーを介して)分子タグをプローブに導入するためにPCRが使用される。いくつかの例では、分子タグは、1以上のビオチン、葉酸、ポリヒスチジン、FLAGタグ、グルタチオン、または本明細書に一致する他の分子タグを含む。いくつかの例では、プローブは5’末端で標識される。いくつかの例では、プローブは3’末端で標識される。いくつかの例では、5’末端と3’末端の両方が分子タグで標識される。いくつかの例では、一対の第1のプローブの5’末端は、少なくとも1つの分子タグで標識され、一対の第2のプローブの3’末端は、少なくとも1つの分子タグで標識される。いくつかの例では、1つ以上の分子タグとプローブの核酸との間にスペーサーが存在する。いくつかの例では、スペーサーは、アルキル、ポリオール、またはポリアミノ鎖、ペプチド、またはポリヌクレオチドを含む場合がある。いくつかの例では、プローブ-標的核酸複合体をキャプチャーするために使用される固体支持体は、ビーズまたは表面である。いくつかの例では、固体支持体は、ガラス、プラスチック、または分子タグを結合するキャプチャー部分を含むことができる他の材料を含む。いくつかの例では、ビーズは磁気ビーズである。例えば、ビオチンで標識されたプローブは、ストレプトアビジンを含む磁気ビーズでキャプチャーされる。プローブを核酸のライブラリと接触させて、標的配列へのプローブの結合を可能にする。いくつかの例では、標的核酸に結合した1つ以上のアダプター配列へのプローブの結合を防止するために、ブロッキングポリ核酸が加えられる。いくつかの例では、ブロッキングポリ核酸は、1つ以上の核酸アナログを含む。いくつかの例では、ブロッキングポリ核酸は、1つ以上の位置でチミンで置換されたウラシルを有する。
本明細書に記載されるプローブは、1つ以上の標的核酸配列に結合する相補的な標的結合配列を含み得る。いくつかの例では、標的配列は任意のDNAまたはRNAの核酸配列である。いくつかの例では、標的配列はプローブインサート(probe insert)よりも長いことがある。いくつかの例では、標的配列はプローブインサートよりも短いことがある。いくつかの例では、標的配列はプローブインサートと同じ長さであり得る。例えば、標的配列の長さは、少なくともまたは少なくとも約2、10、15、20、25、30、35、40、45、50、100、150、200、300、400、500、1000、2000、5,000、12,000、20,000ヌクレオチド、またはそれ以上であり得る。標的配列の長さは、最大で、または最大で約20,000、12,000、5,000、2,000、1,000、500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10、2ヌクレオチド、またはそれ以下であり得る。標的配列の長さは、2~20,000、3~12,000、5~5,000、10~2,000、10~1,000、10~500、9~400、11~300、12~200、13~150、14~100、15~50、16~45、17~40、18~35、19~25の範囲であり得る。プローブ配列は、特定の遺伝子、疾患、調節経路、または本明細書と一致する他の生物学的機能に関連する配列を標的とすることができる。
いくつかの例では、単一のプローブインサート(1003)は、より大きなポリ核酸(1000)中の1つ以上の標的配列(1002)(図10A~10G)に相補的である。例示的な標的配列はエクソンである。いくつかの例では、1つ以上のプローブは、単一の標的配列を標的とする(図10A~10G)。いくつかの例では、単一のプローブは、1つを超える標的配列を標的とすることができる。いくつかの例では、プローブの標的結合配列は、標的配列(1002)と隣接配列(1001)の両方を標的とする(図10Aおよび10B)。いくつかの例では、第1のプローブは、標的配列の第1の領域と第2の領域を標的とし、第2のプローブは、標的配列の第2の領域と第3の領域を標的とする(図10Dおよび図10E)。いくつかの例では、複数のプローブは単一の標的配列を標的とし、ここで、複数のプローブの標的結合配列は、標的配列の領域に対する相補性に関して重複する1つ以上の配列を含む(図10G)。いくつかの例では、いくつかの実施形態では、プローブインサートは、標的配列の領域に対する相補性に関して重複していない。いくつかの例では、少なくとも2、10、15、20、25、30、35、40、45、50、100、150、200、300、400、500、1000、2000、5000、12000、20000、または20000を超えるプローブが単一の標的配列を標的とする。いくつかの例では、単一の標的配列を対象とする4つ以下のプローブが重複するか、または単一の標的配列を対象とする3つ以下、2つ以下、1つ以下のプローブが重複するか、または単一の標的配列を対象とするいかなるプローブも重複しない。いくつかの例では、1つ以上のプローブは、標的配列中のすべての塩基を標的とするわけではなく、1つ以上のギャップを残す(図10Cと図10F)。いくつかの例では、ギャップは、標的配列(1005)の中央付近にある(図10F)。いくつかの例では、ギャップ(1004)は、標的配列の5’末端または3’末端にある(図10C)。いくつかの例では、ギャップは6ヌクレオチド長である。いくつかの例では、ギャップは、1以下、2以下、3以下、4以下、5以下、6以下、7以下、8以下、9以下、10以下、20以下、30以下、40以下、または50以下のヌクレオチド長である。いくつかの例では、ギャップは、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、または少なくとも50ヌクレオチド長である。いくつかの例では、ギャップの長さは、1~50、1~40、1~30、1~20、1~10、2~30、2~20、2~10、3~50、3~25、3~10、または3~8ヌクレオチド長の範囲内である。いくつかの例では、配列を標的とするプローブのセットは、相補的な配列にハイブリダイズしたときに、そのセット中のプローブ間に重複する領域を含まない。いくつかの例では、配列を標的とするプローブのセットは、相補的な配列にハイブリダイズしたときに、そのセット中のプローブ間にはギャップがない。プローブは、標的配列への均一な結合を最大化するように設計されてもよい。いくつかの例では、プローブは、高または低GC含有量、二次構造、反復配列/回文配列、またはプローブが標的に結合するのを妨げる可能性のある他の配列特徴の標的結合配列を最小限に抑えるように設計される。いくつかの例では、単一のプローブは、複数の標的配列を標的とすることができる。
本明細書に記載されるプローブライブラリは、少なくとも10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、または1,000,000を超えるプローブを含んでいてもよい。プローブライブラリは、10以下、20以下、50以下、100以下、200以下、500以下、1,000以下、2,000以下、5,000以下、10,000以下、20,000以下、50,000以下、100,000以下、200,000以下、500,000以下、または1,000,000,000以下のプローブを含み得る。プローブライブラリは、10~500、20~1000、50~2000、100~5000、500~10,000、1,000~5,000、10,000~50,000、100,000~500,000、または50,000~1,000,000のプローブを含み得る。プローブライブラリは、約370,000;400,000;500,000、またはそれ以上の様々なプローブを含み得る。
次世代シーケンシングの適用
ポリヌクレオチドライブラリの下流の適用は、次世代シーケンシングを含み得る。例えば、制御された化学量論のポリヌクレオチドプローブライブラリによる標的配列の濃縮は、より効率的なシーケンシングをもたらす。標的をキャプチャーするか、または標的にハイブリダイズするためのポリヌクレオチドライブラリのパフォーマンスは、効率、正確さ、および精度を説明する多くの異なる測定基準によって定義されてもよい。例えば、Picard測定基準は、HSライブラリサイズ(リードペアから計算された、標的領域に対応するライブラリ中の固有の分子の数)、平均の標的カバレッジ(特定のカバレッジレベルに達する塩基の割合)、カバレッジ深度(所与のヌクレオチドを含むリードの数)、フォールドエンリッチメント(fold enrichment)(総試料に対してマッピングする標的/リードに対して一意にマッピングする配列リードに、総サンプルの長さ/標的の長さをかけたもの)、オフベイト塩基パーセント(percent off-bait bases)(プローブ/ベイトの塩基に対応しない塩基のパーセント)、オフターゲットパーセント(対象の塩基に対応しない塩基のパーセント)、標的上の使用可能な塩基、ATあるいはGCのドロップアウト率、fold-80 base penalty(0ではない標的の80パーセントを平均カバレッジレベルに上げるのに必要なフォールドオーバーカバレッジ(fold over-coverage))、パーセントゼロカバレッジ標的、PFリード(クオリティーフィルター(quality filter)を通過したリードの数)、選択された塩基のパーセント(オンベイト塩基(on-bait bases)とニアベイト塩基(near-bait bases)の総数を、位置合わせされた塩基の総数で割ったもの)、重複パーセント、または明細書と一致する他の変数などの変数を含む。
リード深度(シーケンシング深度、またはサンプリング)は、配列に対して配列決定された核酸断片(「リード」)が得られる総回数を表す。理論的なリード深度は、理想的なゲノム全体にリードが完全に分布されていると仮定して、同じヌクレオチドが読み取られる期待回数として定義される。リード深度は、カバレッジ率(または、カバレッジ幅)の関数として表される。例えば、完全に分布された100万塩基のゲノムの1,000万のリードは、理論的には配列の100%の10倍のリード深度をもたらす。実際には、標的配列の割合について所望のリード深度を得るためには、より多くのリード(より高い理論的なリード深度、またはオーバーサンプリング)が必要となることがある。制御された化学量論的プローブライブラリを用いて標的配列を濃縮すると、下流のシーケンシングの効率が向上する。なぜなら、標的配列の所望の%に対して許容可能なリード数を有する結果を得るために、より少ない総リード数が必要となるためである。例えば、いくつかの例では、標的配列の55倍の理論的なリード深度は、配列の少なくとも90%の少なくとも30倍のカバレッジをもたらす。いくつかの例では、標的配列の55倍以下の理論的なリード深度は、配列の少なくとも80%の少なくとも30倍のリード深度をもたらす。いくつかの例では、標的配列の55倍以下の理論的なリード深度は、配列の少なくとも95%の少なくとも30倍のリード深度をもたらす。いくつかの例では、標的配列の55倍以下の理論的なリード深度は、配列の少なくとも98%の少なくとも10倍のリード深度をもたらす。いくつかの例では、標的配列の55倍の理論的なリード深度は、配列の少なくとも98%の少なくとも20倍のリード深度をもたらす。いくつかの例では、標的配列の55倍以下の理論的なリード深度は、配列の少なくとも98%の少なくとも5倍のリード深度をもたらす。標的とのハイブリダイゼーション中にプローブの濃縮を増加させると、リード深度が増加し得る。いくつかの例では、プローブの濃度を少なくとも1.5倍、2.0倍、2.5倍、3倍、3.5倍、4倍、5倍、または5倍以上増加させる。いくつかの例では、プローブの濃度を増加させると、リード深度の少なくとも1000%の増加、または20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、500%、750%、1000%、または1000%を超える増加がもたらされる。いくつかの例では、プローブの濃度を3倍増加させると、リード深度は10000%増加する。
オンターゲット率は、所望の標的配列に一致するシーケンシングリードの割合を表す。いくつかの例では、制御された化学量論的ポリヌクレオチドプローブライブラリは、少なくとも30%、または少なくとも35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、または少なくとも90%のオンターゲット率をもたらす。ターゲット核酸との接触中にポリヌクレオチドプローブの濃度を増加させると、オンターゲット率が増加する。いくつかの例では、プローブの濃度が、少なくとも1.5倍、2.0倍、2.5倍、3倍、3.5倍、4倍、5倍、または5倍以上増加される。いくつかの実施形態では、プローブ濃度が増加すると、オンターゲット結合が少なくとも20%増加するか、または10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、または少なくとも500%増加する。いくつかの例では、プローブの濃度が3倍増加すると、オンターゲット率が20%増加する。
カバレッジ均一性は、場合によっては、標的配列同一性の関数としてのリード深度として計算される。より高いカバレッジ均一性により、所望のリード深度を得るために必要とされるシーケンシングリードの数がより少なくなる。例えば、標的配列の特性は、リード深度、例えば、高または低GCまたはAT含有量、反復配列、後方の(trailing)アデニン、二次構造、標的配列結合に対する親和性(増幅、濃縮、または検出のための)、安定性、融解温度、生物活性、より大きな断片へと集合する能力、修飾されたヌクレオチドまたはヌクレオチドアナログを含む配列、またはポリヌクレオチドの他の任意の特性に影響を与える可能性がある。制御された化学量論ポリヌクレオチドプローブライブラリを用いて標的配列を濃縮すると、シーケンシング後により高いカバレッジ均一性が得られる。いくつかの例では、配列の95%は、平均ライブラリリード深度の約1倍以内、または平均ライブラリリード深度の約0.05、0.1、0.2、0.5、0.7、1、1.2、1.5、1.7、または約2倍以内であるリード深度を有する。いくつかの例では、配列の80%、85%、90%、95%、97%、または99%が、平均の1倍以内であるリード深度を有する。
ポリヌクレオチドプローブライブラリを用いた標的核酸の濃縮
本明細書に記載されるプローブライブラリは、様々な下流の適用のために、試料ポリヌクレオチドの集団中に存在する標的ポリヌクレオチドを濃縮するために使用され得る。あるいくつかの例では、試料が1つ以上のソースから得られ、試料ポリヌクレオチドの集団が単離される。試料は、唾液、血液、組織、皮膚、または完全に合成されたソースなどの生物学的ソースから(非限定的な例として)得られる。試料から得られた複数のポリヌクレオチドは、断片化され、末端修復され、およびアデニル化されて、二本鎖試料核酸断片を形成する。いくつかの例では、末端修復は、適切な緩衝液中でのT4 DNAポリメラーゼ、クレノウ酵素、およびT4ポリヌクレオチドキナーゼなどの1つ以上の酵素による処理によって達成される。アダプターへのライゲーションを容易にするためのヌクレオチドオーバーハングが、いくつかの例では、3’~5’エキソマイナスクレノウ断片(exo minus klenow fragment)およびdATPとともに加えられる。
アダプター(ユニバーサルアダプターなど)は、試料ポリヌクレオチド断片の両端に、T4リガーゼなどのリガーゼを用いてライゲートして、アダプタータグ付きポリヌクレオチド鎖のライブラリを生成することができ、アダプタータグ付きポリヌクレオチドライブラリは、ユニバーサルプライマーなどのプライマーを用いて増幅される。いくつかの例では、アダプターは、1つ以上のプライマー結合部位、1つ以上の移植領域、および1つ以上のインデックス(または、バーコード)領域を含むY字型アダプターである。いくつかの例では、1つ以上のインデックス領域は、アダプターの各鎖に存在する。いくつかの例では、移植領域は、フローセル表面に相補的であり、試料ライブラリの次世代シーケンシングを容易にする。いくつかの例では、Y字型アダプターは、部分的に相補的な配列を含む。いくつかの例では、Y字型アダプターは、二本鎖アダプタータグ付きポリヌクレオチド鎖のオーバーハングアデニンにハイブリダイズする単一のチミジンオーバーハングを含む。Y字型アダプターは、切断に抵抗性のある修飾核酸を含み得る。例えば、ホスホロチオエートバックボーンは、オーバーハングチミジンをアダプターの3’末端に取り付けるために使用される。ユニバーサルプライマーが使用される場合、バーコード化プライマーをアダプターに加えるために、ライブラリの増幅が実施される。いくつかの例では、濃縮ワークフローが図7に示される。二本鎖のアダプタータグ付きポリヌクレオチド鎖(701)のライブラリ(700)がハイブリッド対(704)と接触して、ポリヌクレオチドプローブ(702)が形成される。そのような対は、ハイブリダイズされていない断片から分離され(705)、プローブ(706)から単離され、濃縮されたライブラリ(707)が生成される。
次に、二本鎖試料核酸断片のライブラリを、アダプターブロッカー(adapter blockers)の存在下で変性させる。アダプターブロッカーは、アダプタータグ付きポリヌクレオチド鎖上に(標的配列の代わりに)存在するアダプター配列へのプローブのオフターゲットハイブリダイゼーションを最小限に抑え、および/またはアダプターの分子間ハイブリダイゼーション(すなわち、「デイジーチェーニング(daisy chaining)」)を防ぐ。変性は、いくつかの例では、96℃で、または約85℃、約87℃、約90℃、約92℃、約95℃、約97℃、約98℃、または約99℃で実施される。ポリヌクレオチド標的化ライブラリ(プローブライブラリ)は、いくつかの例では、96℃で、または約85℃、約87℃、約90℃、約92℃、約95℃、約97℃、約98℃、または約99℃で、ハイブリダイゼーション溶液中で変性される。変性されたアダプタータグ付きポリヌクレオチドライブラリおよびハイブリダイゼーション溶液は、プローブがそれらの相補的な標的配列とハイブリダイズすることを可能にするために、適切な時間および適切な温度でインキュベートされる。いくつかの例では、適切なハイブリダイゼーション温度は、約45~80℃、または少なくとも45℃、少なくとも50℃、少なくとも55℃、少なくとも60℃、少なくとも65℃、少なくとも70℃、少なくとも75℃、少なくとも80℃、少なくとも8℃5、または少なくとも90℃である。いくつかの例では、ハイブリダイゼーション温度は70℃である。いくつかの例では、好適なハイブリダイゼーション時間は、16時間、または少なくとも4時間、少なくとも6時間、少なくとも8時間、少なくとも10時間、少なくとも12時間、少なくとも14時間、少なくとも16時間、少なくとも18時間、少なくとも20時間、少なくとも22時間、または22時間以上、または約12~20時間である。その後、結合緩衝液を、ハイブリダイズされたアダプタータグ付きポリヌクレオチドプローブに加え、キャプチャー部分を含む固体支持体を使用して、ハイブリダイズされたアダプタータグ付きポリヌクレオチドプローブを選択的に結合する。固体支持体を緩衝液で洗浄して未結合のポリヌクレオチドを除去した後、溶出緩衝液を添加して、濃縮されたタグ付きポリヌクレオチド断片を固体支持体から放出する。いくつかの例では、固体支持体を、2回洗浄するか、または1回、2回、3回、4回、5回、あるいは6回洗浄する。アダプタータグ付きポリヌクレオチド断片の濃縮されたライブラリを増幅し、その濃縮されたライブラリを配列決定する。
複数の核酸(すなわち、ゲノム配列)を試料から得て、断片化し、随意に末端修復し、アデニル化してもよい。アダプターをポリヌクレオチド断片の両端にライゲートしてアダプタータグ付きポリヌクレオチド鎖のライブラリを生成し、そのアダプタータグ付きポリヌクレオチドライブラリを増幅する。その後、アダプタータグ付きポリヌクレオチドライブラリを、アダプターブロッカーの存在下で、高温、好ましくは96℃で変性させる。ポリヌクレオチド標的化ライブラリ(プローブライブラリ)を、高温、好ましくは約90~99℃でハイブリダイゼーション溶液中で変性させ、約45~80℃で約10~24時間、ハイブリダイゼーション溶液中で変性させたタグ付きポリヌクレオチドライブラリと組み合わせる。その後、結合緩衝液を、ハイブリダイズされたタグ付きポリヌクレオチドプローブに添加し、キャプチャー部分を含む固体支持体を用いて、ハイブリダイズされたアダプタータグ付きポリヌクレオチドプローブを選択的に結合する。固体支持体を緩衝液で1回以上、好ましくは約2回および約5回洗浄して未結合のポリヌクレオチドを除去した後、溶出緩衝液を添加して、濃縮されたアダプタータグ付きポリヌクレオチド断片を固体支持体から放出する。アダプタータグ付きポリヌクレオチド断片の濃縮されたライブラリを増幅し、その後、ライブラリを配列決定する。インキュベーション時間、温度、反応量/濃度、洗浄回数、または本明細書に一致する他の変数などの代替的な変数も、本方法において採用される。
例のいずれかにおいて、オリゴヌクレオチドの検出または定量化分析は、シーケンシングによって達成され得る。サブユニットまたは合成されたオリゴヌクレオチド全体は、当該技術分野で既知のいずれかの適切な方法、例えば、本明細書に記載されるシーケンシング方法を含むIlluminaの合成によるシーケンシング(sequencing by synthesis)、PacBioナノポアシーケンシング、またはBGI/MGIナノボールシーケンシングによる、すべてのオリゴヌクレオチドの完全なシーケンシングによって検出することができる。
シーケンシングは、当該技術分野で周知の古典的なサンガーシーケンシング方法を介して達成され得る。シーケンシングはまた、ハイスループットシステムを使用して達成されてもよく、そのシステムのいくつかは、成長する鎖に組み込まれた直後または組み込まれる際に、配列決定されたヌクレオチドの検出、すなわち、読み取られた時間または実質的にリアルタイムでの配列の検出を可能にする。場合によっては、ハイスループットシーケンシングは、1時間につき少なくとも1,000、少なくとも5,000、少なくとも10,000、少なくとも20,000、少なくとも30,000、少なくとも40,000、少なくとも50,000、少なくとも100,000、または少なくとも500,000の配列リードを生成し;各リードは、1リード当たり、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも120、または少なくとも150塩基対である。
いくつかの例では、ハイスループットシーケンシングは、HiSeq 2500、HiSeq 1500、HiSeq 2000、HiSeq 1000、iSeq 100、Mini Seq、MiSeq、NextSeq 550、NextSeq 2000、NextSeq 550、またはNovaSeq 6000を使用するものなど、IlluminaのGenome Analyzer IIX、MiSeq personal sequencer、またはHiSeq systemsによって利用可能な技術の使用を含む。これらの機械は、合成化学による可逆的なターミネーターベースのシーケンシングを使用する。これらの機械は、13~44時間で、6000Gbまたはそれより多くのリードを生成することができる。3日、2日、1日、またはそれより少ない時間内でのランのために、より小さなシステムが利用されてもよい。シーケンシングの結果を得るのにかかる時間を最小限にするために、短い合成サイクルが使用されてもよい。
いくつかの例では、ハイスループットシーケンシングは、ABI Solid Systemにより利用可能な技術の使用を含む。この遺伝子解析プラットフォームは、ビーズに連結した、クローン的に増幅されたDNA断片の超並列シーケンシングを可能にする。シーケンシングの方法論は、色素で標識されたオリゴヌクレオチドとの連続的なライゲーションに基づく。
次世代シーケンシングは、(例えば、Life Technologies(Ion Torrent)の技術を使用する)イオン半導体シーケンシングを含み得る。イオン半導体シーケンシングは、ヌクレオチドがDNAの鎖へ組み込まれる時にイオンが放出され得るという事実を利用することができる。イオン半導体シーケンシング定を行なうために、微細加工されたウェルの高密度アレイを形成することができる。各ウェルは、単一のDNA鋳型を保持することができる。ウェルの下にはイオン感受性の層がある場合があり、イオン感受性の層の下にはイオンセンサーがある場合がある。ヌクレオチドがDNAに加えられると、H+が放出され、pHの変化として測定され得る。H+イオンは電圧に変換され、半導体センサーによって記録され得る。アレイチップは、1つのヌクレオチドで連続して満たされる(flooded)場合がある。走査、光、またはカメラは必要としない。場合によっては、核酸を配列決定するためにIONPROTON(商標)Sequencerが使用される。場合によっては、IONPGM(商標)Sequencerが使用される。Ion Torrent Personal Genome Machine(PGM)は、2時間で1000万の読み取りを行うことができる。
[0545]
いくつかの実施形態では、ハイスループットシーケンシングは、合成による単一分子シーケンシング(Single Molecule Sequencing by Synthesis)(SMSS)の方法など、Helicos BioSciences Corporation(Cambridge,Mass.)によって利用可能な技術の使用を含む。SMSSは、最大24時間でヒトゲノム全体のシーケンシングを可能にするのでユニークである。最終的に、SMSSは、MW技術のように、ハイブリダイゼーション前に前増幅工程を必要としないため、強力である。実際、SMSSは増幅を必要としない。SMSSは、米国特許出願公開第2006002471 I号;第20060024678号;第20060012793号;第20060012784号;および第20050100932号に部分的に記載されている。
[0546]
いくつかの実施形態では、ハイスループットシーケンシングは、器具内のCCDカメラによって記録される、シーケンシング反応によって生成された化学発光シグナルを送信するファイバオプティックプレートを含む、Pico Titer Plate装置など、454 Lifesciences,Inc.(Branford,Conn.)から利用可能な技術の使用を包含している。このファイバーオプティクスを使用すると、4.5時間で最低限2000万の塩基対の検出が可能になる。
[0547]
ビーズ増幅とそれに続くファイバーオプティクス検出を使用するための方法は、Marguiles,M.,et al.“Genome sequencing in microfabricated high-density picolitre reactors”,Nature,doi:10.1038/nature03959;ならびに、米国特許出願公開第20020012930号;第20030058629号;第20030100102号;第20030148344号;第20040248161号;第20050079510号;第20050124022号;および、第20060078909号に記載されている。
いくつかの例では、ハイスループットシーケンシングは、Clonal Single Molecule Array(Solexa,Inc.)、または可逆的ターミネーター化学を利用する、合成によるシーケンシング(SBS)を使用して行なわれる。これらの技術は、米国特許第6,969,488号;第6,897,023号;第6,833,246号;第6,787,308号;および、米国特許出願公開第20040106130号;第20030064398号;第20030022207号;および、Constans,A.,The Scientist 2003,17(13):36に記載されている。オリゴヌクレオチドのハイスループットシーケンシングは、Pacific Biosciences、Complete Genomics、Genia Technologies、Halcyon Molecular、Oxford Nanopore Technologiesなどによって市販されているものなど、当該技術分野で既知の任意の適切な配列方法を使用して、達成され得る。他のハイスループットシーケンシングシステムには、Venter,J.,et al.Science 16 February 2001;Adams,M.et al,Science 24 March 2000;および、M.J,Levene,et al.Science 299:682-686,January 2003;ならびに、米国特許出願公開第20030044781号および第2006/0078937号に開示されるものが含まれる。全体として、このようなシステムは、オリゴヌクレオチドの分子上で測定された重合反応を介して、塩基の時間的付加によって複数の塩基を有する標的オリゴヌクレオチド分子を配列決定すること、すなわち、配列決定される鋳型オリゴヌクレオチド分子上の核酸重合酵素の活性をリアルタイムで追跡することを含む。その後、塩基付加の配列における各工程での核酸重合酵素の触媒活性によって、標的オリゴヌクレオチドの成長している相補鎖にどの塩基が組み入れられているかを同定することにより、配列が推定され得る。標的オリゴヌクレオチド分子複合体上のポリメラーゼが、標的オリゴヌクレオチド分子に沿って移動し、かつ活性部位でオリゴヌクレオチドプライマーを伸長するのに適切な位置で提供される。複数の標識型のヌクレオチドアナログが活性部位のすぐ近くに提供され、各識別可能型のヌクレオチドアナログが、標的オリゴヌクレオチド配列中の異なるヌクレオチドに対して相補的である。成長しているオリゴヌクレオチド鎖は、ポリメラーゼを使用して、活性部位でオリゴヌクレオチド鎖にヌクレオチドアナログを付加することによって伸長し、ここで、付加されたヌクレオチドアナログは、活性部位の標的オリゴヌクレオチドのヌクレオチドに相補的である。重合工程の結果としてオリゴヌクレオチドプライマーに付加されたヌクレオチドアナログが、同定される。標識されたヌクレオチドアナログを提供する工程、成長しているオリゴヌクレオチド鎖を重合する工程、および付加されたヌクレオチドアナログを同定する工程が繰り返され、その結果、オリゴヌクレオチド鎖がさらに伸長し、標的オリゴヌクレオチドの配列が測定される。
次世代シーケンシング技術は、Pacific Biosciencesによるリアルタイム(SMRT(商標))技術を含む場合がある。SMRTにおいて、4つのDNA塩基の各々が、4つの異なる蛍光色素の1つに結合される場合がある。これらの色素はホスホ結合され得る。単一のDNAポリメラーゼは、ゼロモード導波路(ZMW)の底部にある鋳型の一本鎖DNAの単一分子で固定され得る。ZMWは、(マイクロ秒で)ZMW内およびZMW外で急速に拡散することができる蛍光ヌクレオチドのバックグラウンドに対する、DNAポリメラーゼによる単一のヌクレオチドの組み込みの観察を可能にする、閉じ込め構造であってもよい。成長している鎖にヌクレオチドを組み込むには、数ミリ秒かかる場合がある。この間に、蛍光標識を励起して蛍光シグナルを生成し、蛍光タグを切断することができる。ZMWは下から照らすことができる。励起ビームからの減衰光は、各ZMWの下部20~30nmを透過することができる。20ゼプトリットル(10”リットル)の検出限界を持つ顕微鏡が作成され得る。小さな検出量により、バックグラウンドノイズの減少を1000倍改善することができる。色素の対応する蛍光を検出すると、どの塩基が組み込まれたのかを示すことができる。このプロセスは繰り返され得る。
場合によっては、次世代シーケンシングは、ナノポアシーケンシングである(例えば、Soni G V and Meller A.(2007)Clin Chem 53:1996-2001を参照)。ナノポアは、直径約1ナノメートルほどの小さな穴であり得る。導電性流体にナノポアを浸漬すること、およびそれにわたって電位を印加することで、ナノポアを介したイオンの伝導により、僅かな電流を結果としてもたらすことができる。流れる電流の量はナノポアの大きさに敏感であり得る。DNA分子がナノポアを通ると、DNA分子上のヌクレオチドはそれぞれ、異なる程度にナノポアを塞ぐことができる。ゆえに、DNA分子がナノポアを通る際のナノポアを通る電流の変化は、DNA配列の読み取りを表すことができる。ナノポアシーケンシング技術は、Oxford Nanopore Technologiesのもの、例えば、GridION systemであってもよい。単一のナノポアは、マイクロウェルの上部にわたる高分子膜に挿入され得る。マイクロウェルはそれぞれ、個別に感知するための電極を有し得る。マイクロウェルは、1つのチップ当たり100,000以上(例えば、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、または1,000,000より多い)のマイクロウェルを備えた、アレイチップへと組み立てられ得る。機器(または、ノード)がチップを解析するために使用されてもよい。データはリアルタイムで解析され得る。1つ以上の機器が一度に操作されてもよい。ナノポアは、タンパク質ナノポア、例えば、タンパク質アルファ溶血素、七量体タンパク質ポアであってもよい。ナノポアは、ソリッドステートナノポアで出来ており、例えば、合成膜(例えば、SiNxまたはSiO2)内に形成されるナノメートルサイズの穴であり得る。ナノポアは、ハイブリッドポア(例えば、ソリッドステート膜へのタンパク質ポアの統合)であってもよい。ナノポアは、統合されたセンサー(例えば、トンネリング電極検出器、容量性検出器、またはグラフェンベースのナノギャップ、またはエッジ状態検出器(edge state detectors)(例えば、Garaj et al.(2010)Nature vol.67,doi:10.1038/nature09379を参照)を備えたナノポアであってもよい。ナノポアは、特定の型の分子(例えば、DNA、RNA、またはタンパク質)を解析するために官能化されてもよい。ナノポアシーケンシングは「鎖シーケンシング」を含むことができ、鎖シーケンシングでは、完全なDNAポリマーをタンパク質ナノポアに通過させ、DNAがそのタンパク質ナノポアを移動する際にリアルタイムで配列決定することができる。酵素は二本鎖DNAの鎖を分離し、ナノポアを介して鎖を与えることができる。DNAは一方の末端でヘアピンを有することができ、システムは両方の鎖を読み取ることができる。場合によっては、ナノポアシーケンシングは、「エキソヌクレアーゼシーケンシング」であり、エキソヌクレアーゼシーケンシングでは、個々のヌクレオチドを前進型エキソヌクレアーゼによってDNA鎖から切断することができ、ヌクレオチドはタンパク質ナノポアを通過することができる。ヌクレオチドは、ポア内の分子(例えば、シクロデキストラン)に一過的に結合することができる。電流の特徴的な断絶を利用して、塩基を同定することができる。
GENIAのナノポアシーケンシング技術が使用されてもよい。操作したタンパク質ポアを、脂質二重層の膜に包埋することができる。「能動的制御」技術を使用して、効果的なナノポア-膜アセンブリを可能にし、チャネルを介したDNAの運動を制御することができる。場合によっては、ナノポアシーケンシング技術は、NABsysからのものである。ゲノムDNAは、平均長約100kbの鎖に断片化され得る。100kbの断片を一本鎖にし、その後、6merのプローブでハイブリダイズさせることができる。プローブを有するゲノム断片は、ナノポアを通り抜けることができ、電流対時間のトレースを作り出すことができる。電流トレースにより、各ゲノム断片上のプローブ位置を提供することができる。ゲノム断片を並べて、ゲノムに対するプローブマップを作成することができる。このプロセスは、プローブのライブラリに対して並列して行うことができる。各プローブに対するゲノム長のプローブマップを生成することができる。エラーは、「moving window Sequencing By Hybridization(mwSBH)」と名付けられたプロセスを用いて修正することができる。場合によっては、ナノポアシーケンシング技術は、IBM/Rocheからのものである。電子ビームを使用して、マイクロチップにナノポアサイズの開口部を作ることができる。電界を使用して、DNAを、ナノポアを介して引き寄せるか、またはナノポアに通すことができる。ナノポアにおけるDNAトランジスタ装置は、金属と誘電体が交互になったナノメートルサイズの層を含むことができる。DNA骨格における別個の電荷を、電界によってDNAナノポアの内部に閉じ込めることができる。ゲート電圧をオフおよびオンにすると、DNA配列を読み取ることができる。
次世代シーケンシングは、(例えば、Complete Genomics(例えば、Drmanac et al.(2010)Science 327:78-81を参照)によって実施されるような)DNAナノボールシーケンシングを含み得る。DNAを単離し、断片化し、サイズ選択することができる。例えば、DNAは、約500bpの平均長に(例えば、超音波処理によって)断片化することができる。アダプター(Adl)を、断片の末端に結合することができる。シーケンシング反応のためのアンカーにハイブリダイズするために、アダプターを使用することができる。各末端に結合したアダプターを持つDNAをPCR増幅することができる。相補的一本鎖末端が互いに結合して環状DNAを形成するように、アダプター配列を改変することができる。DNAをメチル化して、その後の工程で使用されるIIS型制限酵素による切断からそのDNAを保護することができる。アダプター(例えば、右アダプター)は制限認識部位を有することができ、制限認識部位は非メチル化されたままであってもよい。アダプター中のメチル化されていない制限認識部位は、制限酵素(例えば、Acul)によって認識されることができ、DNAは、Aculによって右アダプターの右側13bpで切断されて、線状二本鎖DNAを形成することができる。第2ラウンドの右アダプターと左アダプター(Ad2)を、線状DNAのいずれかの末端にライゲートすることができ、両方のアダプターが結合しているDNAはすべて、(例えば、PCRによって)PCR増幅することができる。Ad2配列は、それらが互いに結合して環状DNAを形成できるように改変され得る。DNAはメチル化することができるが、制限酵素認識部位は、左Ad1アダプター上でメチル化されないままであってもよい。制限酵素(例えば、Acul)を適用することができ、DNAは、Ad1の左側13bpで切断され、線状DNA断片を形成することができる。第3ラウンドの右アダプターと左アダプター(Ad3)を、線状DNAの右側面および左側面にライゲートすることができ、結果として生じる断片をPCR増幅することができる。アダプターは、互いに結合して環状DNAを形成することができるように改変され得る。III型制限酵素(例えば、EcoP15)を加えてもよく;EcoP15は、Ad3の左側26bpと、Ad2の右側26bpでDNAを切断することができる。この切断により、DNAの大きなセグメントが取り除かれ、DNAを再び線状化することができる。第4ラウンドの右アダプターと左のアダプター(Ad4)をDNAにライゲートすることができ、DNAを(例えば、PCRによって)増幅して、それらが互いに結合して完成した環状DNA鋳型を形成するように改変することができる。
(例えば、Phi29 DNAポリメラーゼを使用する)ローリングサークル複製を使用して、DNAの小さな断片を増幅することができる。4つのアダプター配列は、ハイブリダイズできるパリンドローム配列を含有することができ、一本鎖は、それ自体の上へと折りたたまれて、平均で直径およそ200~300ナノメートルであり得るDNAナノボール(DNB(商標))を形成することができる。DNAナノボールは、マイクロアレイ(シーケンシングフローセル)に付着させることができる(例えば、吸着によって)。フローセルは、二酸化ケイ素、チタン、およびヘキサメチルジシラザン(HMDS)、ならびにフォトレジスト材料でコーティングされたシリコンウェーハであってもよい。シーケンシングは、DNAに蛍光プローブをライゲートすることにより連鎖しないシーケンシングによって、実施することができる。問い合わせられた(interrogated)位置の蛍光の色は、高解像度カメラによって可視化することができる。アダプター配列間のヌクレオチド配列の同一性を決定することができる。
ポリヌクレオチドの集団は、アダプターライゲーション前に濃縮されてもよい。一実施例では、ポリヌクレオチドの集団を試料から得て、断片化し、随意に末端修復し、高温、好ましくは90~99℃で変性させる。ポリヌクレオチド標的化ライブラリ(プローブライブラリ)を、高温、好ましくは約90~99℃でハイブリダイゼーション溶液中で変性させ、約45~80℃で約10~24時間、ハイブリダイゼーション溶液中で変性させたタグ付きポリヌクレオチドライブラリと組み合わせる。その後、結合緩衝液を、ハイブリダイズされたタグ付きポリヌクレオチドプローブに添加し、キャプチャー部分を含む固体支持体を用いて、ハイブリダイズされたアダプタータグ付きポリヌクレオチドプローブを選択的に結合させる。固体支持体を緩衝液で1回以上、好ましくは約2回および約5回洗浄して未結合のポリヌクレオチドを除去した後、溶出緩衝液を添加して、濃縮されたアダプタータグ付きポリヌクレオチド断片を固体支持体から放出する。その後、濃縮されたポリヌクレオチド断片をポリアデニル化し、アダプターをポリヌクレオチド断片の両端にライゲートしてアダプタータグ付きポリヌクレオチド鎖のライブラリを生成し、アダプタータグ付きポリヌクレオチドライブラリを増幅する。次いで、アダプタータグ付きポリヌクレオチドライブラリを配列決定する。
望ましくない断片にハイブリダイズすることによって、複数のポリヌクレオチドから望ましくない配列をフィルタリングするために、ポリヌクレオチド標的化ライブラリを使用してもよい。例えば、複数のポリヌクレオチドを試料から得て、断片化し、随意に末端修復し、アデニル化する。アダプターをポリヌクレオチド断片の両端にライゲートしてアダプタータグ付きポリヌクレオチド鎖のライブラリを生成し、アダプタータグ付きポリヌクレオチドライブラリを増幅する。代替的に、試料ポリヌクレオチドの濃縮後に、アデニル化とアダプターのライゲーション工程がその代りに実施される。その後、アダプタータグ付きポリヌクレオチドライブラリを、アダプターブロッカーの存在下で、高温、好ましくは90~99℃で変性させる。望ましくない非標的配列を除去するように設計されたポリヌクレオチドフィルタリングライブラリ(プローブライブラリ)を、高温、好ましくは約90~99℃でハイブリダイゼーション溶液中で変性させ、約45~80℃で約10~24時間、ハイブリダイゼーション溶液中で変性させたタグ付きポリヌクレオチドライブラリと組み合わせる。その後、結合緩衝液を、ハイブリダイズされたタグ付きポリヌクレオチドプローブに添加し、キャプチャー部分を含む固体支持体を用いて、ハイブリダイズされたアダプタータグ付きポリヌクレオチドプローブを選択的に結合させる。固体支持体を緩衝液で1回以上、好ましくは約1回および約5回洗浄して、未結合アダプタータグ付きポリヌクレオチド断片を溶出させる。未結合アダプタータグ付きポリヌクレオチド断片の濃縮されたライブラリを増幅し、その後、増幅されたライブラリを配列決定する。
高並列デノボ核酸合成
革新的な合成プラットフォームを作成するための、シリコン上のナノウェル内でのポリヌクレオチド合成から遺伝子アセンブリまでのエンド・ツー・エンドプロセスの小型化、並列化、および垂直統合を利用するプラットフォームアプローチが、本明細書で提供される。本明細書に記載される装置には96ウェルのプレートと同じフットプリントが設けられ、シリコン合成プラットフォームは、従来の合成方法と比較してスループットを100~1,000倍増加させることができ、1回の高並列化されたランで最大でおよそ1,000,000のポリヌクレオチドを産生する。いくつかの例では、本明細書に記載される単一のシリコンプレートは、約6,100の非同一ポリヌクレオチドの合成を提供する。いくつかの例では、非同一ポリヌクレオチドの各々は、クラスター内に位置する。クラスターは、50~500の非同一ポリヌクレオチドを含む場合がある。
本明細書に記載される方法は、少なくとも1つのあらかじめ定められた参照核酸配列のあらかじめ定められた変異体をそれぞれコードするポリヌクレオチドのライブラリの合成を提供する。場合によっては、あらかじめ決められた参照配列はタンパク質をコードする核酸配列であり、変異体ライブラリは、合成された核酸によってコードされたその後のタンパク質中の単一の残基の複数の異なる変異体が標準的な翻訳プロセスによって生成されるように、少なくとも1つのコドンの変異をコードする配列を含む。核酸配列中の合成された特異的な変化は、ヌクレオチド変化を、重複または平滑端のポリヌクレオチドプライマーに組み入れることによって導入することができる。代替的に、ポリヌクレオチドの集団は、長い核酸(例えば、遺伝子)およびその変異体をまとめてコードすることもある。この配置では、ポリヌクレオチドの集団をハイブリダイズして標準的な分子生物学技術に供することで、長い核酸(例えば、遺伝子)およびその変異体を形成することができる。長い核酸(例えば、遺伝子)およびその変異体が細胞中で発現される場合、異なるタンパク質ライブラリが生成される。同様に、RNA配列(例えば、miRNA、shRNA、およびmRNA)またはDNA配列(例えば、エンハンサー、プロモーター、UTR、およびターミネーター領域)をコードする変異体ライブラリの合成のための方法が本明細書で提供される。さらに、本明細書に記載される方法を用いて合成されたライブラリから選択された変異体の下流の適用も本明細書で提供される。下流の適用としては、向上した生物学的に関連する機能、例えば、生化学的な親和性、酵素活性、細胞活性の変化を持つとともに、病状の処置または予防を目的とする変異体核酸あるいはタンパク質配列の同定が挙げられる。
基板
複数のクラスターを含む基板が本明細書で提供され、ここで、クラスターはそれぞれ、ポリヌクレオチドの結合および合成を支持する複数の座を含む。本明細書で使用される場合、「座」という用語は、表面から伸長する単一のあらかじめ定められた配列をコードするポリヌクレオチドを支持する構造上の別個の領域を指す。いくつかの例では、座は、二次元表面、例えば、実質的に平らな表面上にある。いくつかの例では、座は、表面上の別個の隆起部位または沈降部位、例えば、ウェル、マイクロウェル、チャネル、またはポストを指す。いくつかの例では、座の表面は、ポリヌクレオチド合成のための少なくとも1つのヌクレオチド、または、好ましくは、ポリヌクレオチドの集団の合成のための同一のヌクレオチドの集団に結合する、活発に官能化される物質を含む。いくつかの例では、ポリヌクレオチドとは、同じ核酸配列をコードするポリヌクレオチドの集団を指す。いくつかの例では、装置の表面は、基板の1つまたは複数の表面を包含する。
共通の支持体上のアドレス可能な位置で異なるあらかじめ決められた配列を有する複数のポリヌクレオチドの合成を支持する表面を含み得る構造が、本明細書で提供される。いくつかの例では、装置は、2,000;5,000;10,000;20,000;30,000;50,000;75,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000を超える、またはそれ以上の非同一ポリヌクレオチドの合成のための支持を提供する。いくつかの例では、装置は、別の配列をコードする、2,000;5,000;10,000;20,000;30,000;50,000;75,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000を超える、またはそれ以上のポリヌクレオチドの合成のための支持体を提供する。いくつかの例では、ポリヌクレオチドの少なくとも一部は、同一の配列を有しているか、または同一の配列で合成されるように構成される。
約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、または2000塩基長であるポリヌクレオチドを製造し、成長させるための方法および装置が、本明細書で提供される。いくつかの例では、形成されるポリヌクレオチドの長さは、約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、または225塩基長である。ポリヌクレオチドは、少なくとも5、10、20、30、40、50、60、70、80、90、または100塩基長であり得る。ポリヌクレオチドは、10~225塩基長、12~100塩基長、20~150塩基長、20~130塩基長、または30~100塩基長であり得る。
いくつかの例では、ポリヌクレオチドは基板の別個の座で合成され、ここで、各座はポリヌクレオチドの集団の合成を支持する。いくつかの例では、各座は、別の座上で成長したポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の合成を支持する。いくつかの例では、装置の座は複数のクラスター内に位置する。いくつかの例では、装置は、少なくとも10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000、またはそれ以上のクラスターを含む。いくつかの例では、装置は、2,000;5,000;10,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,100,000;1,200,000;1,300,000;1,400,000;1,500,000;1,600,000;1,700,000;1,800,000;1,900,000;2,000,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;または、10,000,000を超える、あるいはそれ以上の別々の座を含む。いくつかの例では、装置は、約10,000の別個の座を含む。単一のクラスター内の座の量は、異なる例では変動する。いくつかの例では、クラスターはそれぞれ、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、500、1000、またはそれ以上の座を含む。いくつかの例では、クラスターはそれぞれ、約50~500の座を含む。いくつかの例では、クラスターはそれぞれ、約100~200の座を含む。いくつかの例では、クラスターはそれぞれ、約100~150の座を含む。いくつかの例では、クラスターはそれぞれ、約109、121、130、または137の座を含む。いくつかの例では、クラスターはそれぞれ、約19、20、61、64、またはそれ以上の座を含む。
装置上で合成された別個のポリヌクレオチドの数は、基板中の利用可能な別個の座の数に依存し得る。いくつかの例では、装置のクラスター内の座の密度は、1mm当たり少なくともまたは約1の座、1mm当たり少なくともまたは約10の座、1mm当たり少なくともまたは約25の座、1mm当たり少なくともまたは約50座、1mm当たり少なくともまたは約65の座、1mm当たり少なくともまたは約75の座、1mm当たり少なくともまたは約100の座、1mm当たり少なくともまたは約130の座、1mm当たり少なくともまたは約150の座、1mm当たり少なくともまたは約175の座、1mm当たり少なくともまたは約200の座、1mm当たり少なくともまたは約300の座、1mm当たり少なくともまたは約400の座、1mm当たり少なくともまたは約500の座、1mm当たり少なくともまたは約1,000の座、またはそれ以上である。いくつかの例では、装置は、1mm当たり約10~約500の座、1mm当たり約25~約400の座、1mm当たり約50~約500の座、1mm当たり約100~約500の座、1mm当たり約150~約500の座、1mm当たり約10~約250の座、1mm当たり約50~約250の座、1mm当たり約10~約200の座、1mm当たり約50~約200の座を含む。いくつかの例では、クラスター内の2つの隣接する座の中心からの距離は、約10μm~約500μm、約10μm~約200μm、または約10μm~約100μmである。いくつかの例では、隣接する座の2つの中心からの距離は、約10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、または100μmより長い。いくつかの例では、2つの隣接する座の中心からの距離は、約200μm、150μm、100μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、または10μm未満である。いくつかの例では、各座の幅は、約0.5μm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、または100μmである。いくつかの例では、各座の幅は、約0.5μm~100μm、約0.5μmか~50μm、約10μm~75μm、または約0.5μm~50μmである。
いくつかの例では、装置内のクラスターの密度は、100mm当たり少なくともまたは約1のクラスター、10mm当たり少なくともまたは約1のクラスター、5mm当たり少なくともまたは約1のクラスター、4mm当たり少なくともまたは約1のクラスター、3mm当たり少なくともまたは約1のクラスター、2mm当たり少なくともまたは約1のクラスター、1mm当たり少なくともまたは約1のクラスター、1mm当たり少なくともまたは約2のクラスター、1mm当たり少なくともまたは約3のクラスター、1mm当たり少なくともまたは約4のクラスター、1mm当たり少なくともまたは約5のクラスター、1mm当たり少なくともまたは約10のクラスター、1mm当たり少なくともまたは約50のクラスター、またはそれ以上である。いくつかの例では、装置は、10mm当たり約1のクラスター~1mm当たり約10のクラスターを含む。いくつかの例では、2つの隣接するクラスターの中心からの距離は、約50μm未満、約100μm未満、約200μm未満、約500μm未満、約1000μm未満、約2000μm未満、または約5000μm未満である。いくつかの例では、2つの隣接するクラスターの中心からの距離は、約50μm~約100μm、約50μm~約200μm、約50μm~約300μm、約50μm~約500μm、および約100μm~約2000μmである。いくつかの例では、2つの隣接するクラスターの中心からの距離は、約0.05mm~約50mm、約0.05mm~約10mm、約0.05mm~約5mm、約0.05mm~約4mm、約0.05mm~約3mm、約0.05mm~約2mm、約0.1mm~10mm、約0.2mm~10mm、約0.3mm~約10mm、約0.4mm~約10mm、約0.5mm~10mm、約0.5mm~約5mm、または約0.5mm~約2mmである。いくつかの例では、各クラスターは、約0.5~2mm、約0.5~1mm、または約1~2mmの一次元に沿った直径または幅を有する。いくつかの例では、各クラスターは、約0.5、約0.6、約0.7、約0.8、約0.9、約1、約1.1、約1.2、約1.3、約1.4、約1.5、約1.6、約1.7、約1.8、約1.9、または約2mmの一次元に沿った直径または幅を有する。いくつかの例では、各クラスターは、約0.5、約0.6、約0.7、約0.8、約0.9、約1、約1.1、約1.15、約1.2、約1.3、約1.4、約1.5、約1.6、約1.7、約1.8、約1.9、または約2mmの一次元に沿った内径または幅を有する。
装置は、ほぼ標準96ウェルプレートのサイズであり、例えば、約100~200mm×約50~150mmである。いくつかの例では、装置の直径は、約1000mm以下、約500mm以下 約450mm以下、約400mm以下、約300mm以下、約250nm以下、約200mm以下、約150mm以下、約100mm以下、または約50mm以下である。いくつかの例では、装置の直径は、約25mm~1000mm、約25mm~約800mm、約25mm~約600mm、約25mm~約500mm、約25mm~約400mm、約25mm~約300mm、または約25mm~約200である。装置のサイズの非限定的な例としては、約300mm、約200mm、約150mm、約130mm、約100mm、約76mm、約51mm、約25mmが挙げられる。いくつかの例では、装置は、少なくとも約100mm;200mm;500mm;1,000mm;2,000mm;5,000mm;10,000mm;12,000mm;15,000mm;20,000mm;30,000mm;40,000mm;50,000mm、またはそれ以上の平面の表面積を有する。いくつかの例では、装置の厚さは、約50mm~約2000mm、約50mm~約1000mm、約100mm~約1000mm、約200mm~約1000mm、または約250mm~約1000mmである。装置の厚さの非限定的な例としては、275mm、375mm、525mm、625mm、675mm、725mm、775mm、および925mmが挙げられる。いくつかの例では、装置の厚さは、直径によって変わり、基板の組成に左右される。例えば、シリコン以外の材料を含む装置は、同じ直径のシリコン装置とは異なる厚さを有している。装置の厚さは、使用される材料の機械強度によって決定され、取り扱い中に割れることなく、それ自体の重量を支えるのに十分な厚さでなければならない。いくつかの例では、構造は、本明細書に記載される複数の装置を含む。
表面材料
表面を含む装置が本明細書で提供され、ここで、表面は、あらかじめ決められた位置での、および結果として生じる低いエラー率、低いドロップアウト率、高い収率、ならびに高いオリゴ表現でのポリヌクレオチド合成を支持するために改質される。いくつかの例では、本明細書で提供されるポリヌクレオチド合成のための装置の表面は、デノボポリヌクレオチド合成反応を支持するために、修飾可能な様々な物質から作られる。場合によっては、装置は十分に導電性であり、例えば、装置のすべてまたは一部にわたって、均一な電場を形成することができる。本明細書に記載される装置は可撓性材料を含むこともある。典型的な可撓性材料としては、限定されないが、修飾ナイロン、非修飾ナイロン、ニトロセルロース、およびポリプロピレンなどが挙げられる。本明細書に記載される装置は剛性材料を含むこともある。典型的な剛性材料としては、限定されないが、ガラス、石英ガラス(fuse silica)、シリコン、二酸化ケイ素、窒化ケイ素、プラスチック(例えば、ポリテトラフルオロエチレン、ポリプロピレン、ポリスチレン、ポリカーボネート、およびそれらの混合物)、ならびに金属(例えば、金、白金)が挙げられる。本明細書で開示される装置は、シリコン、ポリスチレン、アガロース、デキストラン、セルロース系ポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)、ガラス、またはそれらの任意の組み合わせを含む材料から作られてもよい。場合によっては、本明細書で開示される装置は、本明細書に列挙される材料または当該技術分野において知られている他の適切な材料の組み合わせで製造される。
本明細書に記載される典型的な材料の引っ張り強度のリストは、以下の通りである:ナイロン(70MPa)、ニトロセルロース(1.5MPa)、ポリプロピレン(40MPa)、シリコン(268MPa)、ポリスチレン(40MPa)、アガロース(1~10MPa)、ポリアクリルアミド(1~10MPa)、ポリジメチルシロキサン(PDMS)(3.9~10.8MPa)。本明細書に記載される固体支持体は、1~300、1~40、1~10、1~5、または3~11MPaの引っ張り強度を有する場合がある。本明細書に記載される固体支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、270、あるいはそれ以上のMPaの引っ張り強度を有する場合がある。いくつかの例では、本明細書に記載される装置は、テープまたはフレキシブルシートなどの連続的なループまたはリールに格納され得る可撓性材料の形態を取るポリヌクレオチド合成のための固体支持体を含む。
ヤング率は、荷重下での弾性(復元可能)変形に対する材料の耐性を測定する。本明細書に記載される典型的な材料の剛性のヤング率のリストは以下の通りである:ナイロン(3GPa)、ニトロセルロース(1.5GPa)、ポリプロピレン(2GPa)、シリコン(150GPa)、ポリスチレン(3GPa)、アガロース(1~10GPa)、ポリアクリルアミド(1~10GPa)、ポリジメチルシロキサン(PDMS)(1~10GPa)。本明細書に記載される固体支持体は、1~500、1~40、1~10、1~5、または3~11GPaのヤング率を有する場合がある。本明細書に記載される固体支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、400、500GPa、またはそれ以上のヤング率を有する場合がある。軟性と剛性の関係は互いに逆であることから、可撓性材料は低ヤング率を有し、荷重下でその形状を大きく変化させる。
場合によっては、本明細書で開示される装置は二酸化ケイ素の基部と酸化ケイ素の表層を含む。代替的に、装置は酸化ケイ素の基部を有することもある。本明細書で提供されるデバイスの表面は、テクスチャード加工されることもあり、ポリヌクレオチド合成のための全体的な表面積の増加をもたらす。本明細書で開示される装置は、少なくとも5%、10%、25%、50%、80%、90%、95%、または99%のシリコンを含んでいてもよい。本明細書で開示される装置はシリコン・オン・インシュレーター(SOI)ウェーハから作られてもよい。
表面のアーキテクチャ
隆起した特徴および/または沈降した特徴を含む装置が本明細書で提供される。そのような特徴を有する1つの利点は、ポリヌクレオチド合成を支持する表面積の増加である。いくつかの例では、隆起した特徴および/または陥没した特徴を有する装置は、三次元基板と呼ばれる。いくつかの例では、三次元装置は1つ以上のチャネルを含む。いくつかの例では、1つ以上の座はチャネルを含む。いくつかの例では、チャネルは、ポリヌクレオチドシンセサイザーなどの堆積装置による試薬の堆積に利用可能である。いくつかの例では、試薬および/または流体は、1つ以上のチャネルと流体連通するより大きなウェルに集まる。例えば、装置は、クラスターを有する複数の座に対応する複数のチャネルを含み、複数のチャネルは、クラスターの1つのウェルと流体連通している。いくつかの方法では、ポリヌクレオチドのライブラリは、クラスターの複数の座において合成される。
いくつかの例では、構造は、表面上でのポリヌクレオチド合成のための制御された流れおよび物質移動経路を可能にするように構成される。いくつかの例では、装置の構成により、ポリヌクレオチド合成中の物質移動経路、化学暴露時間、および/または洗浄効果の制御および均一な分布が可能になる。いくつかの例では、装置の構成は、成長しているポリヌクレオチドによって排除される体積が、ポリヌクレオチドの成長に利用可能なまたは適切な、初期に利用可能な体積の50、45、40、35、30、25、20、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1%、またはそれ以下を超えて占めることがないように、例えば、成長しているポリヌクレオチドに十分な体積を提供することによって、奏効率(sweep efficiency)を高めることができる。いくつかの例では、三次元構造は、化学暴露の急速な交換を可能にするために流体の流れの管理を可能にする。
1fM、5fM、10fM、25fM、50fM、75fM、100fM、200fM、300fM、400fM、500fM、600fM、700fM、800fM、900fM、1pM、5pM、10pM、25pM、50pM、75pM、100pM、200pM、300pM、400pM、500pM、600pM、700pM、800pM、900pM、またはそれ以上の量のDNAを合成する方法が、本明細書で提供される。いくつかの例では、ポリヌクレオチドライブラリは、遺伝子の約1%、2%、3%、4%、5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%の長さに及ぶことがある。遺伝子は、最大約1%、2%、3%、4%、5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、または100%まで変化し得る。
同一でないポリヌクレオチドはまとめて、遺伝子の少なくとも1%、2%、3%、4%、5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、または100%に対する配列をコードし得る。いくつかの例では、ポリヌクレオチドは、遺伝子の50%、60%、70%、80%、85%、90%、95%、またはそれ以上の配列をコードし得る。いくつかの例では、ポリヌクレオチドは、遺伝子の80%、85%、90%、95%、またはそれ以上の配列をコードし得る。
いくつかの例では、物理的構造によって隔離が達成される。いくつかの例では、ポリヌクレオチド合成のための能動領域および受動領域を発生させる表面の差次的な官能化によって、隔離が達成される。差次的な官能基化はまた、装置表面にわたって疎水性を変え、それによって、堆積した試薬の水滴(beading)または湿りを引き起こす水接触角の効果を作り出すことによって達成される。より大きな構造を利用することで、飛散(splashing)や、隣接するスポットの試薬での別々のポリヌクレオチド合成位置の相互汚染を減らすことができる。いくつかの例では、ポリヌクレオチドシンセサイザーなどの装置が、別々のポリヌクレオチド合成位置に試薬を堆積させるために使用される。三次元の特徴を有する基板は、低いエラー率(例えば、約1:500未満、約1:1000未満、約1:1500未満、約1:2,000未満、約1:3,000未満、約1:5,000未満、または約1:10,000未満)で、多数のポリヌクレオチド(例えば、約10,000を超える)を合成することができる。いくつかの例では、装置は、1mm当たり約1、5、10、20、30、40、50、60、70、80、100、110、120、130、140、150、160、170、180、190、200、300、400、または500、またはそれを超える特徴の密度で特徴を含む。
装置のあるウェルは、基板の他のウェルと同じまたは異なる幅、高さ、および/または体積を有してもよい。装置のあるチャネルは、基板の他のチャネルと同じまたは異なる幅、高さ、および/または体積を有してもよい。いくつかの例では、クラスターの幅は、約0.05mm~約50mm、約0.05mm~約10mm、約0.05mm~約5mm、約0.05mm~約4mm、約0.05mm~約3mm、約0.05mm~約2mm、約0.05mm~約1mm、約0.05mm~約0.5mm、約0.05mm~約0.1mm、約0.1mm~10mm、約0.2mm~10mm、約0.3mm~約10mm、約0.4mm~約10mm、約0.5mm~10mm、約0.5mm~約5mm、または約0.5 mm~約2mmである。いくつかの例では、クラスターを含むウェルの幅は、約0.05mm~約50mm、約0.05mm~約10mm、約0.05mm~約5mm、約0.05mm~約4mm、約0.05mm~約3mm、約0.05mm~約2mmの、約0.05mm~約1mm、約0.05mm~約0.5mm、約0.05mm~約0.1mm、約0.1mm~10mm、約0.2mm~10mm、約0.3mm~約10mm、約0.4mm~約10mm、約0.5mm~10mm、約0.5mm~約5mm、または約0.5mm~約2mmである。いくつかの例では、クラスターの幅は、5mm未満、4mm未満、3mm未満、2mm未満、1mm未満、0.5mm未満、0.1mm未満、0.09mm未満、0.08mm未満、0.07mm未満、0.06mm未満、または0.05mm未満であるか、あるいは、約5mm、約4mm、約3mm、約2mm、約1mm、約0.5mm、約0.1mm、約0.09mm、約0.08mm、約0.07mm、約0.06mm、または約0.05mmである。いくつかの例では、クラスターの幅は約1.0~1.3mmである。いくつかの例では、クラスターの幅は約1.150mmである。いくつかの例では、ウェルの幅は、5mm未満、4mm未満、3mm未満、2mm未満、1mm未満、0.5mm未満、0.1mm未満、0.09mm未満、0.08mm未満、0.07mm未満、0.06mm未満、または0.05mm未満であるか、あるいは、約5mm、約4mm、約3mm、約2mm、約1mm、約0.5mm、約0.1mm、約0.09mm、約0.08mm、約0.07mm、約0.06mm、または約0.05mmである。いくつかの例では、ウェルの幅は、約1.0~1.3mmである。いくつかの例では、ウェルの幅は約1.150mmである。いくつかの例では、クラスターの幅は約0.08mmである。いくつかの例では、ウェルの幅は約0.08mmである。クラスターの幅は、二次元または三次元の基板内のクラスターを指すことがある。
いくつかの例では、ウェルの高さは、約20μm~約1000μm、約50μm~約1000μm、約100μm~約1000μm、約200μm~約1000μm、約300μm~約1000μm、約400μm~約1000μm、または約500μm~約1000μmである。いくつかの例では、ウェルの高さは、約1000μm未満、約900μm未満、約800μm未満、約700μm未満、または約600μm未満である。
いくつかの例では、装置は、クラスター内の複数の座に対応する複数のチャネルを含み、ここで、チャネルの高さまたは深さは、約5μm~約500μm、約5μm~約400μm、約5μm~約300μm、約5μm~約200μm、約5μm~約100μm、約5μm~約50μm、または約10μm~約50μmである。いくつかの例では、チャネルの高さは、100μm未満、80μm未満、60μm未満、40μm未満または20μm未満である。
いくつかの例では、チャネル、座(例えば、実質的に平面の基板における)、またはチャネルと座の両方の直径(例えば、座がチャネルに対応する三次元構造装置における)は、約1μm~約1000μm、約1μm~約500μm、約1μm~約200μm、約1μm~約100μm、約5μm~約100μm、または約10μm~約100μm、例えば、約90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、あるいは10μmである。いくつかの例では、チャネル、座、またはチャネルと座の両方の直径は、約100μm、90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、または10μm未満である。いくつかの例では、2つの隣接チャネル、座、またはチャネルと座の中心からの距離は、約1μm~約500μm、約1μm~約200μm、約1μm~約100μm、約5μm~約200μm、約5μm~約100μm、約5μm~約50μm、または約5μm~約30μm、例えば、約20μmである。
表面改質
様々な例では、装置表面あるいは装置表面の選択された部位または領域の1つ以上の化学的性質および/または物理的性質を変更するための加法または減法による表面の化学的および/または物理的な変更のために、表面改質が利用される。例えば、表面改質としては、限定されないが、(1)表面の湿潤性を変更すること、(2)表面を官能化すること、つまり、表面官能基を提供、修飾、または置換すること、(3)表面を脱官能基化すること、つまり、表面官能基を除去すること、(4)そうでなければ、例えば、エッチングによって、表面の化学組成を変更すること、(5)表面粗さを増大または低減すること、(6)表面上にコーティング、例えば、表面の湿潤性とは異なる湿潤性を示すコーティングを提供すること、および/または(7)表面上に粒子を堆積させることが挙げられる。
いくつかの例では、表面上の化学層(接着促進剤と呼ばれる)を追加することで、基板の表面上の座の構造化したパターン化が容易になる。接着促進の適用のための典型的な表面としては、限定されないが、ガラス、シリコン、二酸化ケイ素、および窒化ケイ素が挙げられる。いくつかの例では、接着促進剤は、高い表面エネルギーを有する化学物質である。いくつかの例では、第2の化学層が基板の表面上に堆積される。いくつかの例では、第2の化学層は、低い表面エネルギーを有する。いくつかの例では、表面上にコーティングされた化学層の表面エネルギーは、表面上の液滴の局在化を支持する。選択されるパターン化の配置に応じて、座の近接性および/および座での流体接触の領域は変更可能である。
いくつかの例では、例えば、ポリヌクレオチド合成のために、核酸または他の部分が堆積する装置表面または分解された座は、滑らかであるか、実質的に平面であり(例えば、二次元)、あるいは隆起した特徴または陥没した特徴(例えば、三次元の特徴)などの不規則性を有している。いくつかの例では、装置表面は、化合物の1つ以上の異なる層で改質される。対象のそのような改変層としては、限定されないが、金属、金属酸化物、ポリマー、小さな有機分子などの無機層および有機層が挙げられる。非限定的なポリマー層としては、ペプチド、タンパク質、核酸またはそれらの模倣物(例えば、ペプチド核酸など)、多糖類、リン脂質、ポリウレタン、ポリエステル、ポリカーボネート、ポリ尿素、ポリアミド、ポリエチレンアミン、ポリアリーレンスルフィド、ポリシロキサン、ポリイミド、ポリアセテート、および本明細書に記載されるか、そうでなければ当該技術分野で知られている他の適切な化合物が挙げられる。いくつかの例では、ポリマーはヘテロポリマーである。いくつかの例では、ポリマーはホモポリマーである。いくつかの例では、ポリマーは官能性部分を含むか、またはコンジュゲートされる。
いくつかの例では、装置の分解された座は、表面エネルギーを増大および/または低減させる1つ以上の部分で官能基化される。いくつかの例では、ある部分は化学的に不活性である。いくつかの例では、ある部分は、望ましい化学反応、例えば、ポリヌクレオチド合成反応における1つ以上のプロセスを支援するように構成される。表面の表面エネルギー、すなわち、疎水性は、表面上に付着するヌクレオチドの親和性を決定するための因子である。いくつかの例では、装置の官能基化のための方法は、(a)二酸化ケイ素を含む表面を有する装置を提供する工程と;(b)本明細書に記載されるか、またはそうでなければ当該技術分野で知られている適切なシラン化剤、例えば、有機官能性アルコキシシラン分子を使用して、表面をシラン処理する工程とを含む。
いくつかの例では、有機官能性アルコキシシラン分子は、ジメチルクロロ-オクトデシル-シラン、メチルジクロロ-オクトデシル-シラン、トリクロロ-オクトデシル-シラン、トリメチル-オクトデシル-シラン、トリエチル-オクトデシル-シラン、またはそれらの任意の組み合わせを含む。いくつかの例では、装置の表面は、ポリエチレン/ポリプロピレン(ガンマ線照射またはクロム酸酸化、およびヒドロキシアルキル表面への還元によって官能基化された)、高度に架橋されたポリスチレン-ジビニルベンゼン(クロロメチル化によって誘導体化され、ベンジルアミン官能面にアミノ化された)、ナイロン(末端のアミノヘキシル基は直接反応性である)で官能基化されるか、または還元されたポリテトラフルオロエチレンでエッチングされる。他の方法および官能化剤は米国特許第5,474,796号に記載され、これは参照によってその全体が本明細書に組み込まれる。
いくつかの例では、装置の表面は、典型的に装置の表面上に存在する反応性の親水性部分を介して、装置の表面にシランを結合させるのに有効な反応条件下で、シランの混合物を含有している誘導体化組成物と接触させることによって官能基化される。シラン処理は一般に、有機官能性アルコキシシラン分子による自己組織化を介して表面を覆う。
当該技術分野において現在知られているように、例えば、表面エネルギーを低下または増大させるのための様々なシロキサン官能化試薬がさらに使用されてもよい。有機官能性アルコキシシランは、それらの有機官能に従って分類され得る。
本明細書には、ヌクレオシドに結合することができる薬剤のパターン化を含み得る装置が提供される。いくつかの例では、装置は活性薬剤でコーティングされてもよい。いくつかの例では、装置は、受動剤(passive agent)でコーティングされてもよい。本明細書に記載されるコーティング材料に含まれる例示的な活性薬剤としては、限定されることなく、N-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミド(HAPS)、11-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシラン、(3-アミノプロピル)トリメトキシシラン、(3-アミノプロピル)トリエトキシシラン、3-グリシドキシプロピルトリメトキシシラン(GOPS)、3-ヨード-プロピルトリメトキシシラン、ブチル-アルデヒド(aldehydr)-トリメトキシシラン、二量体の二級アミノアルキルシロキサン、、(3-アミノプロピル)-ジエトキシ-メチルシラン、(3-アミノプロピル)-ジメチル-エトキシシラン、および(3-アミノプロピル)-トリメトキシシラン、(3-グリシドキシプロピル)-ジメチル-エトキシシラン、グリシドキシ-トリメトキシシラン、(3-メルカプトプロピル)-トリメトキシシラン、3-4エポキシシクロヘキシル-エチルトリメトキシシラン、および(3-メルカプトプロピル)-メチル-ジメトキシシラン、アリルトリクロロクロロシラン、7-オクト-1-エニルトリクロロクロロシラン、あるいはビス(3-トリメトキシシリルプロピルアミンが挙げられる。
本明細書に記載されるコーティング材料に含まれる典型的な受動剤としては、限定されないが、ペルフルオロオクチルトリクロロシラン;トリデカフルオロ-1,1,2,2-テトラヒドロオクチル)トリクロロシラン;1H,1H,2H,2H-フルオロオクチルトリエトキシシラン(FOS);トリクロロ(1H,1H,2H,2H-ペルフロオロオクチル)シラン;tert-ブチル-[5-フルオロ-4-(4,4,5,5-テトラメチル-1,3,2-ジオキサボロラン-2-イル)インドール-1-イル]-ジメチル-シラン;CYTOP(商標);フロリナート(商標);ペルフロオロオクチルトリクロロシラン(PFOTCS);ペルフロオロオクチルジメチルクロロシラン(PFODCS);ペルフロオロデシルトリエトキシシラン(PFDTES);ペンタフルオロフェニル-ジメチルプロピルクロロ-シラン(PFPTES);ペルフロオロオクチルトリエトキシシラン;ペルフロオロオクチルトリメトキシシラン;オクチルクロロシラン;ジメチルクロロ-オクトデシル-シラン;メチルジクロロ-オクトデシル-シラン;トリクロロ-オクトデシル-シラン;トリメチル-オクトデシル-シラン;トリエチル-オクトデシル-シラン;または、オクタデシルトリクロロシランが挙げられる。
いくつかの例では、官能基化剤は、オクタデシルトリクロロシランなどの炭化水素シランを含む。いくつかの例では、官能基化剤は、11-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシラン、(3-アミノプロピル)トリメトキシシラン、(3-アミノプロピル)トリエトキシシラン、グリシジルオキシプロピル/トリメトキシシラン、およびN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドを含む。
ポリヌクレオチド合成
ポリヌクレオチド合成のための本開示の方法は、ホスホラミダイト化学を含むプロセスを含み得る。いくつかの例では、ポリヌクレオチド合成は、塩基をホスホラミダイトと結合させることを含む。ポリヌクレオチド合成は、カップリング条件下でホスホラミダイトの堆積によって塩基をカップリングすることを含んでいてもよく、ここで、同じ塩基が、随意に、1回より多くホスホラミダイトとともに堆積される、すなわち、二重カップリングが行われる。ポリヌクレオチド合成は、未反応の部位のキャッピングを含んでもよい。いくつかの例では、キャッピングは任意である。ポリヌクレオチド合成はまた、酸化または酸化工程を含んでもよい。ポリヌクレオチド合成は、脱ブロック化、脱トリチル化、および硫化を含んでもよい。いくつかの例では、ポリヌクレオチド合成は、酸化または硫化のいずれかを含む。いくつかの例では、ポリヌクレオチド合成反応中の1つの工程または各工程間で、装置は、例えば、テトラゾールまたはアセトニトリルを使用して洗浄される。ホスホラミダイト合成方法における任意の1つの工程の時間枠は、約2分、1分、50秒、40秒、30秒、20秒、および10秒未満であり得る。
ホスホラミダイト方法を使用するポリヌクレオチド合成は、後に、成長しているポリヌクレオチド鎖にホスホラミダイト構築ブロック(例えば、ヌクレオシドホスホラミダイト)を加えて、亜リン酸塩トリエステル結合の形成することを含んでもよい。ホスホラミダイトポリヌクレオチド合成は、3’から5’の方向に進む。ホスホラミダイトポリヌクレオチド合成は、1つの合成サイクル当たり、成長している核酸鎖への1つのヌクレオチドの制御された付加を可能にする。いくつかの例では、各合成サイクルはカップリング工程を含む。ホスホラミダイトカップリングは、活性化されたヌクレオシドホスホラミダイトと、例えば、リンカーを介して基板に結合されたヌクレオシドとの間の亜リン酸塩トリエステル結合の形成を含む。いくつかの例では、ヌクレオシドホスホラミダイトは、起動された装置に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、活性化因子(activator)とともに装置に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、基板に結合されたヌクレオシドよりも1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍、またはそれ以上の過剰量で、装置に提供される。いくつかの例では、ヌクレオシドホスホラミダイトの付加は、無水環境において、例えば、無水アセトニトリルにおいて実行される。ヌクレオシドホスホラミダイトの付加に続いて、装置は随意に洗浄される。いくつかの例では、カップリング工程は、随意に、基板へのヌクレオシドホスホラミダイトの添加の間に洗浄工程を伴って、さらに1回以上繰り返される。いくつかの例では、本明細書で使用されるポリヌクレオチド合成方法は、1、2、3、またはそれ以上の連続するカップリング工程を含む。カップリング前に、多くの場合では、装置に結合されたヌクレオシドは、保護基の除去によって脱保護され、ここで、その保護基は重合を防ぐように機能する。一般的な保護基は、4,4’-ジメトキシトリチル(DMT)である。
カップリング後、ホスホラミダイトポリヌクレオチド合成方法は、キャッピング工程を随意に含む。キャッピング工程では、成長しているポリヌクレオチドがキャッピング剤で処置される。キャッピング工程は、さらなる鎖伸長からのカップリング後に未反応の基板に結合した5’-OH基をブロックするのに有用であり、内部塩基欠失(internal base deletions)を伴うポリヌクレオチドの形成を防ぐ。さらに、1H-テトラゾールで活性化されたホスホラミダイトは、わずかにグアノシンのO6位置と反応する可能性がある。理論に縛られることなく、I/水で酸化すると、この副産物は、恐らくO6-N7遊走を介して、脱プリン化を受けることもある。脱プリン部位は、ポリヌクレオチドの最終的な脱保護の間に切断されることになり、したがって、完全長の産物の収率を低下させる場合がある。O6修飾は、I/水での酸化前に、キャッピング試薬による処理によって除去され得る。いくつかの例では、ポリヌクレオチド合成中にキャッピング工程を含めることにより、キャッピングなしの合成と比較して、エラー率が低下する。一例として、キャッピング工程は、基板に結合したポリヌクレオチドを、無水酢酸と1-メチルイミダゾールとの混合物で処理することを含む。キャッピング工程に続いて、装置は随意に洗浄される。
いくつかの例では、ヌクレオシドホスホラミダイトの付加後に、および随意にキャッピングと1以上の洗浄工程後に、装置に結合した成長している核酸が酸化される。酸化工程には、亜リン酸塩トリエステルを、天然に存在するリン酸ジエステルのヌクレオシド間の結合の保護された前駆体である、四配位リン酸塩トリエステルに酸化することが含まれる。いくつかの例では、成長しているポリヌクレオチドの酸化は、随意に弱塩基(例えば、ピリジン、ルチジン、コリジン)の存在下で、ヨウ素および水での処理によって達成される。酸化は、例えば、tert-ブチルヒドロペルオキシドまたは(1S)-(+)-(10-カンファースルホニル)-オキサジリジン(CSO)を使用して、無水条件下で実行され得る。いくつかの方法では、キャッピング工程は、酸化に続いて実行される。持続する可能性のある酸化からの残留水が、続くカップリングを阻害することができるため、第2のキャッピング工程により装置の乾燥が可能になる。酸化後に、装置および成長しているポリヌクレオチドは、随意に洗浄される。いくつかの例では、酸化の工程は、ポリヌクレオチドホスホロチオエートを得るための硫化工程に置き換えられ、任意のキャッピング工程が硫化後に実行され得る。限定されないが、3-(ジメチルアミノメチリデン)アミノ)-3H-1,2,4-ジチアゾール-3-チオン、DDTT、3H-1,2-ベンゾジチオール-3-オン1,1-ジオキシド(Beaucage試薬としても知られている)、およびN,N,N’N’-テトラエチルチウラムジスルフィド(TETD)を含む多くの試薬が、効率的な硫黄移動を行うことができる。
その後のヌクレオシドの取り込みのサイクルがカップリングを介して生じるためには、装置に結合した成長しているポリヌクレオチドの保護された5’末端を除去し、一次ヒドロキシル基が次のヌクレオシドホスホラミダイトと反応するようにする。いくつかの例では、保護基はDMTであり、脱ブロック化がジクロロメタン中のトリクロロ酢酸による生じる。長時間にわたって、または、推奨された酸の溶液よりも強力な脱トリチル化を行うことで、固体支持体に結合したポリヌクレオチドの脱プリン化が増大し、ゆえに、所望の完全長の産物の収率を低下させることがある。本明細書に記載される本開示の方法および組成物は、望ましくない脱プリン化反応を制限する制御された脱ブロック化条件を提供する。いくつかの例では、装置に結合したポリヌクレオチドは、脱ブロック化後に洗浄される。いくつかの例では、脱ブロック化後の効率的な洗浄は、低いエラー率を有する合成されたポリヌクレオチドに寄与する。
ポリヌクレオチドの合成のための方法は、典型的には以下の工程の一連の繰り返し(iterating sequence)を含む:活性化された表面、リンカー、または以前に脱保護された単量体のいずれかと結合するために、保護された単量体を活発に官能化された表面(例えば、座)に適用すること;後に適用される保護された単量体と反応するように、適用された単量体を脱保護すること;および、結合のために別の保護された単量体を適用すること。1以上の中間工程は、酸化または硫化を含む。いくつかの例では、1つ以上の洗浄工程は、工程の1つまたはすべてに先行するか、または工程の1つまたはすべての後に続く。
ホスホラミダイトベースのポリヌクレオチド合成のための方法は、一連の化学的な工程を含む。いくつかの例では、合成方法の1つ以上の工程は、試薬のサイクリングを含み、ここで、方法の1つ以上の工程は、工程に有用な試薬を装置に適用すること含む。例えば、試薬は、一連の液体堆積および真空乾燥の工程によって循環させられる。ウェル、マイクロウェル、チャネルなどの三次元の特徴を含む基板の場合、試薬は、随意にウェルおよび/またはチャネルを介して装置の1つ以上の領域を通過する。
本明細書に記載される方法およびシステムは、ポリヌクレオチドの合成のためのポリヌクレオチド合成装置に関する。合成は並行して行われ得る。例えば、少なくともまたは少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、10000、50000、75000、100000、またはそれ以上のポリヌクレオチドが並行して合成可能である。並行して合成され得るポリヌクレオチドの総数は、2~100000、3~50000、4~10000、5~1000、6~900、7~850、8~800、9~750、10~700、11~650、12~600、13~550、14~500、15~450、16~400、17~350、18~300、19~250、20~200、21~150、22~100、23~50、24~45、25~40、30~35の間であってもよい。当業者は、並行して合成されたポリヌクレオチドの総数が、これらの値のいずれかによって制約される任意の範囲内(例えば、25~100)にある得ることを認識する。並行して合成されたポリヌクレオチドの総数は、範囲のエンドポイントとして機能する値のいずれかによって定義された任意の範囲内にあり得る。装置内で合成されたポリヌクレオチドの総モル質量またはポリヌクレオチドの各々のモル質量は、少なくともまたは少なくとも約10、20、30、40、50、100、250、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、25000、50000、75000、100000ピコモル、またはそれ以上であり得る。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、少なくともまたは少なくとも約10、15、20、25、30、35、40、45、50、100、150、200、300、400、500のヌクレオチド、またはそれ以上であり得る。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、最大でまたはおよそ最大で約500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10のヌクレオチド、またはそれ以下であり得る。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、10~500、9~400、11~300、12~200、13~150、14~100、15~50、16~45、17~40、18~35、19~25の間であり得る。当業者は、装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長が、これらの値のいずれかによって制約される任意の範囲内(例えば、100~300)にあり得ることを認識する。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、範囲のエンドポイントとして機能する値のいずれかによって定義された任意の範囲内にあり得る。
本明細書で提供される表面上でのポリヌクレオチド合成の方法は、高速での合成を可能にする。一例として、1時間につき少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45 50、55、60、70、80、90、100、125、150、175、200のヌクレオチド、またはそれ以上が合成される。ヌクレオチドは、アデニン、グアニン、チミン、シトシン、ウリジンの構築ブロック、またはそれらのアナログ/修飾されたバージョンを含む。いくつかの例では、ポリヌクレオチドのライブラリは基板上で並行して合成される。例えば、約または少なくとも約100;1,000;10,000;30,000;75,000;100,000;1,000,000;2,000,000;3,000,000;4,000,000;または5,000,000の分解された座を含む装置は、少なくとも同じ数の別個のポリヌクレオチドの合成を支援することができ、ここで、別個の配列をコードするポリヌクレオチドは分解された座で合成される。いくつかの例では、ポリヌクレオチドのライブラリは、約3か月、2か月、1か月、3週、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日、24時間未満、またはそれ以下で、本明細書に記載される低いエラー率で、装置上で合成される。いくつかの例では、本明細書に記載される基板および方法を用いて低いエラー率で合成されるポリヌクレオチドライブラリから組み立てられる大きな核酸は、約3か月、2か月、1か月、3週、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日、24時間未満、またはそれ以下で調製される
いくつかの例では、本明細書に記載される方法は、複数のコドン部位にて異なる変異体ポリヌクレオチドを含むポリヌクレオチドのライブラリの生成をもたらす。いくつかの例では、ポリヌクレオチドは、1つの部位、2つの部位、3つの部位、4つの部位、5つの部位、6つの部位、7つの部位、8つの部位、9つの部位、10の部位、11の部位、12の部位、13の部位、14の部位、15の部位、16の部位、17の部位、18の部位、19の部位、20の部位、30の部位、40の部位、50の部位、またはそれ以上の部位の変異体コドン部位を有してもよい。
いくつかの例では、変異体コドン部位の1以上の部位は隣接することがある。変異体コドン部位の1以上の部位は隣接せず、1、2、3、4、5、6、7、8、9、10、またはそれ以上のコドンにより分離されてもよい。
いくつかの例では、ポリヌクレオチドは変異体コドン部位の複数の部位を含むことがあり、ここで、すべての変異体コドン部位は互いに隣接して、変異体コドン部位のストレッチを形成する。いくつかの例では、ポリヌクレオチドは変異体コドン部位の複数の部位を含み得、ここで、いかなる変異体コドン部位も互いに隣接していない。いくつかの例では、ポリヌクレオチドは変異体コドン部位の複数の部位を含んでもよく、ここで、変異体コドン部位のいくつかは互いに隣接して、変異体コドン部位のストレッチを形成し、変異体コドン部位の一部は互いに隣接していない。
図面を参照すると、図11は、より短いポリヌクレオチドからの核酸(例えば、遺伝子)の合成のための例示的なプロセスのワークフローを示す。ワークフローは通常、以下の段階:(1)一本鎖ポリヌクレオチドライブラリのデノボ合成、(2)より大きな断片を形成するためのポリヌクレオチドの結合、(3)エラー補正、(4)品質管理、および(5)輸送に分けられる。デノボ合成の前に、意図した核酸配列または核酸配列の群が、あらかじめ選択される。例えば、遺伝子の群が生成のためにあらかじめ選択される。
いったん、生成される大きなポリヌクレオチドが選択されると、ポリヌクレオチドのあらかじめ決められたライブラリがデノボ合成のために設計される。高密度のポリヌクレオチドアレイを生成するための様々な適切な方法が知られている。ワークフローの例では、装置の表層(1101)が提供される。この例では、表面の化学的性質(chemistry)は、ポリヌクレオチド合成プロセスを改善するために変えられる。低表面エネルギーの領域が液体を弾くように生成され、一方で高表面エネルギーの領域は液体を引き付けるために生成される。表面自体は平坦な表面の形態であってもよく、または、表面積を増加させる突起またはマイクロウェルなどの形状の変形を含んでもよい。ワークフローの例では、全体として参照により本明細書に組み込まれる国際特許出願公開WO/2015/021080で開示されるように、選択された高表面エネルギー分子は、DNAの化学的性質を支援する二重の機能を果たす。
ポリヌクレオチドアレイのインサイツ調製物は固体支持体上で生成され、並行して複数のオリゴマーを伸長させるために単一のヌクレオチド伸長プロセスを利用する。ポリヌクレオチドシンセサイザーなどの材料堆積装置は、段階的な手法で試薬を放出するように設計され、複数のポリヌクレオチドが並行して一度に1つの残基を伸長させ、それによりあらかじめ決められた核酸配列を持つオリゴマーを生成する(1102)。いくつかの例では、ポリヌクレオチドはこの段階で表面から切断される。切断は、例えば、アンモニアまたはメチルアミンによる気相切断(gas cleavage)を含む。
生成されたポリヌクレオチドライブラリは反応チャンバに配される。この例示的なワークフローでは、反応チャンバ(「ナノリアクター」とも呼ばれる)は、シリコンでコーティングされたウェルであり、PCR試薬を含み、ポリヌクレオチドライブラリ上に下げられる(1103)a。ポリヌクレオチドの密閉(1104)の前または後に、試薬を加えて、基板からポリヌクレオチドを放出させる。例示的なワークフローでは、ポリヌクレオチドは、ナノリアクターの密閉後に放出される(1105)。いったん放出されると、一本鎖ポリヌクレオチドの断片は、DNAの完全長範囲の配列に及ぶようにハイブリダイズする。合成されたポリヌクレオチドがそれぞれ、集団中の少なくとも1つの他のポリヌクレオチドと重なる小さな部分を持つように設計されるため、部分的なハイブリダイゼーション(1105)が可能である。
ハイブリダイゼーション後、PCR反応が始まる。ポリメラーゼサイクル中、ポリヌクレオチドは相補的断片にアニーリングされ、ギャップはポリメラーゼにより充填される。各サイクルは、どのポリヌクレオチドが互いに見出されるかに依存して、様々な断片の長さをランダムに増加させる。断片間の相補性は、完全な大きなスパンの二本鎖DNAの形成を可能にする(1106)。
PCRが完了した後、ナノリアクターは装置から分離され(1107)、PCRのためのプライマーを有する装置との相互作用のために配置される(1108)。密閉後、ナノリアクターはPCRにかけられ(1109)、より大きな核酸が増幅される。PCR(1110)の後、ナノチャンバが開放され(1111)、エラー補正試薬が加えられ(1112)、チャンバは密閉され(1113)、エラー補正反応が生じて、二本鎖PCR増幅産物からの相補性が乏しいミスマッチ塩基対および/または鎖を取り除く(1114)。ナノリアクターが開放および分離される(1115)。エラー補正された産物は次に、PCRおよび分子バーコーディングなどの付加的なプロセシング工程にさらされ、その後、包装されて(1122)輸送される(1123)。
いくつかの例では、品質管理措置が取られる。エラー補正の後、品質管理工程は、例えば、エラー補正した生成物の増幅のためのシーケンシングプライマーを有するウェーハとの相互作用(1116)、エラー補正した増幅産物を含むチャンバにウェーハを密閉すること(1117)、および、追加の回の増幅を行うこと(1118)を含む。ナノリアクターは開放され(1119)、産物はプールされ(1120)、配列決定される(1121)。許容可能な品質管理の決定がなされた後、包装された産物(1122)は輸送を承認される(1123)。
いくつかの例では、図11のものなどのワークフローによって生成される核酸は、本明細書に開示される重複プライマーを使用した突然変異誘発にさらされる。いくつかの例では、プライマーのライブラリは、固体支持体上でのインサイツの調製により生成され、並行して複数のオリゴマーを伸長させるための単一のヌクレオチド伸長プロセスを利用する。ポリヌクレオチドシンセサイザーなどの堆積装置は、段階的な手法で試薬を放出するように設計され、複数のポリヌクレオチドが並行して、一度に1つの残基を伸長させ、それによりあらかじめ決められた核酸配列を有するオリゴマーを生成する(1102)。
低いエラー率を有する大きなポリヌクレオチドライブラリ
提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドの平均エラー率は、1000中で1未満、1250中で1未満、1500中で1未満、2000中で1未満で、3000中で1未満であるか、またはしばしばそれよりも低い。いくつかの例では、提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドの平均エラー率は、1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1250、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000未満であるか、またはそれよりも低い。いくつかの例では、提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドの平均エラー率は、1/1000未満である。
いくつかの例では、提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドの総エラー率は、あらかじめ定められた配列と比較して、1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1250、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000未満であるか、またはそれよりも低い。いくつかの例では、提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドに対する総エラー率は、1/500、1/600、1/700、1/800、1/900、または1/1000未満である。いくつかの例では、提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドの総エラー率は、1/1000未満である。
いくつかの例では、エラー補正酵素は、使用することができる提供された方法およびシステムを使用してライブラリ内で合成されたポリヌクレオチドに使用されてもよい。いくつかの例では、エラー補正を伴うポリヌクレオチドの総エラー率は、あらかじめ定められた配列と比較して、1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000未満、またはそれ以下であってもよい。いくつかの例では、提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドのエラー補正を伴う総エラー率は、1/500、1/600、1/700、1/800、1/900、または1/1000未満であってもよい。いくつかの例では、提供されるシステムおよび方法を使用してライブラリ内で合成されたポリヌクレオチドのエラー補正を伴う総エラー率は、1/1000未満であってもよい。
エラー率は、遺伝子変異体のライブラリの産生のための遺伝子合成の値を制限することがある。1/300のエラー率では、1500の塩基対遺伝子におけるクローンの約0.7%が正しくなる。ポリヌクレオチド合成からのエラーのほとんどが、フレームシフト突然変異をもたらすことになるため、こうしたライブラリ中のクローンの99%以上が、完全長タンパク質を生成しない。エラー率を75%低下させることで、正確なクローンの画分を40倍増加させることになる。本開示の方法および組成物は、合成の質の改善と、超並列および時間効率の良い方法で可能になるエラー補正方法の適用性の両方のおかげで、一般に観察される遺伝子合成方法よりも低いエラー率での大きなポリヌクレオチドと遺伝子のライブラリの迅速なデノボ合成を可能にする。したがって、ライブラリは、ライブラリ全体にわたって、またはライブラリの80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上にわたって、塩基の挿入、欠失、置換、あるいは1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/1250、1/1500、1/2000、1/2500、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10000、1/12000、1/15000、1/20000、1/25000、1/30000、1/40000、1/50000、1/60000、1/70000、1/80000、1/90000、1/100000、1/125000、1/150000、1/200000、1/300000、1/400000、1/500000、1/600000、1/700000、1/800000、1/900000、1/1000000未満、またはそれ以下である合計のエラー率で合成され得る。本開示の方法および組成物はさらに、あらかじめ決められた/あらかじめ選択された配列と比較して、エラーのない配列に関連するライブラリの少なくともサブセットでは、ポリヌクレオチドまたは遺伝子の少なくとも30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上に関連付けられる低いエラー率での大きな合成オリゴヌクレオチドおよび遺伝子のライブラリに関する。いくつかの例では、ライブラリ内の単離した量でのポリヌクレオチドまたは遺伝子の少なくとも30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上は、同じ配列を有している。いくつかの例では、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、またはそれ以上の類似性または同一性に関連する、ポリヌクレオチドまたは遺伝子の少なくとも30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上は、同じ配列を有している。いくつかの例では、ポリヌクレオチドまたは遺伝子上の指定された座に関連するエラー率は、最適化される。したがって、大きなライブラリの一部としての1つ以上のポリヌクレオチドまたは遺伝子の所定の座または複数の選択された座はそれぞれ、1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/1250、1/1500、1/2000、1/2500、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10000、1/12000、1/15000、1/20000、1/25000、1/30000、1/40000、1/50000、1/60000、1/70000、1/80000、1/90000、1/100000、1/125000、1/150000、1/200000、1/300000、1/400000、1/500000、1/600000、1/700000、1/800000、1/900000、1/1000000未満、またはそれより低いエラー率を有してもよい。様々な事例では、そのようなエラーを最適化した座は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、30000、50000、75000、100000、500000、1000000、2000000、3000000、またはそれ以上の座を含んでもよい。エラーを最適化した座は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、30000、75000、100000、500000、1000000、2000000、3000000、またはそれ以上のポリヌクレオチドまたは遺伝子に分布されてもよい。
エラー率は、エラー補正を伴ってまたは伴わずに達成され得る。エラー率は、ライブラリ全体にわたって、またはライブラリの80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上にわたって達成され得る。
コンピュータシステム
本明細書に記載されるシステムのいずれかがコンピュータに操作可能に接続され、局所的にまたは遠隔的にコンピュータを介して自動化されてもよい。様々な例では、本開示の方法およびシステムはさらに、コンピュータシステム上にソフトウェアプログラム、およびその使用を含んでもよい。したがって、材料堆積装置の動作、分配行為、および減圧作動を編成および同期するなど、機能の分配/減圧/再充填の同期のためのコンピュータ制御は、本開示の範囲内である。コンピュータシステムは、ユーザーに指定された塩基配列と材料堆積装置の位置との間に干渉するようにプログラムされ、基板の指定された領域に正しい試薬を送達する。
図12で例証されるコンピュータシステム(1200)は、媒体(1211)、および/または固定された媒体(1212)を有するサーバー(1209)に随意に接続可能されたネットワークポート(1205)からの命令を読み取ることができる論理的な装置として理解されてもよい。図12に示されるものなどのシステムは、CPU(1201)、ディスクドライブ(1203)、キーボード(1215)および/またはマウス(1216)などの随意の入力装置、および随意のモニター(1207)を含んでもよい。データ通信は指示された通信媒体を介して局所位置または遠隔位置のサーバーまで達成され得る。通信媒体は、データを送信および/または受信する任意の手段を含むことができる。例えば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続であってもよい。そのような接続は、ワールド・ワイド・ウェブ上での通信を提供することができる。本開示に関するデータは、図12に例示されるように当事者(1222)による受領および/または検討のためにそのようなネットワークまたは接続によって伝達され得ることが想定される。
図13は、本開示の例と関連して使用可能なコンピュータシステム(1300)の第1の例のアーキテクチャを示すブロック図である。図13に表されるように、例示的なコンピュータシステムは、命令を処理するためのプロセッサ(1302)を含んでもよい。プロセッサの非限定的な例は、以下を含む:Intel Xeon(商標)プロセッサ、AMD Opteron(商標)プロセッサ、Samsung 32-bit RISC ARM 1176JZ(F)-S v1.0(商標)プロセッサ、ARM Cortex-A8 Samsung S5PC100(商標)プロセッサ、ARM Cortex-A8 Apple A4(商標)プロセッサ、Marvell PXA 930(商標)プロセッサ、または機能的に同等なプロセッサ。実行の複数のスレッドが並列処理に使用可能である。いくつかの例では、複数のプロセッサ、または複数のコアを持つプロセッサも、単一のコンピュータシステム中であろうと、クラスターの中であろうと、または、複数のコンピュータ、携帯電話、および/または個人用携帯情報端末装置を含むネットワーク上のシステムにわたって分布されていても、使用可能である。
図13に示されるように、高速キャッシュ(1304)は、プロセッサ(1302)に接続するか、または組み込まれることで、プロセッサ(1302)により近年使用されてきたまたは頻繁に使用されている命令またはデータのための高速メモリを提供することができる。プロセッサ(1302)は、プロセッサバス(1308)によりノースブリッジ(1306)に接続される。ノースブリッジ(1306)は、メモリバス(1312)によりランダムアクセスメモリ(RAM)(1310)に接続され、プロセッサ(1302)によりRAM(1310)へのアクセスを管理する。ノースブリッジ(1306)は、チップセットバス(1316)によりサウスブリッジ(1314)にも接続される。サウスブリッジ(1314)は次に、周辺バス(1318)に接続される。周辺バスは、例えば、PCI、PCI-X、PCI Express、または他の周辺バスであってもよい。ノースブリッジおよびサウスブリッジはしばしば、プロセッサチップセットと称され、周辺バス(1318)上でプロセッサと、RAMと、周辺コンポーネントとの間のデータ転送を管理する。いくつかの代替的なアーキテクチャでは、ノースブリッジの機能性は、別のノースブリッジチップを使用する代わりにプロセッサに組み込まれることができる。いくつかの例では、システム(1300)は、周辺バス(1318)に取り付けられたアクセラレータカード(1322)を含むことができる。アクセラレータは、フィールドプログラマブルゲートアレイ(FPGA)または特定の処理を促進するための他のハードウェアを含んでもよい。例えば、アクセラレータは、適応データの再構成のために、または拡張された設定処理に使用される代数式を評価するために使用され得る。
ソフトウェアとデータは、外部記憶装置(1324)に記憶され、プロセッサにより使用されるRAM(1310)および/またはキャッシュ(1304)へとロードすることができる。システム(1300)は、システムリソースの管理のためのオペレーティングシステムを含み;オペレーティングシステムの非限定的な例は、Linux(登録商標)、Windows(商標)、MACOS(商標)、BlackBerry OS(商標)、iOS(商標)、および他の機能的に同等なOS、同様に、本開示の例に従ってデータの記憶と最適化を管理するためのオペレーティングシステム上で実行するアプリケーションソフトウェアを含む。この例では、システム(1300)はさらに、ネットワーク接続ストレージ(NAS)などの外部記憶装置、および分散並列処理に使用することができる他のコンピュータシステムにネットワークインターフェースを提供するために、周辺バスに接続されるネットワークインターフェースカード(NIC)(1320)および(1321)を含む。
図14は、複数のコンピュータシステム(1402a)および(1402b)、複数の携帯電話および個人用携帯情報端末(1402c)、ならびにネットワーク接続ストレージ(NAS)(1404a)および(1404b)を備えたネットワーク(1400)を示す略図である。例では、システム(1402a)、(1402b)、および(1402c)は、データ記憶を管理し、ネットワーク接続ストレージ(NAS)(1404a)および(1404b)に記憶されたデータに対するデータアクセスを最適化することができる。数学モデルはこのデータに対して使用可能であり、コンピュータシステム(1402a)および(1402b)、ならびに携帯電話および個人用携帯情報端末システム(1402c)にわたって分散並列処理を使用して評価可能である。コンピュータシステム(1402a)および(1402b)、ならびに携帯電話および個人用携帯情報端末システム(1402c)は、ネットワーク接続ストレージ(NAS)(1404a)および(1404b)に記憶されたデータの適応データ再構築に対して並列処理を提供することもできる。図14は一例のみを示しており、様々な他のコンピュータのアーキテクチャおよびシステムは、本開示の様々な例と共に使用され得る。例えば、ブレードサーバーは並列処理を提供するために使用することができる。プロセッサブレードは、並列処理を提供するためにバックプレーンを介して接続可能である。ストレージも、バックプレーンに接続することができるか、または別のネットワークインターフェースを介してネットワーク接続ストレージ(NAS)として接続可能である。いくつかの例では、プロセッサは、別のメモリ空間を維持し、ネットワークインターフェース、バックプレーン、または他のプロセッサによる並列処理のための他のコネクターを通じてデータを伝達することができる。他の例では、プロセッサのいくつかまたはすべてが、共有仮想アドレスメモリ空間を使用することができる。
図15は、例に従って共有仮想アドレスメモリ空間を使用するマルチプロセッサコンピュータシステム(1500)のブロック図である。上記システムは、共有メモリサブシステム(1504)にアクセス可能な複数のプロセッサ(1502a-f)を含む。上記システムは、メモリサブシステム(1504)に複数のプログラマブルハードウェアメモリアルゴリズムプロセッサ(MAP)(1506a-f)を組み込む。各MAP(1506a-f)は、メモリ(1508a-f)および1以上のフィールドプログラマブルゲートアレイ(FPGA)(1510a-f)を含んでもよい。MAPは設定可能な機能ユニットを提供し、特定のアルゴリズムまたはアルゴリズムの一部は、各プロセッサと密接に協働して処理を行うためにFPGA(1510a-f)に提供可能である。例えば、MAPは、データモデルに関する代数式を評価し、かつ例における適応データの再構築を行うために使用することができる。この例では、各MAPは、このような目的のためのプロセッサすべてにより世界中からアクセス可能である。1つの構成では、各MAPは、関連するメモリ(1508a-f)にアクセスするためにダイレクトメモリアクセス(DMA)を使用することができ、それにより、各マイクロプロセッサ(1502a-f)から独立して、かつこれらから非同期的に、タスクを実行することができる。この構成では、MAPは、アルゴリズムのパイプライン処理(pipelining)および並列実行のために別のMAPに直接結果を供給することができる。
上記のコンピュータのアーキテクチャおよびシステムは単なる例に過ぎず、様々な他のコンピュータ、携帯電話、および、個人用携帯情報端末のアーキテクチャおよびシステムは、一般的なプロセッサ、コプロセッサ、FPGA、および他のプログラマブルロジックデバイス、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、および他の処理要素と論理素子の任意の組み合わせを使用するシステムを含む例と共に使用することができる。いくつかの例では、コンピュータシステムのすべてまたは一部は、ソフトウェアまたはハードウェアに実装することができる。様々なデータ記憶媒体が、例えば、ランダムアクセスメモリ、ハードドライブ、フラッシュメモリ、テープドライブ、ディスクアレイ、ネットワーク接続ストレージ(NAS)、および他のローカルまたは分散データ記憶装置およびシステムを含む例と共に使用することができる。
例では、コンピュータシステムは、上記のまたは他のコンピュータのアーキテクチャおよびシステムのいずれかで実行されるソフトウェアモジュールを使用して実施することができる。他の例では、システムの機能は、ファームウェア、図15で言及されるようなフィールドプログラマブルゲートアレイ(FPGA)などのプログラマブルロジックデバイス、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、または他の処理要素および論理素子において、部分的または完全に実装することができる。例えば、セットプロセッサおよびオプティマイザは、図13に示されるアクセラレータカード(1322)などのハードウェアアクセラレータカードの使用を介してハードウェアアクセラレーションで実施することができる。
以下の実施例は、本発明の様々な実施形態を例示する目的で与えられ、いかなる方法でも本発明を制限するようには意図されていない。本明細書に記載される方法とともに、本実施例は、好ましい実施形態を代表するものであり、例示的なものであり、および、本発明の範囲を限定することを意図したものではない。請求項の範囲によって定義される本発明の精神内に包含されるその変化および他の使用が、当業者に想定される。
実施例1:基板表面の官能化
ポリヌクレオチドのライブラリの付着および合成を助けるために、基板を官能化した。基板表面をまず、20分間、90%のHSOおよび10%のHを含むピラニア溶液を使用して湿式洗浄した。基板を、DI水を含む様々なビーカー中ですすぎ、5分間DI水のグーズネック形状の蛇口下で保持して、Nで乾燥させた。基板をその後、NHOH(1:100;3mL:300mL)に5分間浸し、ハンドガン(handgun)を使用してDI水ですすぎ、DI水を含む3つの連続するビーカーの中でそれぞれ1分間浸し、その後、ハンドガンを使用してDI水で再びすすいだ。その後、基板表面をOにさらすことにより基板をプラズマ洗浄した。SAMCO PC-300機器を使用して、下流モードで1分間、250ワットでOをプラズマエッチングした。
以下のパラメータ:0.5から1トル、60分、70℃、135℃の気化器を有するYES-1224P気相蒸着オーブンシステムを使用して、汚れを落とした基板表面をN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドを含む溶液で能動的に官能化した。Brewer Science 200Xスピンコータを使用して、基板表面をレジストコートした(resist coated)。SPR(商標)3612フォトレジストを、40秒間2500rpmで基板上でスピンコートした。Brewerホットプレート上で、90℃で30分間、基板をプリベイクした。Karl Suss MA6マスクアライナー機器を使用して、基板をフォトリソグラフィーに曝露した。基板を2.2秒間曝露し、MSF 26Aの中で1分間、現像させた(developed)。残りの現像剤(developer)をハンドガンですすぎ、基板を5分間水に浸した。基板をオーブン中で100℃にて30分間ベイクし、その後、Nikon L200を使用してリソグラフィーの欠損について目視検査を行った。デスカム処理を使用してSAMCO PC-300機器を用いて残りのレジストを取り除き、1分間250ワットでO2プラズマエッチングした。
基板表面を、10μLの軽油と混合したペルフルオロオクチルトリクロロシランの100μL溶液で受動的に官能化した。基板をチャンバに入れ、10分間ポンプでくみ出し、その後、バルブを閉じてポンプを止め、10分間放置した。チャンバを通気した。最大パワー(Crestシステム上で9)での超音波処理によって70℃で500mLのNMP中で5分間に2回の浸漬を行うことにより、基板をレジスト剥離した。その後、最大パワーでの超音波処理により室温で500mLのイソプロパノール中に5分間、基板を浸した。基板を、300mLの200プルーフエタノール(200 proof ethanol)に漬けて、Nで送風乾燥した。官能化した表面を活性化させて、ポリゴヌクレオチド合成のための支持体として機能させた。
実施例2:ポリヌクレオチド合成装置上での50merの配列の合成
二次元ポリヌクレオチド合成装置をフローセルに組み入れ、フローセル(Applied Biosystems「ABI394 DNA Synthesizer」)に接続させた。N-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミド(Gelest)でポリヌクレオチド合成装置を均一に機能化し、これを使用し、本明細書に記載されるポリヌクレオチド合成方法を用いて50bpの例示的なポリヌクレオチド(「50bp(50-mer)のポリヌクレオチド」)を合成した。
50merの配列は、配列番号:1に記載されている通りであった。5’AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGACTTCGGCAT##TTTTTTTTTT3’(配列番号:1)、ここで、#は、チミジン-スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP-2244)を表し、これは、脱保護中に表面からのポリゴヌクレオチドの放出を可能にする切断可能なリンカーである。
表2のプロトコルおよびABIシンセサイザーに従い、標準DNA合成化学(カップリング、キャッピング、酸化、および脱ブロック化)を使用して合成を行った。
Figure 2022521766000003
Figure 2022521766000004
Figure 2022521766000005
ホスホラミダイト/活性化因子の組み合わせを、フローセルを介するバルク試薬の送達と同様に送達した。環境が時間全体にわたって試薬により「湿った」ままであるときには、いかなる乾燥工程も行わなかった。
フローリストリクターをABI 394シンセサイザーから取り除き、より速い流れを可能した。フローリストリクターなしで、アミダイト(ACN中で0.1M)、活性化因子(ACN中で0.25Mのベンゾイルチオテトラゾール(「BTT」;GlenResearchの30-3070-xx))、およびOx(20%のピリジン、10%の水、および70%のTHF中の0.02MのI2)の流量は、およそ~100uL/秒、アセトニトリル(「ACN」)およびキャッピング試薬(CapAとCapBの1:1の混合物、ここで、CapAはTHF/ピリジン中の無水酢酸であり、CapBはTHF中の16%の1-メチルイミダゾール(methylimidizole))についてはおよそ~200uL/秒、および、Deblock(トルエン中の3%のジクロロ酢酸)についてはおよそ~300uL/秒(フローリストリクターですべての試薬に対して~50uL/秒と比較して)であった。酸化剤(Oxidizer)を完全に押し出す時間を観察し、化学フロー時間のタイミングを適宜調整し、余分なACN洗浄を異なる化学物質間に導入した。ポリヌクレオチド合成後、75psiで一晩、ガス状のアンモニア中でチップを脱保護した。表面に水を5滴加えて、ポリヌクレオチドを回収した。その後、回収したポリヌクレオチドを、BioAnalyzerの小さなRNAチップ上で分析した(データは示されていない)。
実施例3:ポリヌクレオチド合成装置上での100merの配列の合成
50merの配列の合成について実施例2に記載されるのと同じプロセスを、100merのポリヌクレオチド(「100merのポリヌクレオチド」;5’CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3’、ここで、#はチミジン-スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP-2244);配列番号:2を表す)の、2つの異なるシリコンチップ上での合成に使用し、第1のシリコンチップはN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドで均一に官能化され、第2のシリコンチップは11-アセトキシウンデシルトリエトキシシランとn-デシルトリエトキシシランの5/95の混合物で官能化され、表面から抽出されたポリヌクレオチドを、BioAnalyzer機器で分析した(データは示されていない)。
以下の熱サイクルプログラムを使用して、50uLのPCR混合物(25uLのNEB Q5 マスターミックス、2.5uLの10uMフォワードプライマー、2.5uLの10uMリバースプライマー、表面から抽出した1uLのポリヌクレオチド、および最大50uLの水)中で、フォワードプライマー(5’ATGCGGGGTTCTCATCATC3’;配列番号:3)およびリバースプライマー(5’CGGGATCCTTATCGTCATCG3’;配列番号:4)を使用して、2つのチップからの10の試料すべてをさらに増幅した:
98C、30秒;
98C、10秒;63C、10秒;72C、10秒;12のサイクルを繰り返す
72C、2分
PCR生成物をBioAnalyzer上でも実行して(データは示されていない)、100merの位置での鋭いピークを実証した。次に、PCR増幅試料をクローン化し、サンガーシーケンシングを行った。表3は、チップ1からのスポット1-5から得た試料、およびチップ2からのスポット6-10から得た試料に対するサンガーシーケンシングから生じる結果を要約する。
Figure 2022521766000006
ゆえに、高品質および高均一性の合成ポリヌクレオチドを、異なる界面化学的性質を持つ2つのチップ上で繰り返した。配列決定された100merの262のうち233に対応している全体の89%が、エラーのない完全な配列であった。
最後に、表4は、スポット1-10からのポリヌクレオチド試料から得た配列に対するエラー特徴を要約している。
Figure 2022521766000007
実施例4:29,040の固有のポリヌクレオチドの並列アセンブリ
図16に示すように、各々、平坦なシリコンプレート(1601)上に121の座を含む256のクラスター(1605)を含む構造体を製造した。クラスターの拡大図が、121の座を有する(1610)で示されている。256のクラスターの240からの座は、特徴的な配列を有するポリヌクレオチドの合成のための取り付けおよび支持を提供した。ポリヌクレオチドの合成は、実施例3からの一般的な方法を用いて、ホスホラミダイト化学によって行われた。256のクラスターのうち16からの座は対照クラスターであった。合成された29,040の固有のポリヌクレオチド(240×121)の包括的な分布を、図17Aに示す。ポリヌクレオチドライブラリは、高い均一性で合成された。配列の90%は、平均の4倍以内のシグナルに存在し、100%の表現を可能にした。分布は、図17Bに示すように、各クラスターについて測定された。4つの代表的なクラスター中で合成された固有のポリヌクレオチドの分布を、図18に示す。包括的なレベルでは、実行中のすべてのポリヌクレオチドが存在し、99%のポリヌクレオチドは、合成の均一性を示す平均の2倍以内の存在量を有していた。クラスターごとのレベルでもこの同じ観察結果は一致していた。
各ポリヌクレオチドのエラー率は、Illumina MiSeq遺伝子シーケンサーを用いて決定された。29,040の固有のポリヌクレオチドに対するエラー率の分布を図19Aに示し、500塩基に約1個の割合で平均し、800塩基に1個の割合の低いエラー率のものもある。分布は、図19Bに示すように、各クラスターについて測定された。4つの代表的なクラスターにおける固有のポリヌクレオチドのエラー率分布を、図20に示す。29,040の固有のポリヌクレオチドのライブラリは、20時間未満で合成された。
29,040の固有のポリヌクレオチドのすべてでのGCパーセンテージ対ポリヌクレオチド表現の分析は、GC含量にかかわらず、合成が均一であることを示した(図21)。
実施例5:試料の調製と、ポリヌクレオチド標的化ライブラリによる濃縮
ゲノムDNA(gDNA)試料から得て、断片化緩衝液で酵素的に断片化し、末端を修復し、3’アデニル化した。二重インデックスアダプター(16の固有のバーコードの組み合わせ)をゲノムDNA断片の両末端にライゲートして、アダプタータグ付きgDNA鎖のライブラリを作製し、アダプタータグ付きDNAライブラリを高忠実度ポリメラーゼで増幅した。その後、gDNAライブラリを、ユニバーサルアダプターブロッカーの存在下で、96℃で一本鎖に変性させた。ポリヌクレオチド標的化ライブラリ(プローブライブラリ)を96℃のハイブリダイゼーション溶液で変性させ、70℃で16時間、ハイブリダイゼーション溶液中で、変性したタグ付きgDNAライブラリと組み合わせた。その後、ハイブリダイズしたタグ付きgDNA-プローブに結合緩衝液を加え、ストレプトアビジンからなる磁気ビーズを用いてビオチン化したプローブをキャプチャーした。磁石を使ってビーズを溶液から分離させ、ビーズを緩衝液で3回洗浄して、結合していないアダプター、gDNA、アダプターブロッカーを除去した後、溶出緩衝液を添加して、濃縮されたタグ付きgDNA断片をビーズから放出した。タグ付きgDNA断片の濃縮されたライブラリを高忠実度ポリメラーゼで増幅して、クラスター生成に十分な収量を得た後、NGS機器を用いてライブラリを配列決定した。
実施例6:エクソーム標的化ポリヌクレオチドプローブライブラリを用いたゲノムDNAキャプチャー
ヒトエクソームを標的とする少なくとも50万の非同一ポリヌクレオチドを含むポリヌクレオチド標的化ライブラリを、実施例3の一般的な方法を用いるホスホラミダイト化学、および、実施例5の一般的な方法を用いて制御された化学量論によって、設計して構造体上で合成することで、ライブラリ4を生成した。その後、このポリヌクレオチドをビオチンで標識し、溶解させて、エクソームプローブライブラリ溶液を形成した。実施例16の一般的な方法を用いて、ゲノムDNA(gDNA)試料から乾燥したインデックス化ライブラリプールを得た。
エクソームプローブライブラリ溶液、ハイブリダイゼーション溶液、遮断薬ミックスA、および遮断薬ミックスBを、2秒間パルスボルテックスすることにより混合した。ハイブリダイゼーション溶液を65℃で10分間、または沈殿物がすべて溶解するまで加熱し、その後、ベンチトップでさらに5分間室温に戻した。20μLのハイブリダイゼーション溶液と4μLのエクソームプローブライブラリ溶液を薄肉のPCR 0.2mLストリップチューブに添加し、ピペッティングで静かに混合した。組み合わせたハイブリダイゼーション溶液/エクソームプローブ溶液を105℃の蓋付きサーマルサイクラーで2分間95℃に加熱し、すぐに氷上で少なくとも10分間冷却した。次いで、溶液をベンチトップ上で5分間室温まで冷却した。ハイブリダイゼーション溶液/エクソームプローブライブラリ溶液が冷却されている間に、各ゲノムDNA試料に9μlまで水を加え、薄肉のPCR 0.2mLストリップチューブ内の乾燥インデックス化ライブラリプールに遮断薬ミックスAを5μl、遮断薬ミックスBを2μl添加した。その後、溶液をピペッティングで静かに混合した。プールされたライブラリ/遮断薬チューブを105℃の蓋付きサーマルサイクラーで95℃で5分間加熱し、その後、次の工程に進む前にベンチトップで5分以下、室温に戻した。ハイブリダイゼーションミックス/プローブ溶液をピペッティングで混合し、全24μLのプールされたライブラリ/遮断薬チューブに添加した。キャプチャー反応ウェル全体を、気泡を発生させないように、静かなピペッティングによって混合した。試料チューブは、チューブがしっかりと密封されていることを確認するためにパルススピンされた。キャプチャー/ハイブリダイゼーション反応は、85℃の蓋の温度で、PCRサーモサイクラーで16時間、70℃で加熱された。
結合緩衝液、洗浄緩衝液1、および洗浄緩衝液2を、沈殿物がすべて溶液に溶解するまで、48℃で加熱した。700μLの洗浄緩衝液2を1回キャプチャーするたびにアリコートし、48℃に予熱した。ストレプトアビジン結合ビーズおよびDNA精製ビーズを室温で少なくとも30分間平衡化した。KAPA HiFi HotStart ReadyMixなどのポリメラーゼ、および増幅プライマーを氷上で解凍した。いったん試薬を解凍して、試薬を2秒間パルスボルテックスで混合した。キャプチャー反応あたり500μLの80%エタノールを調製した。ストレプトアビジン結合ビーズを室温で予備平衡化し、均質化するまでボルテックスした。100μLのストレプトアビジン結合ビーズを、1回のキャプチャー反応ごとに、清潔な1.5mLマイクロチューブに添加した。200μLの結合緩衝液を各チューブに添加し、各チューブをホモジナイズするまで、ピペッティングで混合した。チューブを磁石スタンドに置いた。ストレプトアビジン結合ビーズを1分以内にペレット化した。チューブを取り出し、ビーズペレットを乱さないように注意しながら、透明な上清を捨てた。チューブを磁石スタンドから取り出し、洗浄をさらに2回繰り返した。3回目の洗浄後、チューブを除去し、透明な上清を捨てた。結合緩衝液の最後の200μLを添加し、ビーズを均質になるまでボルテックスで再懸濁した。
ハイブリダイゼーション反応完了後、サーマルサイクラーの蓋を開け、キャプチャー反応の全量を、洗浄したストレプトアビジン結合ビーズに速やかに移した(36-40μL)。この混合物を、キャプチャー反応/ストレプトアビジン結合ビーズ溶液のホモジナイズしたまま維持するのに十分な速度で、シェーカー、ロッカー、またはローテーター上で室温で30分間混合した。キャプチャー反応/ストレプトアビジン結合ビーズ溶液は、すべての溶液がチューブの底にあることを確認するために、ミキサーとパルススピンから取り除かれた。試料を磁気スタンドに置き、ストレプトアビジン結合ビーズをペレット化して、1分以内に透明な上清を残した。この透明な上清を除去して廃棄した。チューブを磁気スタンドから取り出し、200μLの洗浄緩衝液を室温で添加し、その後、ホモジナイズするまでピペッティングにより混合した。すべての溶液がチューブの底にあることを確認するために、チューブをパルススピンした。サーマルサイクラーを以下の条件でプログラムした(表5)。
加熱した蓋の温度を105℃に設定した。
Figure 2022521766000008
増幅プライマー(2.5μL)とKAPA HiFi HotStart ReadyMix(25μL)などのポリメラーゼを、水/ストレプトアビジン結合ビーズスラリーを入れたチューブに添加し、チューブをピペッティングで混合した。その後、チューブを2つの反応に分割した。チューブをパルススピンしてサーマルサイクラーに移し、表5のサイクリングプログラムを開始した。サーマルサイクラープログラムが完了すると、試料をブロックから取り出し、すぐに精製に供した。室温で予備平衡化したDNA精製ビーズをホモジナイズするまでボルテックスした。90μL(1.8倍)のホモジナイズされたDNA精製ビーズをチューブに添加し、ボルテックスによりよく混合した。チューブを室温で5分間インキュベートし、磁石スタンドに置いた。DNA精製ビーズをペレット化して、1分以内に透明な上清を残した。透明な上清を廃棄して、チューブを磁石スタンドに残した。DNA精製ビーズのペレットを200μLの新しく調製した80%エタノールで洗浄し、1分間インキュベートし、その後、除去して、エタノールを廃棄した。洗浄は、チューブを磁石スタンド上に置いたまま、1回繰り返し、合計2回の洗浄を行った。残されたすべてのエタノールを除去し、DNA精製ビーズペレットを乱さないように注意しながら、10μLのピペットで廃棄した。DNA精製ビーズペレットを磁石スタンド上で5-10分間、またはペレットが乾燥するまで、風乾させた。チューブを磁石スタンドから取り出し、32μLの水を加え、ホモジナイズするまでピペッティングで混合し、室温で2分間インキュベートした。チューブを3分間、またはビーズが完全にペレット化されるまで、磁気スタンド上に置いた。30μLの透明な上清を回収し、DNA精製ビーズのペレットを乱さないように注意しながら、清潔な薄肉のPCR 0.2mLストリップチューブに移した。平均断片長は、分析装置で150bp-1000bpの範囲設定を使用して、約375bp-約425bpの間であった。理想的には、最終濃度値は少なくとも約15ng/μLである。各キャプチャーは、次世代シーケンシング(NGS)を用いて定量化され、検証された。
対照薬エクソームキャプチャーキット(対照薬キットD)と比較した、NGS測定基準の概要を表6、表7に示す。ライブラリ4は、対照薬キットDよりも高い割合でエクソン標的に対応するプローブ(ベイト)を有している。このおかげで、ライブラリ4を用いて標的配列の同等の品質およびカバレッジを得るためのシーケンシングが少なくて済む。
Figure 2022521766000009
Figure 2022521766000010
キットDとライブラリ4の両方についての重複する標的領域の比較(96倍のカバレッジに正規化された総リード)を表8に示す。ライブラリ4はハイブリダイゼーションあたり8試料として処理され、キットDはハイブリダイゼーションあたり2試料として処理された。さらに、両方のライブラリについて、重複領域からの一塩基多型およびインフレーム欠失コールを、“Genome in a Bottle”NA12878参照データから同定された高信頼度領域に対して比較した(表9)。ライブラリ4は、SNPおよびインデルの同定においてキットDと同等またはそれ以上のパフォーマンス(インデルの精度がより高い)を示した。「インデル」との用語は、本明細書で使用されるように、あらかじめ決められた配列とは異なる挿入および欠失を含むエラーの一種を指す。
Figure 2022521766000011
Figure 2022521766000012
精度は、真の陽性コール対合計(真および偽)の陽性コールの比を表す。感度は、真の陽性コール対合計の真の値(真の陽性と偽の陰性)の比を表す。
実施例7.ユニバーサルアダプターを用いるライブラリ調製
二重インデックスアダプターをユニバーサルアダプターに交換する変更を行って、実施例5または6の一般的な方法を用いて核酸サンプルを調製した。ユニバーサルアダプターをライゲートした後、アダプターライゲートされた試料核酸ライブラリの増幅は、バーコード化プライマーライブラリで行われ、バーコード化アダプターライゲートされた試料核酸ライブラリを生成した。その後、このライブラリを直接配列決定した。ユニバーサルアダプターを使用することで、標準的な二重インデックスYアダプターと比較して、増幅後のライブラリ核酸濃度が増加した(図4A)。さらに、ユニバーサルアダプターを用いて調製されたライブラリは、標準的な二重インデックスYアダプターに比べてATのドロップアウトが少なく(図4B)、すべてのインデックス配列を均一に表現することができた。(図5)
実施例8.ユニバーサルアダプターを用いるライブラリ調製および濃縮
二重インデックスアダプターをユニバーサルアダプターに交換する変更を行って、実施例5または6の一般的な方法を用いて核酸サンプルを調製した。ユニバーサルアダプターをライゲートした後、アダプターライゲートされた試料核酸ライブラリの増幅は、バーコード化プライマーライブラリで行われ、バーコード化アダプターライゲートされた試料核酸ライブラリを生成した。その後、このライブラリは、類似する濃縮、精製およびシーケンシングの工程に晒された。ユニバーサルアダプターの使用は、同等の、またはより優れたシーケンシング結果をもたらした(図6Aおよび図6B)。
実施例9.修飾塩基を含むユニバーサルアダプターを用いるライブラリ調製
ユニバーサルアダプターが少なくとも1つのロックド核酸または架橋核酸を含むという変更を行った実施例8の一般的な方法を用いて、核酸サンプルを調製する。ユニバーサルアダプターをライゲートした後、アダプターライゲートされた試料核酸ライブラリの増幅が、バーコード化プライマーライブラリで行われ、バーコード化アダプターライゲートされた試料核酸ライブラリを生成する。その後、このライブラリは、類似する濃縮、精製およびシーケンシングの工程に晒される。
実施例10.短いバーコード化プライマーを有するユニバーサルアダプターを用いるライブラリ調製
バーコード化プライマーの各々がユニバーサルアダプターの全長よりも短い長さに結合するという変更を行った実施例8の一般的な方法を用いて、核酸サンプルを調製する。
実施例11.核酸塩基アナログ含有ユニバーサルアダプターを用いるライブラリ調製および短いバーコード化プライマーを用いる増幅
二重インデックスアダプターが、1つ以上の核酸塩基アナログ(例えば、ロックド核酸または架橋核酸)を含むユニバーサルアダプターと取り替えられるという変更を行った実施例8の一般的な方法を用いて、核酸サンプルを調製する。ユニバーサルアダプターをライゲートした後、アダプターライゲートされた試料核酸ライブラリの増幅が、バーコード化プライマーライブラリで行われ、バーコード化アダプターライゲートされた試料核酸ライブラリを生成する。バーコードの各々はユニバーサルアダプターの全長よりも短い長さに結合する。その後、このライブラリは、類似する濃縮、精製およびシーケンシングの工程に晒される。
実施例12.ユニバーサルアダプターと標準的な二重インデックスアダプターを用いて調製されたシーケンシングライブラリの比較
10bpの二重インデックスを含むユニバーサルアダプターが利用された(8つのPCRサイクル、N=12)という変更を行った実施例8の一般的な方法を用いて、核酸サンプルをゲノムDNA(50ngのNA12878)から調製した。比較のために、標準的な完全長のYアダプターも、同じゲノムDNA試料(10のPCRサイクル、N=12)について試験した。ユニバーサルアダプターを利用するプロトコルは、増幅後の高い全収率(図23)と、低いアダプター二量体形成(図24)をもたらした。
実施例13.10bpのUDIユニバーサルアダプターと8bpのコンビナトリアルデュアルプライマーを用いて調製されたシーケンシングライブラリの比較。
10bpのインデックス配列(N=96)または8bpのインデックス配列(N=96)のいずれかを含むユニバーサルプライマーが、ライブラリの最終増幅工程に使用されたという実施例8の一般的な方法を用いて、核酸サンプルをゲノムDNA(NA12878)から調製した。相対的なシーケンシングパフォーマンスは、各デザインの完全なインデックスリードの合計数を正規化して、トップのパフォーマーに正規化することで、算出され、結果として得られた各集団の分布は、直接比較するために、算出された平均値を中心とした。10bpのユニバーサルプライマーを用いた実験は、より厳格な相対的なパフォーマンスと、より均一なシーケンシング表現を示し(図25Aおよび25B)、96の固有のインデックスすべてにおいて相対的なパフォーマンスが高かった(図26)。
実施例14.固有の二重インデックスライブラリのスクリーニングおよび評価
実施例13の一般的な手順に従って、固有の二重インデックス配列を含む1,152のライブラリを構築し、均等なシーケンシングパフォーマンスを得るために反復的にスクリーニングした(図27A)。ライブラリは、酵素による断片化を用いて生成され、ヒトゲノム材料をインサートとして含んでいた。個々のライブラリを質量によってプールし、NextSeq 500/550 High Output v2キットを用いて配列決定して、2×10bpのインデックスリードを生成した。インデックスリード個々の対(許可されたミスマッチは1回)の合計数を測定し、平均値に対する各対の相対的なパフォーマンスを算出した。その結果、単一の大きなプール(図27B)としても、または、4×96メンバーの個々のセット(図27C-27F)としても、±25%の平均値に対するシーケンシングパフォーマンスをもたらした384のUDI配列が同定された。
実施例15:様々なエクソーム標的化ポリヌクレオチドプローブライブラリを用いたゲノムDNAキャプチャー
ヒトエクソームを標的とする少なくとも50万の非同一ポリヌクレオチドを含むポリヌクレオチド標的化ライブラリを、実施例3の一般的な方法を用いるホスホラミダイト化学、および、実施例5の一般的な方法を用いて制御された化学量論によって、設計して構造体上で合成することで、ライブラリ4Aを生成した。その後、このポリヌクレオチドをビオチンで標識し、溶解して、エクソームプローブライブラリ溶液を形成した。実施例5の一般的な方法を用いて、ゲノムDNA(gDNA)試料から乾燥したインデックス化ライブラリプールを得た。
様々なプローブライブラリを用いるDNAキャプチャーは、実施例6に記載される方法を用いて行われた。簡潔に説明すると、エクソームプローブライブラリ溶液、ハイブリダイゼーション溶液、遮断薬ミックスA、および遮断薬ミックスBを混合し、ハイブリダイゼーションミックス/プローブ溶液を調製した。ハイブリダイゼーション反応を行った後、キャプチャー反応を行った。その後、溶液を増幅させて、次世代シーケンシング(NGS)を行った。
ライブラリ4Aは、実施例6に記載された対照薬キットDを含む様々な対照薬エクソームキャプチャーキットと比較された。NGS測定基準の概要は、ライブラリ4Aを用いる様々な対照薬エクソームキャプチャーキットの表10に示される。
Figure 2022521766000013
様々なライブラリを、均一性、特異性、および重複率について評価した。図28Bに見られるように、ライブラリ4Aは、対照薬キットと比較して、標的の濃縮効率(fold-80 base penaltyによって測定される)を35-60%増加させた。図28C-28Dに見られるように、ライブラリ4Aは、特異性およびオンターゲット率を増加させた。オンターゲット率は、オンターゲット塩基をアラインメントされたPF塩基で割った値として測定された。ライブラリ4Aは、図28E-28Fに見られるように、重複率によって示されるように、改善されたオリゴヌクレオチド合成、最適化された二本鎖プローブ、および互換性のある緩衝液とワークフローを示した。
様々なライブラリを、カバレッジの深度と最大シーケンシング出力についても評価した。図29に見られるように、ライブラリ4Aを使用する150倍の総合的な生のシーケンシングでは、30倍で95%の標的塩基がカバーされた。表11は、ライブラリ4Aが最大配列出力を最大化したことを示している。
Figure 2022521766000014
実施例16.柔軟かつモジュール式のカスタムパネル
内容物は添加または増強可能である。図30A-図30Bを参照。パネルに内容物を加えることで、カバーされる標的の数が増える。パネルに内容物を増強することは、特定の領域のカバレッジを意味する。
RefSeqデータベースに由来する3Mbのさらなる標的領域が追加された。このパネルを作成することで、カバレッジが増加し、パフォーマンスは低下しなかった。カバレッジは、RefSeq、CCDS、およびGENCODEのデータベースの99%以上に改善した。さらに、カスタムパネルは高い均一性とオンターゲット率、および低い重複率を示した(すべての結果は150倍のシーケンシングに基づく)。
表12に見られるようなデータベースのカバレッジは、本明細書に記載されるようなカスタムパネルを使用して増加した。データは、2018年5月現在(UCSCゲノムブラウザ)の一次ヒトゲノムアセンブリ(代替染色体は除外された)に注釈をつけたデータベースにおけるタンパク質コード領域へのパネル内容物の重複を比較した。対照薬A1、対照薬A2、および対照薬Dは、市販の対照薬パネルである。比較は、BEDtoolsスイートおよび括弧内に示されたゲノムバージョンを用いて行われた。3Mbの内容物を追加することで、RefSeqとGENCODEのデータベースのカバレッジを99%以上に向上させた。
Figure 2022521766000015
図30C-30Eは、パネル1とパネル1+補足プローブ(Supplemental Probes)on Fold(図30C)、重複率(図30D)、およびオンターゲットパーセント(図30E)のデータを示す。図30Fと図30Gは、標的カバレッジ(図30F)とfold-80 base penalty(図30G)の比較データを示す。
図30Hは、本明細書に記載されるライブラリの調整可能な標的カバレッジを示す。図30Hの上部パネルに見られるように、34.9の平均カバレッジがあり、20倍以上で標的塩基の91%が観察された。図30Hの下部パネルに見られるように、67.5の平均カバレッジがあり、20倍以上で標的塩基の97%が観察された。
実施例17.RefSeqデザイン
RefSeqパネルデザインはhg38で設計され、CCDS21、RefSeq全コード領域、およびGENCODE v28塩基コード配列の組み合わせを含んでいた。RefSeq単独(Exome)のサイズは3.5Mbであり、Core Exome+RefSeqの組み合わせ(Exome+RefSeq)は36.5Mbであった。実験は、50ngのgDNA(NA12878)を1プレックスおよび8プレックスとして3回繰り返してランし、76bpリードの150倍のシーケンシングで評価した。標的ファイルは36.5Mbであった。図31Aを参照する。
RefSeqパネルデザインを、カバレッジの深度、特異性、均一性、ライブラリの複雑さ、重複率、およびカバレッジ率について評価した。図31B-31Cはカバレッジの深度を示す。20倍で95%を超える標的塩基が観察された。30倍で90%を超える標的塩基が観察された。図31Dは、RefSeqパネルの特異性を示す。オフターゲットパーセントは0.2未満であった。図31Eは、RefSeqパネルの均一性を示す。fold80は1.5未満であった。図31Fは、ライブラリの複雑さを示す。ライブラリサイズは3億2,000万より大きかった。図31Gは、RefSeqパネルの重複率を示す。重複率は4%未満であった。図31HはRefSeqパネルのカバレッジ率を示す。カバレッジ率は0.9-1.1の間であった。図31Hで見られるように、カバレッジ比は1.1未満であった。
実施例18.一連のパネルサイズおよび標的領域でのカスタムパネルデザイン
実施例6の一般的な方法を用いて、シーケンシングデータを取得した。ライブラリの詳細が表13で見られる。簡潔に説明すると、製造業者の推奨事項に従って、シングルプレックスプールあたり500ngのgDNA(NA12878;Coriell)を使用して、本明細書で設計された複数の標的濃縮パネルを使用して、ハイブリッドキャプチャーを実施した。2x76ペアエンドのリードを生成するために、NextSeq 500/550 High Output v2キットを用いてシーケンシングを行った。データを標的サイズの150倍にダウンサンプリングし、20のマッピング品質、N=2のPicard測定基準を用いて解析した。パネルは、均一性の改善および低い重複率と同様に、高い割合のオンターゲットリードをもたらした。図32A-32Bは、30倍のカバレッジを達成した各パネルのリードの割合を示し、図32Cは均一性(fold-80)を示している。
Figure 2022521766000016
実施例19.濃縮ワークフロー
濃縮ワークフロータイムラインが図33Aに見られる。実施例6の一般的な方法を用いて、シーケンシングデータを取得した。簡潔に説明すると、ゲノムDNA(NA12878、Corriell)をハイブリダイズし、エクソームパネルまたはカスタムパネルを用いてキャプチャーした。2つの異なるプローブライブラリ(エクソームプローブまたはカスタムパネル)を核酸試料にハイブリダイゼーションする間、「高速」ハイブリダイゼーション緩衝液を液体ポリマーとともに使用し、キャプチャー/ハイブリダイゼーション反応を、85℃の蓋の温度にて、PCRサーモサイクラー中で様々な時間に渡って65℃で加熱した。シーケンシング後に、デフォルト値を有するPicard HS_Metricツール(Pct_Target_Bases_30X)をシーケンシング分析に使用した。いずれのパネルについても、高速ハイブリダイゼーション溶液中での15分間のハイブリダイゼーションは、図33Bに見られるように、16時間の標準ハイブリダイゼーションと同等のパフォーマンスをもたらし、ハイブリダイゼーション時間の増加は、従来のハイブリダイゼーション緩衝液を使用した標準プロトコルよりもパフォーマンスを向上させた。
実施例20.ナノボールシーケンシングを用いる標的濃縮
標的濃縮パネルは、ナノボールシーケンシングを用いて配列決定された。簡潔に説明すると、ナノボールシーケンシングは、ローリングサークル増幅(RCA)を用いて、ゲノムDNAの断片をDNAナノボールに増幅する。DNAナノボールをフローセルに吸着させ、各位置での蛍光を測定し、塩基を同定するために使用する。
2つの異なる挿入サイズのライブラリを作製し、ナノボールシーケンシングを用いて配列決定した。環状化アダプターは、ナノボールシーケンシングに適合した。ライブラリを、オンターゲット率、特異性、重複率、カバレッジについて評価した。図34A~34Dに見られるように、環状化アダプターを用いた場合、オンターゲット率の割合が40%から75%に増加し(図34A)、fold80が約1.45で均一性が非常に高く(図34B)、重複率が約3%で低く(図34C)、30倍のカバレッジ以上で標的塩基が約92%であることが観察された(図34D)。
実施例21.アダプターのステム領域に結合するブロッカー
異なる市販されているアダプター系は、異なるステム(Yステム、ヨーク)長および溶融温度(表14)を含み、例えば、標準的なデュアルバーコードアダプター系T;トランスポザーゼアダプター系N;およびナノボールベースのシーケンシングに設計されたアダプター系Bなどがある。
Figure 2022521766000017
実施例19の一般的な手順に従って、ロックド核酸(LNA)を含むブロッキング核酸を、濃縮/キャプチャーの間にNアダプター系と共に使用し、観察された「オフベイト」の割合(任意のベイト領域、OFF_BAIT_BASES/PF_BASES_ALIGNEDから離れてマッピングされたPF_BASES_ALIGNEDの割合)の関数としてのNGSパフォーマンスを測定した。一般に、アダプターステム領域にアニーリングするロックド核酸の数を増やすと、オフベイトパフォーマンスが悪くなった(表15)。
Figure 2022521766000018
理論に拘束されることなく、いくつかの例におけるパフォーマンスの低下は、望ましくないハイブリダイゼーション種集団B-D(図36B-36D)の増加、および所望の種集団A(図36A)の減少によって引き起こされる可能性がある。表16を参照されたい。
Figure 2022521766000019
実施例22.プッシュプル式のユニバーサルブロッカー
ユニバーサルブロッカーは、標的配列との結合親和性を増加させる領域と低下させる領域の両方を持つように設計されることで、親和性の全体的な正味の増加と標的濃縮中のオフベイトパフォーマンスの向上をもたらすことができる。このようなデザインは、以下のような利点をもたらす:1)各領域は、標的濃縮適用の際のオフベイト活性の任意の所望のレベルに合わせて、理論的または経験的に調整することができる;2)各領域は、標的配列に対する分子の全体的な親和性を増加または減少させることができる、単一タイプの化学修飾または複数タイプの化学修飾のいずれかで変更することができる;3)他の修飾(例:LNAおよびBNA)で最適なパフォーマンスを得るためには、ブロッカーセットの個々のメンバーすべての融解温度を特定の温度以上に保たなければならない;4)任意のブロッカーのセットは、インデックスの長さとは無関係に、インデックスの配列とは無関係に、ハイブリダイゼーションにおけるアダプターインデックスの数とは無関係に、オフベイトのパフォーマンスを向上させる。
ユニバーサルブロッカーのYステムアダプターアニーリング部分に対処する一つのアプローチは、DNA改変を完全に取り除き、およびこの問題のある領域に標準的なA、C、G、およびTの塩基のみを持つブロッカーを設計することである。また、任意の領域に対する結合親和性を減少させるさらなるDNA修飾を追加する可能性もある。これが、結合親和性を増加させるためのDNA改変を導入された領域を伴う場合、所定の標的領域に対する親和性を増加させた領域と減少させた領域の両方を有するように設計されたブロッカーオリゴを作成することができる。化学合成時に導入可能な市販の修飾の例は、2’-デオキシイノシンである。
いくつかのデザインは、アダプターバーコードをカバーするために、これらのタイプの部分のストレッチ(長さ6~10bp)を利用しているが、融解温度(Tm)を下げるために、配列全体にまばらに利用することもできる。以下に、ランダムな18bpの配列を、異なる数の2’-デオキシイノシン部分を含まない場合と含む場合で示しており、Tmを所望の標的に調整できることを実証している(表17)。このような配列を、Tmを増加させる部分を含む配列と連結すると、様々な熱力学的特性を持つハイブリッド分子を生成することができる。このようなハイブリッド分子では、特定の領域を特定の融解温度に熱力学的に調整することで、特定の標的配列に対する親和性を回避または増加させることができる。このような修飾の組み合わせは、特定の固有のアダプター配列に対するブロッカー分子の親和性を増加させ、繰り返されたアダプター配列(例えば、アダプターのYステムアニーリング部分)に対するブロッカー分子の親和性を減少させるのに役立つように設計されている。理論に束縛されることなく、このようなデザインは、標的濃縮ワークフロー中のハイブリダイゼーションの文脈において、望ましい集団に対する結合を増加させ、望ましくない集団に対する結合を減少させることができる。
固有の領域において親和性を増加させる部分の数を一定に保ち、アダプターのYステム部分に結合する領域における親和性を減少させる部分の数を増やした例が表17に提示されている。
Figure 2022521766000020
ブロッカーのYステムアニーリング領域における親和性を減少させるDNA修飾の数を増やすと、「A」および「D」の集団が支配的になり、いずれかが所望の効果(A、図36A)または最小の効果(D、図36D)を有する(表18)。ブロッカーのYステムアニーリング領域において親和性を減少させるDNA修飾の数が減少すると、集団「B」および「C」が支配的になり、デイジーチェーンまたは他のアダプターへのアニーリングが発生する望ましくない効果を(「B」、図36B)有し、あるいはそれらが適切に機能しない場合にはブロッカーを隔絶(sequester)する(「C」、図36C)。
Figure 2022521766000021
実施例23.ユニバーサル塩基でインデックスをカバーするユニバーサルアダプター
単一または二重のインデックスアダプターデザインの両方のインデックスは、アダプターインデックス塩基をカバーするために特別に設計されたDNA修飾で拡張されたユニバーサルブロッカーによって部分的または完全にカバーされる。このようなデザインは、以下のような潜在的な利点を提供する:1)インデックスのいずれかの側から様々な長さのバーコードを部分的または完全にカバーするように調整される;2)他の修飾(例えば、LNAおよび/またはBNA)で最適なパフォーマンスを得るために、ブロッカーセットの個々のメンバーすべての融解温度を特定の温度以上に保つ;および、3)インデックスの長さが定義された最小の長さ以上であれば、配列とは関係なく、および、ハイブリダイゼーションにおいていくつのアダプターインデックスが存在するかとは関係なく、所定のブロッカーセットはオフベイトのパフォーマンスを向上させる。
ブロッカーは、アダプターインデックスの一部ではない領域に結合するように設計されている(図37A)。その結果、このデザインのすべてのインデックス塩基は完全に露出したままとなる(すなわち、図37Aの’1|2|3|......|(n-1)|n’)。このデザインは、インデックス塩基をカバーするためにブロッカーを拡張する様々な部位でも拡張される。このような方法でインデックス塩基をカバーすることは、二重インデックスシステムの個々のインデックスが2’-デオキシイノシン部分の3bpまたは5bpのストレッチのいずれかによって片側からカバーされる場合に、標的濃縮の間にオフベイトパフォーマンスを高めることが実証されている(図37B)。 そのような様式でインデックス塩基をカバーすることは、二重インデックス系の個別のインデックスが2’-デオキシイノシン部分(図37B)の3bpあるいは5bpのストレッチによって単一の側からカバーされる場合に、標的の濃縮中にオフベイトパフォーマンスを増強するとを実証されている。追加のデザインは図37C-37Gを含む。
実施例19の基本手順に従って、33.1mbのエクソームパネルは2時間のハイブリダイゼーション時間のキャプチャーに使用され、NGS測定基準が得られた。a)パーセントオフベイト(PCT_OFF_BAIT)、(b)均一性(FOLD_80_BASE_PENALTY)、および(c)カバレッジの深度(PCT_TARGET_BASES_30)について改善が観察された(図38、表19)。このような変更は、次世代シーケンシングマシン(例えば、IlluminaのNGS NovaSeqプラットフォーム)に載せることができる試料数に大きな影響を与える可能性がある。
Figure 2022521766000022
実施例24.標的とされたメチル化シーケンシングのためのエクソーム濃縮
材料および方法。NA12878(Coriell Institute)およびEpiScope(登録商標)の低メチル化および高メチル化gDNA対照(それぞれ5%未満および95%を超えるメチル化HCT116 DKO gDNA)から得られたゲノムDNA試料を機械的にせん断し、~300bpのサイズにした(Covaris(登録商標)ME220上)。せん断された低メチル化および高メチル化の対照を混ぜることによって、様々なシミュレートされたメチル化レベルの試料を調製した。入力された500ngのgDNAをSwift Accel-NGS(登録商標)Methyl-seq DNA Library Kitに入れ、バイサルファイト処理(Zymo EZ DNA Methylation-Lightning Kit)、Omega Bio-Tek Mag-Bind RxnPure Plus SPRI Beads、およびKAPA HiFi Uracil+ DNA Polymeraseと組み合わせた。入力された200ngのgDNAをNEBNext(登録商標)Enzymatic Methyl-seq Kitに投入した。せん断された試料とライブラリは、Agilent BioAnalyzer 7500とInvitrogen Qubit Broad Range Kitsで検証された。
実施例19の一般的なプロトコルに従って、高速ハイブリダイゼーション緩衝液が、様々な標的サイズ(0.05、1.0、1.5、および3.0Mb)の範囲をカバーする4つのメチル化パネルを用いる4時間のハイブリダイゼーションに使用された。各シングルプレックスキャプチャーに200ngのライブラリを使用し、その後、v2.5 High Output Kitを備えたIllumina NextSeq 550で2x151bpシーケンシングを行った。アラインメントおよびメチル化解析は、試料あたり250倍の生のカバレッジになるようにサンプリングした後に、Bismark 19.1およびPicard HsMetricsを用いて行われた。
結果。キャプチャー前の変換により、高感度のエピジェネティックな適用が可能になるが、重要な課題は変換後のゲノムの複雑さが減少することに由来する。非メチル化パネルと比較すると、これにより、一般的にオフターゲットが著しく高くなり(50~60%を超えるレベル)、ベイトのシーケンシングカバレッジが低下し、キャプチャーの均一性が大幅に減少する(fold-80 base penalty値は2.5を超える)。広範囲の異なるメチル化標的をカバーするパネルのうち3つから得られた結果を、図42A-42Dに示す。評価されたパネルは、オフターゲット値が27%と低いことを示した。0.05Mbのパネルは、他の3つのパネルと比較して高いオフターゲットを示した。理論に束縛されることなく、これは、標的サイズが非常に小さいことに起因していると考えられる。キャプチャー均一性は2.5倍以上のfold80であり、1.75と1.5という低い値に達した。重複率は、試験した4つのパネルすべてにおいて非常に低く、キャプチャー工程が効率的で、ワークフロー全体を通して高い試料複雑性を維持することができることを示している。全体として、250倍の生のシーケンシングカバレッジでは、最小のパネルであっても、20倍で84%を超え、30倍で70%を超える塩基の生のカバレッジが達成された。
適応パネルデザイン最適化アルゴリズムは、キャプチャー実験からの経験データを用いて特定のプローブの特徴を学習して、パフォーマンスを定量的に調整することができる。この方法は、高いオフターゲット率を抑制することが優先事項となるメチル化パネルに特に有効である。さらに、30,000を超えるメチル化標的について収集されたデータを用いて、情報量の多い配列の特徴を導き出し、3段階のストリンジェンシーで最適化されたデフォルトパネルデザインを開発した。1Mbパネルは、低、中、および高のストリンジェンシーを有するデフォルトパネルの例として使用されたが、これは、オフターゲット率の制御を増加させる一方で、他の主要な測定基準ではわずかな変化しかもたらさない(図43A-43D)。
可能なメチル化レベルの範囲にわたる適合性を評価するために、中程度のストリンジェンシーの1Mbパネルのキャプチャーを、それぞれ0、25、50、75、および100%のメチル化の最終比率に混合された低メチル化および高メチル化の細胞株から生成されたgDNAライブラリを用いて行った。図44A-44Dは、主要なキャプチャー測定基準を強調しており、バーは平均値を示し、標準誤差はメチル化度の異なる試料間のキャプチャーパフォーマンスのばらつきを表している。測定基準は、メチル化レベルの変化に対してほとんど~まったく反応しないことから、低メチル化および高メチル化のDNAを含む幅広いメチル化状態に対するシステムの適合性を実証している。
プロモーターおよびその他の制御要素のメチル化レベルの変化は、癌の早期発見に利用可能な最も感度の高いマーカーの一つとして注目されている。標的メチル化シーケンシングは、様々なレベルのDNAメチル化を検出および定量化することができる。低メチル化DNAと高メチル化DNAは異なる比率で混合され、1Mbパネルでのキャプチャーに使用された。図45Aおよび45Bは、特定の癌(例えば、乳癌)においてメチル化状態を変化させることが知られている、臨床的に関連するサイクリンD2座の標的および個々のCpG部位に沿った、異なるDNAメチル化レベルの検出を強調している。メチル化されたシトシンを検出することは、非メチル化シトシンのチミンへの変換を含むが、メチル化されたシトシンは変換から保護される。従来、変換は化学的なバイサルファイト方法を介して生じた。この分野では、非メチル化シトシンの酵素変換を含む他の方法が採用される割合が増加している。それぞれの変換方法には、変換反応条件に対する酵素の潜在的な感度の大きさ、またはバイサルファイトによるDNAの文脈に偏った分解などの長所と短所がある。
本明細書のパネル合成によるメチル化シーケンシングは、酵素的アプローチおよびバイサルファイトアプローチの両方に適合した(図46A-46D)。非CpG部位で変換されたシトシンの割合として測定された変換率は、両方の方法で99.5%を超えていた(図47)。全体的なキャプチャー測定基準は、両方のライブラリ調製法でも比較的に同じ順序であったが、均一性およびオフターゲットなどの特定の測定基準は、バイサルファイト方法では減少した。理論に束縛されることなく、均一性の低下は、少なくとも部分的には、バイサルファイトベースのライブラリ調製法によって導入された固有のGCバイアスに起因すると考えられる(データは示されていない)。
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。

Claims (59)

  1. ポリヌクレオチドであって、該ポリヌクレオチドは、
    第1の末端アダプタ領域、第1の非相補的領域、および第1のヨーク領域を含む第1の鎖と、
    第2の末端アダプタ領域、第2の非相補的領域、および第2のヨーク領域を含む第2の鎖と
    を含み、
    前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的ではなく、前記第1のヨーク領域または前記第2のヨーク領域は少なくとも1つの核酸塩基アナログを含む、ポリヌクレオチド。
  2. 前記核酸塩基アナログは、前記第1のヨーク領域を前記第2のヨーク領域に結合するTを増加させる、請求項1に記載のポリヌクレオチド。
  3. 前記核酸塩基アナログはロックド核酸(LNA)または架橋核酸(BNA)である、請求項1または2に記載のポリヌクレオチド。
  4. 相補的な前記第1のヨーク領域と前記第2のヨーク領域は、それぞれ長さ15未満の塩基である、請求項1から3のいずれか1つに記載のポリヌクレオチド。
  5. 相補的な前記第1のヨーク領域と前記第2のヨーク領域は、それぞれ長さ10未満の塩基である、請求項1から3のいずれか1つに記載のポリヌクレオチド。
  6. 相補的な前記第1のヨーク領域と前記第2のヨーク領域は、それぞれ長さ6未満の塩基である、請求項1から3のいずれか1つに記載のポリヌクレオチド。
  7. 前記ポリヌクレオチドはバーコードまたはインデックス配列を含まない、請求項1から6のいずれか1つに記載のポリヌクレオチド。
  8. ポリヌクレオチドであって、該ポリヌクレオチドは、
    二重試料核酸と、
    前記二重試料核酸の5’末端にライゲートされる第1のポリヌクレオチドと、
    前記二重試料核酸の3’末端にライゲートされる第2のポリヌクレオチドと
    を含み、
    前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドは、
    第1の末端アダプタ領域、第1の非相補的領域、および第1のヨーク領域を含む第1の鎖と、
    第2の末端アダプタ領域、第2の非相補的領域、および第2のヨーク領域を含む第2の鎖と
    を含み、
    前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的ではなく、前記第1のヨーク領域または前記第2のヨーク領域は少なくとも1つの核酸塩基アナログを含む、ポリヌクレオチド。
  9. 前記二重試料核酸はDNAである、請求項8に記載のポリヌクレオチド。
  10. 前記二重試料核酸はゲノムDNAである、請求項8に記載のポリヌクレオチド。
  11. 前記ゲノムDNAはヒト由来のものである、請求項10に記載のポリヌクレオチド。
  12. 前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドは、少なくとも1つのバーコードを含む、請求項8から11のいずれか1つに記載のポリヌクレオチド。
  13. 前記少なくとも1つのバーコードは、少なくとも長さ8の塩基である、請求項12に記載のポリヌクレオチド。
  14. 前記少なくとも1つのバーコードは、少なくとも長さ12の塩基である、請求項12に記載のポリヌクレオチド。
  15. 前記少なくとも1つのバーコードは、少なくとも長さ16の塩基である、請求項12に記載のポリヌクレオチド。
  16. 前記少なくとも1つのバーコードは、長さ8~12の塩基である、請求項12に記載のポリヌクレオチド。
  17. 前記第1のポリヌクレオチドは第1のバーコードと第2のバーコードを含み、前記第2のポリヌクレオチドは第3のバーコードと第4のバーコードを含む、請求項12から15のいずれか1つに記載のポリヌクレオチド。
  18. 前記第1のバーコードと前記第3のバーコードが同じ配列を有し、前記第2のバーコードと前記第4のバーコードが同じ配列を有する、請求項17に記載のポリヌクレオチド。
  19. 前記ポリヌクレオチドにおける各バーコードは固有の配列を含む、請求項17に記載のポリヌクレオチド。
  20. 試料核酸を標識する方法であって、該方法は、
    (1)アダプタでライゲートされた試料核酸を生成するために少なくとも1つのポリヌクレオチドを少なくとも1つの試料核酸にライゲートする工程であって、前記ポリヌクレオチドは、第1のプライマー結合領域、第1の非相補的領域、および第1のヨーク領域を含む第1の鎖と、第2のプライマー結合領域、第2の非相補的領域、および第2のヨーク領域を含む第2の鎖とを含み、前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的でない、工程と、
    (2)少なくとも1つのアダプタでライゲートされた試料核酸を第1のプライマーおよびポリメラーゼと接触させる工程であって、前記第1のプライマーは、第3のプライマー結合領域と、第4のプライマー結合領域と、少なくとも1つのバーコードとを含み、前記第3のプライマー結合領域は、少なくとも1つのポリヌクレオチドの長さ未満に対して相補的であり、前記第1のプライマー結合領域に相補的である、工程と、
    (3)少なくとも1つのアダプタでライゲートされた増幅試料核酸を生成するために前記アダプタでライゲートされた試料核酸を伸長させる工程であって、前記アダプタでライゲートされた増幅試料核酸は少なくとも1つのバーコードを含む、工程と
    を含む、方法。
  21. 前記第1のプライマーと前記第2のプライマーは、それぞれ長さ30未満の塩基である、請求項20に記載の方法。
  22. 前記プライマーは長さ20未満の塩基である、請求項20に記載の方法。
  23. 前記ポリヌクレオチドはバーコードを含まない、請求項20に記載の方法。
  24. 前記プライマーは1つのバーコードを含む、請求項20から23のいずれか1つに記載の方法。
  25. 前記少なくとも1つのバーコードがインデックス配列を含む、請求項20から24のいずれか1つに記載の方法。
  26. 前記少なくとも1つのバーコードは、少なくとも長さ8の塩基である、請求項20から25のいずれか1つに記載の方法。
  27. 前記少なくとも1つのバーコードは、少なくとも長さ12の塩基である、請求項20から25のいずれか1つに記載の方法。
  28. 前記少なくとも1つのバーコードは、少なくとも長さ16の塩基である、請求項20から25のいずれか1つに記載の方法。
  29. 前記少なくとも1つのバーコードは、長さ8~12の塩基である、請求項20から25のいずれか1つに記載の方法。
  30. 前記インデックス配列は、同じソース由来の試料核酸のライブラリによくみられるものである、請求項25から29のいずれか1つに記載の方法。
  31. 前記少なくとも1つのバーコードは固有の分子識別子(UMI)を含む、請求項24から30のいずれか1つに記載の方法。
  32. 2つのポリヌクレオチドが前記少なくとも1つの試料核酸にライゲートされる、請求項20から31のいずれか1つに記載の方法。
  33. 第1のポリヌクレオチドが前記試料核酸の5’末端に、第2のポリヌクレオチドが前記試料核酸の3’末端にライゲートされる、請求項32に記載の方法。
  34. 前記方法が、
    (4)少なくとも1つのアダプタでライゲートされた試料核酸を第2のプライマーおよびポリメラーゼと接触させる工程であって、前記第2のプライマーは、
    第5のプライマー結合領域と、
    第6のプライマー結合領域と、
    少なくとも1つのバーコードと
    を含み、前記第6のプライマー結合領域は、少なくとも1つのポリヌクレオチドの長さ未満に対して相補的であり、前記第5のプライマー結合領域は前記第2のプライマー結合領域に相補的である、工程と、
    (5)少なくとも1つのアダプタでライゲートされた増幅試料核酸を生成するために前記ポリヌクレオチドを伸長させる工程であって、前記アダプタでライゲートされた増幅試料核酸は少なくとも1つのバーコードを含む、工程と
    をさらに含む、請求項20から33のいずれか1つに記載の方法。
  35. 前記アダプタでライゲートされた試料核酸を配列決定する工程をさらに含む、請求項20から34のいずれか1つに記載の方法。
  36. 組成物であって、該組成物は、
    アダプタでライゲートされた試料核酸の1つ以上の領域に結合するよう構成される少なくとも3つのポリヌクレオチドブロッカーであって、前記アダプタでライゲートされた試料核酸は、
    i)第1の非相補的領域、第1のインデックス領域、第2の非相補的領域、第1のヨーク領域、および
    ii)第3の非相補的領域、第2のインデックス領域、第4の非相補的領域、および第2のヨーク領域
    を含み、前記第1のヨーク領域と前記第2のヨーク領域は相補的であり、前記第1の非相補的領域と前記第2の非相補的領域は相補的でなく、
    前記アダプタでライゲートされた試料核酸はさらに、
    iii)前記第1のヨーク領域および前記第2のヨーク領域に隣接するゲノムインサート
    を含み、少なくとも1つのポリヌクレオチドブロッカーは、前記第1のヨーク領域または前記第2のヨーク領域に相補的ではなく、かつ、前記ポリヌクレオチドブロッカーと前記アダプタでライゲートされた試料核酸との結合を増大させるように構成される少なくとも1つのヌクレオチドアナログを含む、組成物。
  37. 少なくとも2つのポリヌクレオチドブロッカーが、前記第1のヨーク領域または前記第2のヨーク領域に相補的ではなく、かつ、それぞれ、前記ポリヌクレオチドブロッカーと前記アダプタでライゲートされた試料核酸との結合を増大させるように構成される少なくとも1つの修飾核酸塩基を含む、請求項36に記載の組成物。
  38. 少なくとも1つのインデックス領域はバーコードまたは固有の分子識別子を含む、請求項36に記載の組成物。
  39. 少なくとも1つのインデックス領域は長さ5~15の塩基である、請求項36に記載の組成物。
  40. 前記ポリヌクレオチドブロッカーの少なくとも1つは、少なくとも1つのユニバーサル塩基を含む、請求項36に記載の組成物。
  41. 前記少なくとも1つのユニバーサル塩基は、5-ニトロインドールまたは2-デオキシイノシンである、請求項40に記載の組成物。
  42. 前記少なくとも1つのユニバーサル塩基は、少なくとも1つのインデックス配列と重なるように構成される、請求項40に記載の組成物。
  43. 少なくとも2つのユニバーサル塩基は、少なくとも2つのインデックス配列と重なるように構成される、請求項40に記載の組成物。
  44. 前記ポリヌクレオチドブロッカーの少なくとも2つが少なくとも1つのユニバーサル塩基を含み、前記少なくとも1つのユニバーサル塩基はそれぞれ、少なくとも1つのインデックス配列と重なる、請求項40に記載の組成物。
  45. 重なりは長さ2~10の塩基である、請求項42または43に記載の組成物。
  46. 前記組成物は4つ以下のポリヌクレオチドブロッカーを含む、請求項36に記載の組成物。
  47. 前記ポリヌクレオチドブロッカーは、1つ以上のロックド核酸(LNA)または1つ以上の架橋核酸(BNA)を含む、請求項36から46のいずれか1つに記載の組成物。
  48. 前記ポリヌクレオチドブロッカーは、少なくとも5つのヌクレオチドアナログを含む、請求項36から46のいずれか1つに記載の組成物。
  49. 前記ポリヌクレオチドブロッカーは、少なくとも10のヌクレオチドアナログを含む、請求項36から46のいずれか1つに記載の組成物。
  50. 前記ポリヌクレオチドブロッカーのTは少なくとも78℃である、請求項36から46のいずれか1つに記載の組成物。
  51. 前記ポリヌクレオチドブロッカーのTは少なくとも80℃である、請求項36から46のいずれか1つに記載の組成物。
  52. 前記ポリヌクレオチドブロッカーのTは少なくとも82℃である、請求項36から46のいずれか1つに記載の組成物。
  53. 前記ポリヌクレオチドブロッカーのTは80~90℃である、請求項36から46のいずれか1つに記載の組成物。
  54. 核酸ハイブリダイゼーションのための方法であって、
    複数のゲノムインサートを含む、アダプタでライゲートされた試料核酸ライブラリを提供する工程と、
    前記アダプタでライゲートされた試料核酸ライブラリを、請求項36から53のいずれか1つに記載の組成物の存在下で少なくとも5000のポリヌクレオチドプローブを含むプローブライブラリと接触させる工程と、
    プローブの少なくとも一部を前記ゲノムインサートにハイブリダイズする工程と
    を含む、方法。
  55. 前記試料核酸ライブラリが少なくとも100万の固有ゲノムインサートを含む、請求項54に記載の方法。
  56. 前記ゲノムインサートの少なくとも一部はヒトDNAを含む、請求項54に記載の方法。
  57. 濃縮された試料核酸ライブラリを生成する工程をさらに含む、請求項54に記載の方法。
  58. 前記濃縮された試料核酸ライブラリを配列決定する工程をさらに含む、請求項57に記載の方法。
  59. 前記試料核酸ライブラリは、次世代シーケンシングのために構成されるアダプタを含む、請求項54から58のいずれか1つに記載の方法。
JP2021549708A 2019-02-25 2020-02-21 次世代シーケンシングのための組成物および方法 Pending JP2022521766A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962810321P 2019-02-25 2019-02-25
US62/810,321 2019-02-25
US201962914904P 2019-10-14 2019-10-14
US62/914,904 2019-10-14
US201962926336P 2019-10-25 2019-10-25
US62/926,336 2019-10-25
PCT/US2020/019371 WO2020176362A1 (en) 2019-02-25 2020-02-21 Compositions and methods for next generation sequencing

Publications (2)

Publication Number Publication Date
JP2022521766A true JP2022521766A (ja) 2022-04-12
JPWO2020176362A5 JPWO2020176362A5 (ja) 2023-03-01

Family

ID=72238617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021549708A Pending JP2022521766A (ja) 2019-02-25 2020-02-21 次世代シーケンシングのための組成物および方法

Country Status (8)

Country Link
US (2) US20210002710A1 (ja)
EP (1) EP3938505A4 (ja)
JP (1) JP2022521766A (ja)
KR (1) KR20210148122A (ja)
CN (1) CN113728100A (ja)
AU (1) AU2020227672A1 (ja)
CA (1) CA3131514A1 (ja)
WO (1) WO2020176362A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015021080A2 (en) 2013-08-05 2015-02-12 Twist Bioscience Corporation De novo synthesized gene libraries
US10669304B2 (en) 2015-02-04 2020-06-02 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
US9981239B2 (en) 2015-04-21 2018-05-29 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
KR20180050411A (ko) 2015-09-18 2018-05-14 트위스트 바이오사이언스 코포레이션 올리고핵산 변이체 라이브러리 및 그의 합성
CN113604546A (zh) 2015-09-22 2021-11-05 特韦斯特生物科学公司 用于核酸合成的柔性基底
GB2568444A (en) 2016-08-22 2019-05-15 Twist Bioscience Corp De novo synthesized nucleic acid libraries
WO2018057526A2 (en) 2016-09-21 2018-03-29 Twist Bioscience Corporation Nucleic acid based data storage
CA3054303A1 (en) 2017-02-22 2018-08-30 Twist Bioscience Corporation Nucleic acid based data storage
WO2018170169A1 (en) 2017-03-15 2018-09-20 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
AU2018284227B2 (en) 2017-06-12 2024-05-02 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
CA3075505A1 (en) 2017-09-11 2019-03-14 Twist Bioscience Corporation Gpcr binding proteins and synthesis thereof
SG11202003574TA (en) 2017-10-20 2020-05-28 Twist Bioscience Corp Heated nanowells for polynucleotide synthesis
GB2585506A (en) 2018-01-04 2021-01-13 Twist Bioscience Corp DNA-based digital information storage
GB2590196A (en) 2018-05-18 2021-06-23 Twist Bioscience Corp Polynucleotides, reagents, and methods for nucleic acid hybridization
US11492728B2 (en) 2019-02-26 2022-11-08 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
WO2020257612A1 (en) 2019-06-21 2020-12-24 Twist Bioscience Corporation Barcode-based nucleic acid sequence assembly
IL297700A (en) 2020-04-27 2022-12-01 Twist Bioscience Corp Variable libraries of nucleic acids for the coronavirus
CA3194398A1 (en) * 2020-10-05 2022-04-14 Twist Bioscience Corporation Hybridization methods and reagents
EP4229210A1 (en) 2020-10-19 2023-08-23 Twist Bioscience Corporation Methods of synthesizing oligonucleotides using tethered nucleotides
WO2022093811A1 (en) * 2020-10-26 2022-05-05 Twist Bioscience Corporation Libraries for next generation sequencing
US20220282398A1 (en) * 2021-03-05 2022-09-08 Bioo Scientific Corporation Universal blocking oligonucleotides for reduced off-target hybridization in hybridization capture methods
WO2023114432A2 (en) * 2021-12-17 2023-06-22 Twist Bioscience Corporation Compositions and methods for detection of variants
WO2024073708A1 (en) * 2022-09-29 2024-04-04 Twist Bioscience Corporation Methods and compositions for genomic analysis
CN116627972B (zh) * 2023-05-25 2024-03-01 成都融见软件科技有限公司 一种覆盖指标的结构化数据离散存储系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07509365A (ja) * 1992-07-31 1995-10-19 デイド・ベーリング・マルブルク・ゲゼルシヤフト・ミツト・ベシユレンクテル・ハフツング ポリヌクレオチド類の3’末端に特定配列を導入する方法
US5712126A (en) * 1995-08-01 1998-01-27 Yale University Analysis of gene expression by display of 3-end restriction fragments of CDNA
WO2003093504A1 (de) * 2002-05-06 2003-11-13 Noxxon Pharma Ag Verfahren zur amplifikation von nukleinsäuren
DK2828218T3 (da) * 2012-03-20 2020-11-02 Univ Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
CA2877740A1 (en) * 2012-07-03 2014-01-09 Integrated Dna Technologies, Inc. Tm-enhanced blocking oligonucleotides and baits for improved target enrichment and reduced off-target selection
CA2975855A1 (en) * 2015-02-04 2016-08-11 Twist Bioscience Corporation Compositions and methods for synthetic gene assembly
US10844428B2 (en) * 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
ES2844852T3 (es) * 2015-07-21 2021-07-22 Guardant Health Inc Acidos nucleicos bloqueados para capturar genes de fusión
WO2017100441A1 (en) * 2015-12-08 2017-06-15 Twinstrand Biosciences, Inc. Improved adapters, methods, and compositions for duplex sequencing
CN110520542B (zh) * 2017-03-23 2024-06-14 华盛顿大学 用于靶向核酸序列富集的方法及在错误纠正的核酸测序中的应用
WO2018183918A1 (en) * 2017-03-30 2018-10-04 Grail, Inc. Enhanced ligation in sequencing library preparation
SG11201909394PA (en) * 2017-04-23 2019-11-28 Illumina Inc Compositions and methods for improving sample identification in indexed nucleic acid libraries
DK3872187T3 (da) * 2017-04-23 2022-12-05 Illumina Cambridge Ltd Sammensætninger og fremgangsmåder til forbedring af prøveidentificering i indekserede nukleinsyrebiblioteker
SG11201910070PA (en) * 2017-05-08 2019-11-28 Illumina Inc Universal short adapters for indexing of polynucleotide samples
EP3649236A4 (en) * 2017-07-05 2021-04-07 The Regents of The University of California MULTIPLEX RECEPTOR LIGAND INTERACTION SCREENS

Also Published As

Publication number Publication date
CA3131514A1 (en) 2020-09-03
US20210207197A1 (en) 2021-07-08
EP3938505A4 (en) 2022-11-30
US20210002710A1 (en) 2021-01-07
CN113728100A (zh) 2021-11-30
AU2020227672A1 (en) 2021-10-07
EP3938505A1 (en) 2022-01-19
KR20210148122A (ko) 2021-12-07
WO2020176362A1 (en) 2020-09-03

Similar Documents

Publication Publication Date Title
JP2022521766A (ja) 次世代シーケンシングのための組成物および方法
KR102569164B1 (ko) 조절된 화학량론을 갖는 폴리뉴클레오티드 라이브러리 및 이의 합성
US20220106586A1 (en) Compositions and methods for library sequencing
US20220106590A1 (en) Hybridization methods and reagents
US20220135965A1 (en) Libraries for next generation sequencing
US11732294B2 (en) Polynucleotides, reagents, and methods for nucleic acid hybridization
CN109983125B (zh) 生成用于通过荧光原位测序检测的核酸序列文库的方法
US20220277808A1 (en) Libraries for identification of genomic variants
JP3793570B2 (ja) ハイブリッド形成による位置配列決定
US20220356463A1 (en) Libraries for mutational analysis
JP2018501776A (ja) 連続性を維持した転位
US20230323449A1 (en) Compositions and methods for detection of variants
CN116981771A (zh) 杂交方法和试剂
WO2023192635A2 (en) Libraries for methylation analysis
WO2024073708A1 (en) Methods and compositions for genomic analysis
CN118389650A (en) Method for generating a library of nucleic acid sequences for detection by fluorescence in situ sequencing
CZ254699A3 (cs) Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211020

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20221220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240122