JP2023516827A - 高配列忠実度の核酸合成およびアセンブリ - Google Patents

高配列忠実度の核酸合成およびアセンブリ Download PDF

Info

Publication number
JP2023516827A
JP2023516827A JP2022578942A JP2022578942A JP2023516827A JP 2023516827 A JP2023516827 A JP 2023516827A JP 2022578942 A JP2022578942 A JP 2022578942A JP 2022578942 A JP2022578942 A JP 2022578942A JP 2023516827 A JP2023516827 A JP 2023516827A
Authority
JP
Japan
Prior art keywords
nucleic acid
acid molecules
mismatch
dna polymerase
thermostable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022578942A
Other languages
English (en)
Inventor
ロバート ポッター
ニコライ ネトゥシル
Original Assignee
ライフ テクノロジーズ コーポレイション
サーモ フィッシャー サイエンティフィック ジーンアート ゲゼルシャフト ミット ベシュレンクテル ハフツング
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ライフ テクノロジーズ コーポレイション, サーモ フィッシャー サイエンティフィック ジーンアート ゲゼルシャフト ミット ベシュレンクテル ハフツング filed Critical ライフ テクノロジーズ コーポレイション
Publication of JP2023516827A publication Critical patent/JP2023516827A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本開示は、概して、低エラー率を有する核酸分子の合成のための組成物および方法に関する。例として、多くの場合では、高配列忠実度を有する核酸分子のハイスループット合成およびアセンブリのための組成物および方法が提供される。多くの場合では、熱安定性不一致認識タンパク質(例えば、熱安定性不一致結合タンパク質、熱安定性不一致エンドヌクレアーゼ)が組成物中に存在し、提供される方法を使用する。【選択図】図2

Description

本開示は、概して、低エラー率を有する核酸分子の合成のための組成物および方法に関する。例として、多くの場合では、高配列忠実度を有する核酸分子のハイスループット合成およびアセンブリのための組成物および方法が提供される。多くの場合では、熱安定性不一致認識タンパク質(例えば、熱安定性不一致結合タンパク質、熱安定性不一致エンドヌクレアーゼ)が組成物中に存在し、提供される方法を使用する。
長年にわたり、遺伝子合成は、より費用対効果が高くなり、産生される核酸分子が高配列忠実度を有するハイスループット合成プラットフォームを開発する努力がなされてきた。
高配列忠実度を有する産生される核酸分子を生成するためのプロセスにおいて使用され得る生物学的物質は、これらの物質を産生する生物とともに進化してきた。かかる生物学的物質には、プルーフリーディング能力を有するDNAポリメラーゼ、および核酸配列エラーの訂正のための様々な経路に関与する物質(例えば、不一致エンドヌクレアーゼ、不一致結合タンパク質など)が含まれる。
遺伝子工学の進歩に伴い、より大きな核酸分子の生成が必要になってきた。多くの場合では、核酸アセンブリ方法は、比較的短い核酸分子の合成(例えば、化学合成されたオリゴヌクレオチド)から始まり、続いて二本鎖断片または亜アセンブリの生成(例えば、複数の重複オリゴヌクレオチドのアニーリングおよび伸長による)、そして多くの場合では、遺伝子、オペロン、さらには機能的な生物学的経路などのより大きなアセンブリの構築に進む(例えば、ライゲーション、酵素的伸長、組換え、またはそれらの組み合わせによる)。本開示は、概して、高配列忠実度を有する核酸分子のアセンブリのための組成物および方法に関する。
本開示は、部分的に、高ヌクレオチド配列忠実度を有する核酸分子のアセンブリ(例えば、アセンブリPCRによる)および増幅のための組成物および方法に関する。本明細書に記載の組成物および方法は、エラーを含有する核酸分子を検出および/または除去し得るタンパク質(例えば、DNAポリメラーゼ、不一致エンドヌクレアーゼ、不一致結合タンパク質など)を含有し得るか、または用い得る。
いくつかの態様では、本明細書において提供されるのは、核酸分子のエラー訂正された集団を生成するための方法である。かかる方法は、(a)一次アセンブリPCRによって、末端配列相補性の領域(ハイブリダイゼーション時に、約10~約30、約12~約30、約15~約30、約20~約30、約15~約40、約6~約20、約8~約25などの塩基対長の二本鎖領域を形成する一本鎖領域)を有するオリゴヌクレオチドをアセンブルして、アセンブルされた核酸分子の集団を形成すること、および(b)ステップ(a)において形成されたアセンブルされた核酸分子の集団を一次増幅によって増幅して、増幅されたアセンブルされた核酸分子の集団を形成すること、を含み得る。いくつかの場合では、増幅されたアセンブルされた核酸分子の集団は、1,000塩基対当たり2つ未満のエラーを含有し得る(例えば、1,000塩基対当たり、約2~約0.01、約2~約0.05、約2~約0.08、約2~約0.1、約2~約0.5、約2~約0.75、約1~約0.01、約1~約0.05、約1~約0.1、約2~約0.001、約1~約0.001、約0.5~約0.001、約0.1~約0.001などのエラー)。いくつかの場合では、上記のステップ(a)および/または(b)は、1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)の熱安定性不一致認識タンパク質の存在下で実施され得る。いくつかの態様では、1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つは、例えば、表13または表15に記載のアミノ酸配列を有する不一致結合タンパク質から選択される熱安定性不一致結合タンパク質などの熱安定性不一致結合タンパク質である。いくつかの態様では、1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つは、表12または表15に記載のアミノ酸配列を有する不一致エンドヌクレアーゼから選択される不一致エンドヌクレアーゼなどの熱安定性不一致エンドヌクレアーゼである(例えば、TkoEndoMS、PfuEndoMSなど)。
いくつかの場合では、本明細書に記載の方法において高忠実度DNAポリメラーゼが使用され得る。さらにより特定の場合では、高忠実度DNAポリメラーゼは、核酸分子のエラー訂正された集団を生成するための上記方法において記載されたステップ(a)および/または(b)において使用され得る。さらに、高忠実度DNAポリメラーゼは、エラー低減ポリメラーゼ試薬の構成要素であり得る。エラー低減ポリメラーゼ試薬は、(a)ジメチルアミン塩酸塩、(b)ジイソプロピルアミン塩酸塩、(c)エチル(メチル)アミン塩酸塩、(d)トリメチルアミン塩酸塩からなる群から選択される1つ以上のアミン化合物などの1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)のアミン化合物を含み得る。
本明細書に記載の方法の特定のバリエーション、および核酸分子のエラー訂正された集団を生成するための上記の方法では、1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つは、ステップ(a)に存在し得る。さらに、いくつかの場合では、1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つは、ステップ(b)に存在し得る。さらに、1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)のエラー訂正ステップは、一次増幅後に実施され得る。増幅されたアセンブルされた核酸分子の集団の一次後増幅は、ステップ(b)の後に実施され得る。いくつかの場合では、増幅されたアセンブルされた核酸分子の集団を、一次後増幅の前に、1つ以上の不一致認識タンパク質と接触させ得る。加えて、1つ以上の不一致認識タンパク質のうちの少なくとも1つは、1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)の非熱安定性不一致エンドヌクレアーゼ(例えば、T7エンドヌクレアーゼI、CEL IIヌクレアーゼ、CEL Iヌクレアーゼ、および/またはT4エンドヌクレアーゼVII)などの不一致エンドヌクレアーゼであり得る。
本明細書に記載の方法はまた、より大きな核酸分子の亜断片を含む、増幅されたアセンブルされた核酸分子の集団の生成に関する。さらに、いくつかの場合では、かかる増幅されたアセンブルされた核酸分子の集団は、より大きな核酸分子の亜断片でもある1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)の追加の核酸分子と組み合わされて、核酸分子プールを形成し得る。いくつかの場合では、かかる核酸分子プールの核酸分子は、二次アセンブリPCRによってアセンブルされて、より大きな核酸分子を形成し得る。いくつかの場合では、亜断片を、二次アセンブリPCRによるアセンブリの前またはアセンブリ中に、1つ以上の不一致認識タンパク質と接触させ得る。さらに、より大きな核酸分子は、熱変性され、次いで再生され、続いて1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)の不一致認識タンパク質と接触し得る。さらに、1つ以上の不一致認識タンパク質のうちの少なくとも1つ(例えば、1~10、1~8、1~5、1~3、1~2など)は、固体支持体に結合された不一致結合タンパク質などの不一致結合タンパク質であり得る。したがって、本明細書に記載の方法は、エラーを含まない核酸分子からエラーを含む核酸分子を分離する方法を含む。いくつかの場合では、増幅されたアセンブルされた核酸分子の集団は、配列決定され得る。かかる配列決定は、エラーが存在するかどうか、存在する場合はエラーの数およびエラーのタイプを決定するために実施され得る。
本明細書で提供されるのは、本明細書に記載の方法において使用され得る組成物などの組成物である。いくつかの場合では、本明細書に記載の組成物は、1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)の熱安定性不一致認識タンパク質、1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)のDNAポリメラーゼ、および1つ以上(例えば、1~10、1~8、1~5、1~3、1~2など)のアミン化合物を含み得る。さらに、1つ以上のアミン化合物のうちの少なくとも1つは、(a)ジメチルアミン塩酸塩、(b)ジイソプロピルアミン塩酸塩、(c)エチル(メチル)アミン塩酸塩、および/または(d)トリメチルアミン塩酸塩からなる群から選択され得る。
本明細書に記載の組成物は、2つ以上の核酸分子をさらに含み得る(例えば、2つ以上の核酸分子は、より大きな核酸分子の亜断片である)。さらに、2つ以上の核酸分子は、一本鎖であり得る。かかる一本鎖核酸分子は、長さは大きく変化し得るが、多くの場合では、100ヌクレオチド長未満(例えば、約35~約90、約35~約80、約35~約70、約35~約65、約40~約90、約30~約60、約30~約65など)の間である。
本明細書に記載の組成物は、2つ以上の核酸分子をさらに含み得、2つ以上の核酸分子のうちの少なくとも1つは、一本鎖であり、2つ以上の核酸分子のうちの少なくとも1つは、二本鎖である。
本明細書に記載のいくつかの組成物では、熱安定性不一致認識タンパク質のうちの少なくとも1つは、表12または表15に記載のアミノ酸配列を有する熱安定性不一致エンドヌクレアーゼ(例えば、TkoEndoMS、PfuEndoMSなど)などの熱安定性不一致エンドヌクレアーゼ、およびそれらと少なくとも80%(例えば、少なくとも約80%~約99%、約80%~約95%、約80%~約90%、約85%~約95%、約90%~約99%、約92%~約99%、約95%~約99%、約97%~約99%など)の配列同一性を有するそれらのバリアントであり得る。
いくつかの特定の場合では、本明細書で提供される組成物および方法は、TkoEndoMS(配列番号3)と少なくとも30%、40%、50%、または60%(例えば、約30%~約70%、約30%~約60%、約30%~約50%、約30%~約45%、約30%~約40%など)のアミノ酸配列同一性を共有する不一致特異的エンドヌクレアーゼを含有し得るか、または使用し得る。かかる不一致特異的エンドヌクレアーゼの例は、PisEndoMS(配列番号11)またはSacEndoMS(配列番号12)である。
本明細書に記載のいくつかの組成物では、熱安定性不一致認識タンパク質のうちの少なくとも1つは、表13または表15に記載のアミノ酸配列を有する熱安定性不一致認識タンパク質などの熱安定性不一致認識タンパク質、およびそれらと少なくとも80%(例えば、少なくとも約80%~約99%、約80%~約95%、約80%~約90%、約85%~約95%、約90%~約99%、約92%~約99%、約95%~約99%、約97%~約99%など)の配列同一性を有するそれらのバリアントであり得る。
所定の配列を有する核酸分子を生成する方法もまた、本明細書に記載される。いくつかの場合では、かかる方法は、(a)相補的重複領域を有する複数の一本鎖オリゴヌクレオチドを提供することであって、一本鎖オリゴヌクレオチドの各々が標的核酸分子の配列領域を含み、複数の一本鎖オリゴヌクレオチドは、(i)複数において2つの他のオリゴヌクレオチドと重複する配列領域を有する複数の内部オリゴヌクレオチド、ならびに(ii)全長核酸分子の5’および3’末端に位置するように設計され、複数において内部オリゴヌクレオチドのうちの1つと重複する配列領域を有する、2つの末端オリゴヌクレオチドを含む、提供すること、(b)一次アセンブリPCRによって複数のオリゴヌクレオチドをアセンブルして、アセンブルされた二本鎖核酸アセンブリ産物を得ること、(c)ステップ(b)において得られたアセンブリ産物の少なくとも一部分を一対のプライマーと組み合わせることを含み得る。いくつかの場合では、対のプライマーは、アセンブリ産物の5’および3’末端に結合し、PCR増幅反応を実施して増幅されたアセンブリ産物を産生するように設計され得る。さらに、いくつかの場合では、ステップ(b)および/またはステップ(c)は、1つ以上の熱安定性不一致認識タンパク質の存在下で実施され得る。
さらに本明細書で記載されるのは、(d)1つ以上のエラー訂正ステップを実施することをさらに含む、所定の配列を有する核酸分子を生成する方法である。いくつかの場合では、かかるエラー訂正ステップは、(i)ステップ(c)の増幅されたアセンブリ産物を変性および再アニーリングして、二本鎖核酸を含有する1つ以上の不一致を生成すること、(ii)二本鎖核酸を含有する不一致を、1つ以上の不一致認識タンパク質で処理すること、ならびに(iii)任意選択で、増幅反応を実施することを含み得る。いくつかの場合では、ステップ(d)において使用される不一致認識タンパク質は、不一致エンドヌクレアーゼ(例えば、T7エンドヌクレアーゼI)または不一致結合タンパク質(例えば、MutS)である。さらに、用いられる熱安定性不一致エンドヌクレアーゼは、超好熱性古細菌に由来し得、任意選択で、超好熱性古細菌は、Pyrococcus furiosusまたはPyrococcus abyssiである。加えて、熱安定性不一致認識タンパク質は、表12、13、または15に記載のアミノ酸配列を有するタンパク質、およびそれらと少なくとも80%(例えば、少なくとも約80%~約99%、約80%~約95%、約80%~約90%、約85%~約95%、約90%~約99%、約92%~約99%、約95%~約99%、約97%~約99%など)の配列同一性を有するそれらのバリアントの群から選択され得る。
いくつかの場合では、用いられる熱安定性不一致認識タンパク質のうちの1つ以上は、インビトロ転写/翻訳によって産生および/または取得され得る。他の場合では、用いられる熱安定性不一致認識タンパク質のうちの1つ以上は、細胞発現によって産生および/または取得され得る。
ポリメラーゼが組成物中に存在し、本明細書に記載の方法において使用される場合、これらのポリメラーゼは、高忠実度DNAポリメラーゼであり得る。したがって、本明細書で提供されるのは、上に記載の所定の配列を有する核酸分子を生成する方法などの方法であり、ステップ(b)、(c)および(d)(iii)のうちの1つ以上が、高忠実度DNAポリメラーゼの存在下で実施され、任意選択で、ポリメラーゼは、PHUSION(商標)DNAポリメラーゼ(PHUSION(商標))、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ(SUPERFI(商標)II)、Q5 DNAポリメラーゼ、およびPRIMESTAR GXL DNAポリメラーゼからなる群から選択され得る。加えて、ステップ(b)、(c)および(d)(iii)のうちの1つ以上が、高忠実度DNAポリメラーゼの存在下で実施され得、任意選択で、ポリメラーゼは、表14に記載の(1)DNAポリメラーゼ1、(2)DNAポリメラーゼ2、(3)DNAポリメラーゼ3、(4)DNAポリメラーゼ4、(5)DNAポリメラーゼ5、(6)DNAポリメラーゼ6、(7)DNAポリメラーゼ7からなる群から選択されるアミノ酸配列を有するポリメラーゼである。
例えば、所定の配列を有する核酸分子を生成する上記の方法のいくつかのバリエーションでは、2つ以上の増幅されたアセンブリ産物は、1つ以上のエラー訂正ステップを実施する前にプールされ得る。追加のバリエーションは、1つ以上のエラー訂正ステップの前に、増幅されたアセンブリ産物をエキソヌクレアーゼで処理することをさらに含み得、任意選択で、エキソヌクレアーゼは、エキソヌクレアーゼIである。
本明細書に記載の主題の特徴および利点のより良い理解は、本明細書に記載の主題の原理が利用される、例示的な実施形態を記載する以下の詳細な説明、および添付の図面を参照することにより得ることができる。
2つの核酸アセンブリワークフローの比較を示す。図1Aは、オリゴヌクレオチド合成、オリゴヌクレオチドアセンブリPCR、および亜断片を生成する反応混合物のアセンブリPCR(まとめて一次アセンブリPCR);アセンブリ産物の増幅(一次増幅);増幅された産物の精製;ヌクレアーゼ処理、一例として、相補的オーバーハングを生成する(例えば、IIs型エンドヌクレアーゼ媒介切断によって生成される);ならびにベクターの挿入および変換のステップを含む、一本鎖重複オリゴヌクレオチドから核酸分子をアセンブリするための標準のワークフローの概略図である。図1Bは、本明細書に記載の方法による配列伸長およびライゲーション反応の1つのバリエーションの概略図である。アセンブリPCR(一次アセンブリPCR)、増幅(一次増幅)、およびベクター挿入のステップは、単一の密閉容器(例えば、単一の密封チューブ)で実施できるため、かかる反応は、多くの場合「ワンポット」反応として実施される。図1Bのワークフローでは、ベクター末端が増幅プライマーとして機能する。 核酸分子をアセンブルし、増幅するためのPCRベースのプロセスの概略図である。(a)重複するフォワードおよびリバースオリゴヌクレオチドは、第1のPCRサイクルにおいて伸長される。(b)伸長されたアセンブリ産物は互いにアニーリングし、第2のサイクルにおいてさらに伸長される。(c)後続のPCRサイクルにおいてさらなる伸長が起こり、アセンブリ産物が蓄積する。この図のアセンブリプロセスは、本明細書では「一次アセンブリPCR」(「A」と標識)と称される。2つの末端オリゴヌクレオチド(1)および(2)もユニバーサルプライマーであり得る。さらに、末端オリゴヌクレオチドを一次アセンブリPCR産物に添加し得る、または一次アセンブリPCR産物を別のチューブに添加し、次いで末端プライマーと混合し得る。さらに、末端オリゴヌクレオチドの代わりにベクター末端が使用され得る(図1Bを参照されたい)。2つの末端オリゴヌクレオチドを使用するこの図の最終増幅ステップは、本明細書では「一次増幅」(「B」と標識)と称される。 エラー訂正された核酸分子合成の例示的なワークフローの概略図である。 オリゴヌクレオチドが増幅され、次いでエラーが訂正され、より長い核酸分子にアセンブルされるワークフロー概略図を示す。 PCRによって生成された核酸分子(例えば、以前にアセンブルされた核酸分子)の二重エラー訂正および増幅ベースのアセンブリを含むワークフロー概略図を示す。1つのバリエーション(図5A)では、エラー訂正は、ワークフローにおける2つの位置において1つ以上のエンドヌクレアーゼを使用して実施される。明細書における参照のために、図5Aには9つのライン番号標識が含まれている。別のバリエーション(図5B)では、ワークフローにおける2つの異なる位置におけるエラー訂正が、第1のラウンドにおいて1つ以上のエンドヌクレアーゼを使用して実施され、第2ラウンドにおいて不一致結合タンパク質を使用して実施される。図5Aと同様に、明細書における参照のために、図5Bにも9つのライン番号標識が含まれている。 不一致を含有しない核酸分子から不一致を含有する核酸分子を分離するために、不一致結合タンパク質を結合させたビーズを用いるワークフローの概略図表示を示す。NMMは、非不一致核酸分子を指し、MMは、不一致核酸分子を指す。 実験により決定された様々な条件を使用して生成されたエラー率データ(合計エラー)を示す。この図に関して、「アセンブリ」という用語は、一次アセンブリPCRを指す(例えば、Aと標識された図2の上部を参照されたい)。「増幅」という用語は、アセンブルされた核酸分子のプライマーベースの一次増幅を指す(例えば、Bと標識された図2下部を参照されたい)。「エラー訂正」という用語は、この場合は二次増幅である、一次後増幅T7エンドヌクレアーゼI(T7NI)媒介エラー訂正ステップが実施されたかどうかを指す。「アセンブリ」および「増幅」列の表記は、Ishino et al.,Nucl.Acids Res.44:2977-2989(2016))のThermococcus kodakarensis由来の野生型不一致エンドヌクレアーゼ(本明細書では「TkoEndoMS」と称される)が、アセンブリPCRおよび/または増幅中に含まれていたかどうかを示す。「配列決定された断片」と標識された列は、試験された異なる配列を有する断片のセットの数を指す。示されている「エラー率」は、データの平均である。「ベンチマーク」という用語は、別の実験において決定された、同一のオリゴヌクレオチドであるがエラー訂正なしのエラー率を指す。表には、8つのベンチマーク値すべての数値平均も示されている。注:実行番号1~8は、各々、単一の実行、次世代シーケンシングが可能となるようにヌクレオチド配列が異なるオリゴヌクレオチドのセットで実施された。 図7のデータを生成するために使用された総エラーデータポイントを示すグラフ表示である。図8の下軸の数字および文字の記述は、図7の左側の2つの列と相関している。各データポイントは、分析された核酸分子集団の各々の塩基対当たりのエラー数を表す。各垂直線上のボックスは、データポイントの半分が該当する垂直線の領域を表す。ボックス内の水平線は中央値を表す。この図は、個々の核酸分子に存在するエラーの総数を示す。したがって、各データ点は、同じヌクレオチド配列を有するように設計された核酸分子の平均エラー数を表す。分析によると、下の軸から離れるほど、存在するエラーの数は少なくなる。 図8と同様のグラフ表示であるが、総エラーの代わりに、欠失の数を表す。 図8と同様のグラフ表示であるが、総エラーの代わりに、挿入の数を表す。 図8と同様のグラフ表示であるが、総エラーの代わりに、置換の数を表す。 2つの試料に存在する特定のタイプのエラーを示す。1つの試料(図12Aおよび12B)では、核酸分子は、アセンブルされ、エラー訂正なしで増幅された。他の試料(図12Cおよび12D)では、核酸分子は、アセンブルされ、TkoEndoMSエラー訂正を伴い増幅された。どちらの試料でもT7NIエラー訂正は、実施されなかった。図12Bおよび12Dに記載の不一致のタイプは、以下のとおりである:TS1=G-T、C-A、TS2=A-C、G-T、TV1=C-T、G-A、TV2=A-A、T-T、TV3=G-G、C-C、およびTV4=T-C、A-G。「TS」は、トランジションを指し、「TV」は、トランスバージョンを指す。全体的なエラー率は、以下のとおりであった:図12A-349塩基中1つ(標準偏差(SD):99塩基中1つ)および図12C-488塩基中1つ(SD:210塩基中1つ)。全体の置換率は、以下のとおりであった:図12B-647.8塩基中1つ、図12D-242.5塩基中1つ。 核酸分子の試料セットが、アセンブルされ、エラー訂正なしおよびPHUSION(商標)DNAポリメラーゼ(Thermo Fisher Scientific、カタログ番号F530S)(A~C)で増幅された場合、ならびにTkoEndoMSがアセンブリPCRおよび増幅中に使用され、かつPLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ(Thermo Fisher Scientific、カタログ番号12361010)(D~F)がアセンブリPCRおよび増幅の両方に使用された場合の生成されたデータを示す。どちらの試料でもT7NIエラー訂正は、実施されなかった。 2つの試料に存在する特定のタイプのエラーを示す。1つの試料(図14Aおよび14B)では、核酸分子は、アセンブルされ(一次アセンブリPCR)、増幅された(エラー訂正なしの一次増幅およびPHUSION(商標)DNAポリメラーゼ使用。他の試料(図14Cおよび14D)では、核酸分子は、アセンブルされ、TkoEndoMSエラー訂正およびPLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼを伴い増幅された。どちらの試料でもT7NIエラー訂正は、実施されなかった。全体的なエラー率は、以下のとおりであった:図14A-251塩基中1つ(標準偏差(SD):25塩基中1つ)および図14C-670塩基中1つ(SD:112塩基中1つ)。全体の置換率は、以下のとおりであった:図14B-462.4塩基中1つ、図14D-565.2塩基中1つ。 N末端シグナルペプチドおよびC末端ヒスチジン精製タグを有するTkoEndoMSのアミノ酸配列(配列番号1)、およびこのタンパク質をコードするコドン最適化核酸分子のヌクレオチド配列(配列番号2)を示す。 Thermococcus kodakarensis EndoMS(本明細書において「TkoEndoMS」と称する)(配列番号3)およびPyrococcus furiosus EndoMS(本明細書において「PfuEndoMS」と称する)(配列番号4)のアミノ酸配列アラインメントを示す。これら2つのタンパク質のアミノ酸配列は、69%の配列同一性を共有している。 PHUSION(商標)(「前」)またはPLATINUM(商標)SUPERFI(商標)II(「後」)DNAポリメラーゼを使用してアセンブルされた30個の核酸分子由来のデータを示す。この図は、前対後の個々の断片のエラー率の相対的な変化を示す。個々の断片の実際のエラー率および標準偏差は、前については339±52塩基対(bps)中1つ、後について447±89bps中1つであり、エラー率の平均改善率は、32.3±20.1%である。PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼは、PHUSION(商標)DNAポリメラーゼと比較して、より低いエラー率をもたらすことが示される。 図17Aと同じデータをエラーのタイプ(削除、挿入、置換)に分けて示す。PLATINUM(商標)SUPERFI(商標)IIポリメラーゼは、すべてのエラーのタイプに対して同様のプラスの効果があることが示されている。全体の削除率の変化は、40.4±55.1%(1/1157±840bps~1/1429±547bps)である。全体の挿入率の変化は、41.9±90.6%(1/2875±1201bps~1/3803±2841bps)である。全体の置換率の変化は、32.7±21.2%(1/666±115bps~1/873±152bps)である。 PHUSION(商標)(「前」)またはPLATINUM(商標)SUPERFI(商標)II(「後」)DNAポリメラーゼおよびTkoEndoMS(「後」)を使用してアセンブルされた25個の核酸分子由来のデータを示す。これらの25個の断片は、図17Aおよび図17Bに記載のデータを生成するために使用された30個の断片とは異なった。この図は、前対後の個々の断片のエラー率の相対的な変化を示す。個々の断片の実際のエラー率および標準偏差は、前については332±68bp中1つ、後について534±161bp中1つであり、エラー率の平均改善率は、60.3±32.9%である。TkoEndoMSを追加すると、エラー率がさらに改善されることが示されている。 図17Cと同じデータをエラーのタイプ(削除、挿入、置換)に分けて示す。TkoEndoMSを追加すると、挿入および置換に対するプラスの効果が高まることが示されている。全体の削除変化率は、44.4±51.3%(1/1019±261bps~1/1397±392bps)である。全体の挿入変化率は、78.3±109.7%(1/2690±1191bps~1/4075±1517bps)である。全体の置換変化率は、77.6±36.5%(1/681±150bps~1/1217±380bps)である。
定義
「核酸分子」という用語は、本明細書で使用する場合、ヌクレオチドまたは塩基の共有結合で連結された配列を指し(例えば、RNAのリボヌクレオチドおよびDNAのデオキシリボヌクレオチドであるが、DNAが別々の鎖または同じ鎖にあるDNA/RNAハイブリッドも含む)、1つのヌクレオチドのペントースの3’位は、ホスホジエステル連結により、次のヌクレオチドのペントースの5’位に接合する。核酸分子は、一本鎖もしくは二本鎖または部分的に二本鎖であり得る。核酸分子は、平滑末端または粘着末端を有するスーパーコイルまたは弛緩形態で線状または環状形態であらわれてもよく、「ニック」を含んでもよい。核酸分子は、完全に相補的な一本鎖、または少なくとも1つの塩基不一致を形成する部分的に相補的な一本鎖で構成されてもよい。核酸分子は、任意選択でループ配列により一端で分離した二本鎖ステム領域を形成し得る、2つの自己相補的配列をさらに含んでもよい。二本鎖ステム領域を含む核酸分子の2つの領域は、互いに実質的に相補的であり、その結果、自己ハイブリダイゼーションが生じる。しかしながら、ステムには、1つ以上の不一致、挿入、または欠失が含まれ得る。
核酸分子は、化学的、酵素的、または代謝的に修飾された形態のヌクレオチドまたはそれらの組み合わせを含み得る。化学的に合成された核酸分子は、典型的には長さが200ヌクレオチド以下(例えば、5~200、10~150、15~100または20~50ヌクレオチド長)の核酸を指し得、一方、酵素的に合成された核酸分子は、本明細書の他の箇所に記載のより小さな核酸分子およびより大きな核酸分子を含み得る。核酸分子の酵素合成は、ポリメラーゼ、リガーゼ、エキソヌクレアーゼ、エンドヌクレアーゼ、リコンビナーゼなど、またはそれらの組み合わせなどの酵素を使用する段階的プロセスを含み得る。したがって、化学的に合成された核酸分子の酵素的なアセンブリに関連する組成物および組み合わせた方法が、本明細書において部分的に提供される。
核酸分子ホスホジエステル連結が置換モノヌクレオチドのペントース環の5’炭素と3’炭素との間で生じるため、核酸分子は、「5’末端」および「3’末端」を有する。新しい連結が5’炭素となる核酸分子の末端は、その5’末端ヌクレオチドである。新しい連結が3’炭素となる核酸分子の末端は、その3’末端ヌクレオチドである。本明細書で使用する末端ヌクレオチドまたは塩基は、3’または5’末端の末端位置にあるヌクレオチドである。核酸分子領域は、より大きな核酸分子の内部であっても(例えば、核酸分子内の配列領域)、5’末端および3’末端を有すると言うことができる。核酸分子はまた、短い核酸分子を指し、多くの場合、例えばプライマーまたはプローブと称される。また、「5’-」および「3’-」という用語は、核酸分子の鎖を指す。したがって、線状の一本鎖核酸分子は、5’末端および3’末端を有する。しかし、線状の二本鎖核酸分子は、各鎖の5’末端と3’末端を有する。したがって、タンパク質をコードする核酸分子については、例えば、センス鎖の3’末端を参照することができる。
「オリゴヌクレオチド」という用語は、本明細書で使用される場合、DNAおよびRNA、ならびに典型的にはDNAであるがプリンまたはピリミジン塩基のN-グリコシドである任意の他のタイプの核酸分子を指す。したがって、オリゴヌクレオチドは、核酸分子サブセットであり、一本鎖または二本鎖であり得る。オリゴヌクレオチド(下記のプライマーを含む)は、所与の核酸配列に関する方向を示すために「フォワード」または「リバース」と称される場合がある。例えば、フォワードオリゴヌクレオチドは、核酸分子の第1の鎖(例えば、「センス」鎖)の配列の一部分を表し得るのに対し、リバースオリゴヌクレオチドは、当該核酸分子の第2の鎖(例えば、「アンチセンス」鎖)の配列の一部分を表し得るか、またはその逆であり得る。多くの場合では、より長い核酸分子をアセンブルするために使用されるオリゴヌクレオチドのセットは、相補的領域を介して互いにハイブリダイゼーションできるフォワードおよびリバースオリゴヌクレオチドの両方を含む。オリゴヌクレオチドは、典型的には200ヌクレオチド長未満、より典型的には100ヌクレオチド長未満である。したがって、「プライマー」は、概してオリゴヌクレオチドのカテゴリーに入る。オリゴヌクレオチドは、Narang et al.,Meth.Enzymol.68:90-99(1979)のホスホトリエステル法、Brown et al.,Meth.Enzymol.68:109-151(1979)のホスホジエステル法、Beaucage et al.,Tetrahedron Letters 22:1859-1862(1981)のジエチルホスホラミダイト法、および米国特許第4,458,066号の固体支持法などの方法による直接化学合成を含む任意の好適な方法によって調製され得る。オリゴヌクレオチドおよび修飾ヌクレオチドのコンジュゲートの合成方法の総説は、Goodchild,Bioconjugate Chemistry 1:165-187(1990)において提供されている。必要に応じて、オリゴヌクレオチドという用語は、プライマーまたはプローブを指し得、これらの用語は、本明細書では交換可能に使用され得る。
「プライマー」という用語は、本明細書で使用される場合、好適な条件下で核酸合成の開始点として作用することができる短い核酸分子を指す。かかる条件には、核酸鎖に相補的なプライマー伸長産物の合成が、適切な緩衝液中および好適な温度で、異なるヌクレオシド三リン酸(例えば、A、C、G、Tおよび/またはU)および伸長のための薬剤(例えば、DNAポリメラーゼまたは逆転写酵素)の存在下で誘導される条件を含む。プライマーは、概して一本鎖DNAからなるが、特定の用途(例えば、平滑末端ライゲーション)のために二本鎖分子として提供されることもできる。任意選択で、プライマーは、天然に生じ得るか、または組換え手順の化学合成を使用して合成され得る。プライマーの適切な長さは、プライマーの使用目的に依存するが、典型的には、約10~約50ヌクレオチド、約15~約35ヌクレオチド、約18~約75ヌクレオチドおよび約25~約150ヌクレオチドなどの中間範囲を含む、約6~約200ヌクレオチドの範囲である。所与の標的配列の増幅に好適なプライマーの設計は、当技術分野で周知であり、文献に記載されている(例えば、OLIGOPERFECT(商標)Designer、Thermo Fisher Scientificを参照されたい)。プライマーは、プライマーの検出または固定化を可能にするが、DNA合成の開始点として作用するというプライマーの基本的な特性を変更しない、追加の特徴を組み込むことができる。したがって、プライマーは、検出可能な部分または標識を含み得る。例えば、標識は、蛍光性、発光性、または放射性の部分を含み得る。
同じ増幅反応において使用されるプライマーのセットは、実質的に同じ融解温度を有し得、融解温度は、互いに約10~5℃以内、または互いに約5~2℃以内、または互いに約2~0.5℃以内、または互いに約0.5℃未満である。
「相補的」または「相補性」という用語は、本明細書で使用される場合、塩基対合による許容の塩および温度条件下での核酸分子(プライマー、オリゴヌクレオチドまたはポリヌクレオチドなど)の自然な結合を指す。例えば、配列「A-G-T」は、相補的な配列「T-C-A」に結合する。2つの一本鎖分子間の相補性は、核酸の一部のみが結合する「部分的」であるか、一本鎖分子間に完全な相補性が存在する「完全」であり得る。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に顕著に影響を与える。これは、核酸鎖間の結合に依存する増幅反応において特に重要である。オリゴヌクレオチドなどの核酸分子間の相補的領域は、以下に定義する「重複」または「重複する」領域と称される場合もある。
「ハイブリダイゼーション」という用語は、本明細書で使用される場合、塩基対合を介して核酸の鎖が相補鎖と結合する任意のプロセスを指す。ハイブリダイゼーションおよびハイブリダイゼーションの強さ(例えば、核酸間の会合の強さ)は、核酸間の相補性の程度、関連する条件のストリンジェンシー、形成されたハイブリッドのTm、および核酸内のG:C比などの因子によって影響を受ける。
「相同」という用語は、本明細書で使用される場合、相補性の程度を指す。核酸配列は、部分的または完全に相同(同一)であり得る。部分的に相補的な配列は、完全に相補的な配列が標的核酸にハイブリダイゼーションするのを少なくとも部分的に阻害するものであり、「実質的に相同」という機能用語を使用して言及される。
「重複」または「重複する」という用語は、本明細書で使用される場合、2つ以上のオリゴヌクレオチドの一部分によって共有される配列相同性または配列同一性を指す。
「遺伝子」または「遺伝子配列」という用語は、本明細書で使用される場合、概して、別個の細胞産物をコードする核酸配列を指す。多くの場合では、遺伝子または遺伝子配列は、オープンリーディングフレーム(ORF)を含むDNA配列を含み、ポリペプチド鎖に翻訳され得るmRNAに転写され得るか、rRNAもしくはtRNAに転写され得るか、または酵素ならびにDNAの複製、転写、および調節に関与するタンパク質の認識部位として機能し得る。これらの遺伝子には、構造遺伝子、免疫遺伝子、調節遺伝子、および分泌(輸送)遺伝子などが含まれるが、これらに限定されない。しかしながら、本明細書で使用される場合、「遺伝子」は、特定のタンパク質をコードするヌクレオチド配列だけでなく、目的の遺伝子によってコードされるタンパク質の発現の調節に関与する任意の隣接する5’および3’非コードヌクレオチド配列も指す。これらの非コード配列には、ターミネーター配列、プロモーター配列、上流アクチベーター配列、調節タンパク質結合配列などが含まれる。多くの場合では、遺伝子は、より短いオリゴヌクレオチドまたは核酸断片からアセンブルされる。
「断片」、「亜断片」、「セグメント」もしくは「構成要素」という用語、または類似の用語は、核酸分子または配列に関連して本明細書で使用される場合、1つ以上のプロセスステップ(例えば、合成、アセンブリPCR、増幅など)から得られる産物または中間産物のいずれかを指すか、または1つ以上のプロセスステップ(例えば、アセンブリPCR、増幅、ライゲーション、クローニング)によって得られるための、より長いまたは修飾された核酸産物の一部分、一部、またはテンプレートを指す。いくつかの場合では、核酸断片または亜断片は、アセンブリ産物(例えば、複数のオリゴヌクレオチドからアセンブルされた)および高次アセンブリのための開始化合物(例えば、複数の断片からアセンブルされた遺伝子または複数の亜断片からアセンブルされた断片など)の両方を表し得る。
本明細書で使用される場合、「アミン」または「アミン化合物」は、本明細書で使用される場合、直下の式Iの化学物質、またはその塩を含む:
Figure 2023516827000002
式中、R1はHであり、R2は、アルキル、アルケニル、アルキニル、または(CH2)n-R5から選択され、n=1~3であり、R5は、アリール、アミノ、チオール、メルカプタン、ホスフェート、ヒドロキシ、アルコキシであり、R3およびR4は同じか、または異なってもよく、独立して、Hまたはアルキルから選択され、ただし、R2が、(CH2)n-R5である場合、R3および/またはR4のうちの少なくとも1つは、アルキルである。したがって、アミンには、ジエチルアミン塩酸塩、ジイソプロピルアミン塩酸塩、エチル(メチル)アミン塩酸塩、トリメチルアミン塩酸塩、およびジメチルアミン塩酸塩が含まれる。
「ベクター」という用語は、本明細書で使用される場合、遺伝物質を宿主生物に移すことができる任意の核酸分子を指す。ベクターは、トポロジーにおいて線状または環状であり得、プラスミド、ウイルス、バクテリオファージを含むがこれらに限定されない。ベクターは、増幅遺伝子、エンハンサーまたは選択マーカーを含み得、宿主生物のゲノムに組み込まれてもよく、または組み込まれなくてもよい。
「プラスミド」という用語は、本明細書で使用される場合、1つ以上の核酸分子(例えば、アセンブリ産物)を挿入するために遺伝子改変され得るベクターを指す。プラスミドは、典型的には、少なくとも1つの細胞型において複製できるようにする1つ以上の領域を含む。
「増幅」という用語は、本明細書で使用される場合、核酸分子の追加のコピーの産生を指す。増幅は、多くの場合、当技術分野で周知のポリメラーゼ連鎖反応(PCR)技術を使用して実施される(例えば、Dieffenbach,C.W.and G.S.Dveksler(1995)PCR Primer,a Laboratory Manual,Cold Spring Harbor Press,Plainview,N.Y.を参照されたい)が、例えば、転写媒介増幅、鎖置換増幅、ローリングサークル増幅、ループ媒介等温増幅、ヘリカーゼ依存性増幅、単一プライマー等温増幅またはリコンビナーゼポリメラーゼ増幅などの等温増幅法を含む他の手段によって実施されてもよい(例えば、Fakruddin et al.,“Nucleic acid amplification:Alternative methods of polymerase chain reaction”,J.Pharm Bioallied Sci,2013,v.5(4),245-252、またはGill and Ghaemi,“Nucleic acid isothermal amplification technologies:a review”,Nucleosides Nucleotides Nucleic Acids.2008 27(3),224-43を参照されたい)。変性された二本鎖核酸分子の各鎖を再構築するために、末端プライマーを使用して増幅反応を実施することができる。
本明細書で「アセンブリPCR」とも呼ばれる「アセンブリ連鎖反応」という用語は、本明細書で使用される場合、重複する部分的に相補的な核酸分子のポリメラーゼ媒介伸長による、より小さい核酸分子からのより大きい核酸分子のアセンブリを指す。重複する部分的に相補的な核酸分子は、一本鎖または二本鎖であり得る。さらに、二本鎖核酸分子は、典型的には、アセンブリ連鎖反応における使用の前または一部として変性される。アセンブリ連鎖反応の例が図2の上部に記載されており、重複する部分的に相補的な核酸分子を使用して、各ポリメラーゼ媒介伸長ステップでより大きな核酸分子を生成する。
「一次後増幅エラー訂正」という用語は、本明細書で使用される場合、図2に示されるワークフローの終了後に生じる増幅ベースのエラー訂正ステップを指す。図2のワークフローでは、オリゴヌクレオチドが最初にアセンブルされ(一次アセンブリPCR)、次いで末端プライマーを使用して増幅される(一次増幅)。これが生じると、追加のエラー訂正ラウンド(例えば、PCRベースの断片アセンブリおよび増幅を含むエラー訂正)が生じる可能性がある。例えば、図5Aのワークフローでは、ステップ1の3つの亜断片/PCR産物が図2のワークフローを使用して作製された場合、次いで図5Aのすべてのエラー訂正ステップは、一次後増幅エラー訂正である。
エラー訂正には、多くの場合、不一致エンドヌクレアーゼの使用が含まれる。例示的なエラー訂正プロセスが図4に記載されている。この図では、増幅されたオリゴヌクレオチドからアセンブルされた二本鎖核酸分子が変性され、次いで再アニーリングされる(ライン4および5)。次いで、そのいくつかが1つ以上の不一致を含有し得る再アニーリングされた核酸分子を、例えば不一致エンドヌクレアーゼ(ライン6)と接触させて、核酸分子を不一致の部位で、またはその近くで切断する。次いで、ライン6の反応混合物中の切断された核酸分子は、重複伸長PCRによって再アセンブルされ、増幅されて、「訂正されていない」出発核酸分子(ライン3)と同じ長さであることを意図したエラーのない核酸分子が得られる(ライン7におけるプロセスの出力)。
「非増幅エラー訂正」という用語は、本明細書で使用される場合、核酸増幅を含まないエラー訂正プロセスを指す。かかる方法の例は、核酸鎖を互いにハイブリダイゼーションさせ、続いて不一致結合タンパク質を用いて不一致を含有する二本鎖核酸分子を除去する方法である(例えば、図3を参照されたい)。
「隣接する」という用語は、本明細書で使用される場合、参照領域のすぐ5’側または3’側の核酸分子における位置を指す。
「配列忠実度」という用語は、本明細書で使用される場合、参照配列と比較した核酸分子の配列同一性のレベルを指す。配列同一性についてスコアリングされる核酸分子の全長にわたって100%同一である完全な同一性。配列忠実度は、多くの方法で、例えば、核酸分子の実際のヌクレオチド配列を所望のヌクレオチド配列(例えば、核酸分子を生成するために使用したいヌクレオチド配列)と比較することによって測定され得る。配列忠実度を測定し得る別の方法は、反応混合物中の2つの核酸分子の配列の比較によるものである。多くの場合では、塩基基準ごとの差は平均して同じである。
DNAポリメラーゼのエラー率は、合計エラーまたは異なるタイプのエラーの定量化によって測定され得る。本明細書に記載の高忠実度DNAポリメラーゼに関して、エラー率「ベンチマーク」は、置換率に基づいて設定される。特に、高忠実度DNAポリメラーゼは、塩基当たり1.0×10-5置換のより低い置換エラー率を示す。高忠実度ポリメラーゼの例としては、PHUSION(商標)DNAポリメラーゼ、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ、Q5(登録商標)DNAポリメラーゼ、およびPRIMESTAR(登録商標)GXL DNAポリメラーゼ(Takara)が挙げられる。エラー率を決定する方法は当技術分野で既知であり、例えば、Potapov et al.,“Examining Sources of Error in PCR by Single Molecule Sequencing”,PLOS ONE,DOI:10.1371/journal.pone.0169774 January 6,2017において記載されている。
「トランジション」という用語は、核酸分子のヌクレオチド配列に関して使用される場合、プリンヌクレオチドを別のプリンへ
Figure 2023516827000003
Figure 2023516827000004
「トランスバージョン」という用語は、核酸分子のヌクレオチド配列に関して使用される場合、(一環)ピリミジンに対する(二環)プリンの置換または(二環)プリンに対する(一環)ピリミジンの置換を含む点変異を指す。
「インデル」という用語は、本明細書で使用される場合、核酸分子における1つ以上の塩基の挿入または欠失を指す。
「不一致」という用語は、本明細書で使用される場合、ワトソン-クリック塩基対合を形成しないが、異なる核酸鎖の周囲の塩基は配列相補性を有し、形成するワトソン-クリック塩基対合塩基を形成する、二本鎖核酸分子の異なる鎖における2つの塩基を指す。相補的領域の長さは変化し得るが、多くの場合、少なくとも20塩基対のものである。4つの標準のDNA塩基のみを含有する核酸分子の各鎖に関して、4つの正しい(ワトソン-クリック塩基対合)相補的一致(すなわち、A/T、T/A/G/C、およびC/G)および12個の「不一致」(すなわち、A/A、A/C、A/G、T/T、T/C、T/G、G/G、G/A、G/T、C/C、C/T、およびC/A)が存在する。塩基対合に関して、鎖の参照がない場合では、2つの正しい相補的一致(すなわち、A/TおよびG/C)と8つの「不一致」(すなわち、A/A、A/C、A/G、T/T、T/C、T/G、G/G、およびC/C)が存在する。置換に関して、これらの不一致は、(1)AからGおよびTからC、(2)GからAおよびCからT、(3)AからCおよびTからG、(4)AからTおよびTからA、(5)GからCおよびCからG、および(6)GからTおよびCからAとして表され得る。
「熱安定性」という用語は、タンパク質に関して本明細書で使用される場合、95℃で5分間加熱した後、タンパク質の生物学的活性を少なくとも85%保持するタンパク質を指す。熱安定性タンパク質は、95℃で生物学的活性を有してもよく、または有しなくてもよい。したがって、タンパク質に応じて、保持された生物学的活性のアッセイは、95℃で5分間加熱されていない同じタンパク質の「ベンチマーク」として使用して、95℃で5分間または別の(例えば、より低い)温度でのインキュベーション後に実施され得る。
「不一致認識タンパク質」という用語は、本明細書で使用される場合、二本鎖DNAにおける不一致塩基に対して特異的な生物学的活性を有するタンパク質を指す。これらの活性には、ヌクレアーゼ活性および/または結合活性が含まれ得る。かかるタンパク質には、リゾルバーゼ、MutSおよびMutSホモログ、MutMおよびMutMホモログ、MutYおよびMutYホモログ、ならびにタンパク質のRecBヌクレアーゼファミリーのメンバーが含まれる。不一致結合タンパク質および不一致エンドヌクレアーゼは、両方とも不一致認識タンパク質である。不一致認識タンパク質は、熱安定性または非熱安定性であり得る。いくつかの例示的な不一致認識タンパク質は、表15、および本明細書に提供される他の表に記載されている。
「不一致エンドヌクレアーゼ」または「MME」(「不一致修復エンドヌクレアーゼ」とも称される)という用語は、本明細書で使用される場合、不一致部位で、またはその近くで(例えば、約1~約5塩基対以内)二本鎖核酸分子を切断する(一方または両方の鎖)活性を有するヌクレアーゼを指す。不一致エンドヌクレアーゼ活性には、不一致塩基対を形成するヌクレオチドで、またはその近くでホスホジエステル結合を切断する能力、および不一致塩基対から1~5、多くの場合、1~3塩基対離れた位置にあるヌクレオチドに隣接するホスホジエステル結合を切断する活性が含まれる。不一致エンドヌクレアーゼ活性を有するタンパク質の例を、以下の表13および15に記載する。不一致エンドヌクレアーゼの具体的な例としては、CEL I(Till et al.,Nucl.Acid Res.32:2632-2641(2004))およびCEL II(米国特許第7,129,075号)、T7NIおよびT4エンドヌクレアーゼVIIなどのバクテリオファージリゾルバーゼ(Mashal,et al.,Nature Genetics 9:177-183(1995))、E.coliエンドヌクレアーゼV(Yao and Kow,J.Biol.Chem.272:30774-30779(1997))、TkoEndoMS(Ishino et al.,Nucl.Acids Res.44:2977-2986(2016))、およびPyrococcus furiosus EndoMS(本明細書では「PfuEndoMS」と称される)が挙げられる。不一致エンドヌクレアーゼは、熱安定性(TsMME)または非熱安定性であり得る。
「EndoMS」という用語は、本明細書で使用される場合、表15に記載のEndoMSタンパク質のうちの1つ以上と少なくとも50%のアミノ酸配列同一性を共有し、不一致特異的エンドヌクレアーゼ活性を有する不一致特異的エンドヌクレアーゼを指す。「Nucs」は、EndoMSの代替用語として当技術分野で使用されてきた。したがって、「EndoMS」および「Nucs」という用語は、互換的に使用され得る。
「不一致結合タンパク質」(「不一致修復結合タンパク質」とも称される)という用語は、本明細書で使用される場合、二本鎖DNAにおける不一致塩基に対する特異的結合活性を有するタンパク質を指す。かかるタンパク質の例は、以下の表12および15に記載されている。これらのタンパク質の多くは、MutSホモログである。不一致結合タンパク質は、熱安定性または非熱安定性であり得る。
「エラー訂正」という用語は、本明細書で使用される場合、集団の核酸分子におけるヌクレオチド配列の欠陥の総数を減少させるように設計されたプロセスを指す。これらの欠陥は、不一致、挿入、欠失、および/または置換であり得る。欠陥は、(例えば、化学合成または酵素合成によって)生成された核酸分子が、各々ある位置に特定の塩基を含有することを意図しているが、1つ以上の核酸分子におけるその位置に異なる塩基が存在する場合に生じ得る。
エラー訂正の例は、以下のとおりである。100塩基対の所望の長さを有する二本鎖核酸分子の集団があると仮定する。また、二本鎖核酸分子の2つの鎖が各々別個に合成され、互いにハイブリダイゼーションして、集団の二本鎖核酸分子を形成すると仮定する。さらに、核酸合成は、平均200ヌクレオチド当たり1エラーをもたらすと仮定する。かかる場合、100塩基対当たり1つの「エラー」がある。したがって、平均して、集団の各二本鎖核酸分子には1つのエラーが含まれる。もちろん、集団における二本鎖核酸分子のいくつかにはエラーがなく、他の二本鎖核酸分子には1つより多くのエラーがある。エラー訂正プロセスによって核酸分子の半分が集団から除去され、エラーのない核酸分子がまったく除去されなかった場合、集団における残りの二本鎖核酸分子のエラー率は200塩基対中1つ未満になる。これは、上で示唆したように、除去された核酸分子がいくつかに1つより多くのエラーを有し、「正しい」核酸分子が除去されなかったためである。
本明細書で使用される場合、「エラー訂正ラウンド」および「エラー訂正のラウンド」という語句は、核酸分子の集団からのエラーを有する核酸分子の切断または除去をもたらす一連のステップを指す。説明の目的で図4を使用すると、ライン4~7は、エラー訂正の1ラウンドを記載している。図4に記載のプロセスは、一連の増幅反応(例えば、PCRサイクル)を含むが、エラー訂正のラウンドは必ずしもこれを必要としない。例えば、図4に記載のプロセスの改変は、不一致結合タンパク質を使用して、不一致を有しない核酸分子から不一致を有する核酸分子を分離し得る場合(ライン5を参照されたい)である。
本明細書で使用される場合、「エラー低減ポリメラーゼ試薬」は、ポリメラーゼ(例えば、DNAポリメラーゼ)、および増幅された核酸分子におけるエラーの数を低減する(例えば、約5%~約30%、約5%~約30%、約5%~約30%、約10%~約40%、約10%~約70%など)追加構成要素を含む組成物であり、追加構成要素は不一致認識タンパク質ではない。このような化合物の1つのカテゴリーは、本明細書に記載のアミンなどのアミンである。
「形質転換」という用語は、本明細書で使用される場合、外因性核酸分子がレシピエント細胞に入り、変化させるプロセスを説明する。それは、当技術分野で周知の様々な方法を使用して、自然または人工の条件下で生じ得る。形質転換は、外来核酸配列を原核または真核宿主細胞に挿入するための任意の既知の方法に依存し得る。この方法は、形質転換される宿主細胞に基づいて選択され、ウイルス感染、エレクトロポレーション、リポフェクション、および粒子衝撃を含み得るが、これらに限定されない。かかる「形質転換された」細胞には、挿入された核酸が自律的に複製するプラスミドとして、または宿主染色体の一部として複製することができる、安定に形質転換された細胞が含まれる。また、それらには、挿入されたDNAまたはRNAを限られた期間、一過性に発現する細胞も含まれる。
「固体支持体」という用語は、本明細書で使用される場合、オリゴヌクレオチドもしくは核酸分子などのポリマーが合成および/または固定され得る多孔性または非多孔性物質を指す。本明細書で使用される場合、「多孔質」とは、物質が、不均一または均一な直径(例えば、nm範囲で)のものであり得る細孔を含有することを意味する。多孔質物質には、紙、合成フィルターなどが含まれる。かかる多孔質物質では、反応は細孔内で起こり得る。固体支持体は、ピン、細長い片、プレート、ディスク、棒、繊維、ベンド、円筒構造、平面、凹面もしくは凸面、またはキャピラリーもしくはカラムなどの多くの形状のうちのいずれか1つを有し得る。固体支持体は、ビーズ、マイクロ粒子、ナノ粒子などを含む粒子であり得る。固体支持体は、類似サイズの非ビーズ型粒子(例えば、フィラメント)であり得る。支持体は、幅およびサイズは可変であり得る。例えば、本明細書に記載の方法の態様の実施において使用され得るビーズ(例えば、磁気ビーズ)のサイズは、広く変化し得るが、0.01μm~100μm、0.005μm~100μm、0.005μm~10μm、0.01μm~100μm、0.01μm~1,000μm、1.0μm~2.0μm、1.0μm~100μm、15 2.0μm~100μm、3.0μm~100μm、0.5μm~50μm、0.5μm~20μm、1.0μm~10μm、1.0μm~20μm、1.0μm~30μm、10μm~40μm、10μm~60μm、10μm~80μm、または0.5μm~10μmの直径を有するビーズを含み得る。
支持体は、疎水性であるか、または疎水性相互作用を介して分子に結合することができる。支持体は、親水性であるか、または親水性であることができ、シリカ、硫酸マグネシウム、およびアルミナなどの無機粉末、天然高分子物質、特にろ紙、クロマトグラフィー紙などの紙を含有する繊維などのセルロース物質およびセルロース由来物質が含まれる。支持体は、例えばマルチウェルプレートまたはマイクロチップなどの担体のアドレス指定可能な位置に固定化され得る。支持体は、ばらばらまたは粒子状(例えば、樹脂物質またはウェル中のビーズなど)であり得るか、または担体に可逆的に固定化または連結され得る(例えば、切断可能な化学結合または磁力などによって)。いくつかの態様では、固体支持体は断片化可能であり得る。固体支持体は、ニトロセルロース、炭素、酢酸セルロース、ポリ塩化ビニル、ポリアクリルアミド、架橋デキストラン、アガロース、ポリアクリレート、ポリエチレン、ポリプロピレン、ポリ(4-メチルブテン)、ポリスチレン、ポリメタクリレート、ポリ(エチレンテレフタレート)、ナイロン、ポリ(酪酸ビニル)、二フッ化ポリビニリデン(PVDF)膜、ガラス、制御細孔ガラス、磁気制御細孔ガラス、磁気もしくは非磁気ビーズ、セラミック、金属などの合成または修飾された天然ポリマーであり得、単独で使用される、他の素材と組み合わせて使用され得る。いくつかの態様では、支持体は、チップ、アレイ、マイクロアレイ、またはマイクロウェルプレート形式であり得る。多くの場合では、本明細書に記載の方法または組成物で使用される支持体は、支持体上に特徴(すなわち、個々の核酸分子を含有する位置)を生成するために、個々の核酸分子が別個で、または別個の領域で合成される支持体である。いくつかの態様では、定義された特徴のサイズは、特徴上に微小体積の液滴または反応体積を形成できるように選択され、各液滴または反応体積は互いに分離された状態に保たれる。本明細書に記載されるように、特徴は、液滴もしくは反応体積または隣接する2つの特徴間を融合しないように、典型的には中間特徴空間によって分離されるが、必ずしもそうである必要はない。中間特徴は、典型的には、その表面上に核酸分子を担持せず、不活性空間に対応する。いくつかの態様では、特徴および中間特徴は、それらの親水性または疎水性の特性が異なり得る。いくつかの態様では、特徴および中間特徴は修飾子を含み得る。本明細書に記載のいくつかの場合では、特徴は、ウェルまたはマイクロウェルまたはノッチである。核酸分子は、共有結合または非共有結合で表面に結合され得るか、または表面に沈着もしくは合成もしくはアセンブルされ得る。
単数形「a」、「an」、および「the」は、文脈上明確に別段指示されない限り、複数形の参照を含む。
概要
本明細書に記載の組成物および方法は、部分的に、高配列忠実度を有する核酸分子の調製に関する。多数の態様およびバリエーションが用いられ得るが、多くの場合では、核酸分子は合成される(例えば、化学的、酵素的など)。次いで、これらの合成された核酸分子は、任意選択で、例えばアセンブリPCR(例えば、一次アセンブリPCR)によってアセンブルされて、1つ以上のより大きな核酸分子を形成し得る。図1Aおよび図1Bは、本明細書に記載の方法において使用され得る例示的なアセンブリPCRステップを示す概略図である。
概して、合成されたオリゴヌクレオチドにおける配列エラーの存在量は比較的低く、半ランダムな分布がある。多くの場合では、エラーの塩基(例えば、欠失、挿入、置換)を有する核酸分子が正しい塩基を有する核酸分子とハイブリダイゼーションする場合、標準のワトソン-クリック塩基対を示さない領域が形成される。これらの「非標準」領域は、エラーを含有する核酸分子の認識に使用され得る。さらに、これらの「非標準」領域が核酸分子の集団において検出されると、これらの領域を含有する核酸分子は集団から除去され得るか、またはそれらの増幅を防止するか、もしくはそれらの増幅される能力を低下させるような方法で修飾され得る。
集団におけるエラー(例えば、欠失、挿入、置換)を含有する核酸分子のパーセンテージを低減させるために、多くの方法を使用し得る。これらの方法は、以下が含まれる。
1.エラーを含有する核酸分子の切断、
2.エラーを含有しない核酸分子からのエラーを含有する核酸分子の分離、
3.エラーを含有しない核酸分子と比較して、エラーを含有する核酸分子の増幅を抑制/阻害すること。
さらに、上の方法のうちの2つ以上を使用して、核酸分子に存在するエラーの数を低減させ得る。
本明細書に記載の開示の多くは、核酸分子の合成、アセンブリ(例えば、アセンブリPCR)および増幅のための組成物および方法に関する。本明細書で提供されるのは、高配列忠実度を有する核酸分子を生成するための組成物および方法である。
いくつかのアプリケーションの場合、低エラー率を有する核酸分子の使用が重要である。説明のために、100個の核酸分子がアセンブルされる状況を考えてもらいたい。各分子は100塩基対長であり、200塩基対ごとに1つのエラーがある。正味の結果は、アセンブルされた核酸分子の各10,000塩基対中、平均で50個の配列エラーがある。例えば、アセンブルされた核酸分子から1つ以上のタンパク質を発現させることを意図する場合、したがってアミノ酸配列エラーの数が高すぎると考えられる可能性がある。さらに、多くのタンパク質コード領域のヌクレオチド配列エラーは、概して望ましくないタンパク質が得られる「フレームシフト」変異をもたらす。また、非フレームシフトコード領域は、点変異を伴うタンパク質の形成をもたらす場合がある。これらのすべては、所望のタンパク質発現産物の「純度を低下させ」、産生された「夾雑」タンパク質の多くは、たとえアフィニティー精製を用いたとしても、最終的な発現産物混合物に持ち越される。
高配列忠実度は、アセンブリ前の核酸断片または部分的にアセンブルされた核酸分子の配列決定、正しい配列を有する核酸分子を識別するための完全にアセンブルされた核酸分子の配列決定、および/またはエラー訂正を含むいくつかの手段によって達成され得る。
エラーは、多くの方法で核酸分子に入る場合がある。かかる方法の例には、化学合成エラー、増幅/ポリメラーゼ媒介エラー(特にプルーフリーディングポリメラーゼが使用される場合)、およびアセンブリPCR媒介エラー(通常は核酸断片接合部で生じる)が含まれる。
核酸分子における配列エラーは、多くの方法で参照され得る。例として、合成核酸分子に関連するエラー率、エラー訂正および/または選択後の核酸分子に関連するエラー率、ならびに最終産物核酸分子に関連するエラー率(例えば、(1)正しい配列について選択されたいずれかを有する合成核酸分子、または(2)アセンブルされた化学的に合成された核酸分子のエラー率)がある。これらのエラーは、化学合成プロセス、アセンブリプロセス、および/または増幅プロセスに起因する可能性がある。エラーは、正しい配列を有する核酸分子の選択、エラー訂正、および/または改善された化学合成方法などの方法によって除去または防止され得る。
いくつかの場合では、本明細書に記載の方法は、エラー除去および防止方法を組み合わせて、エラーの数が比較的少ない核酸分子を産生し得る。したがって、本明細書に記載の方法によって産生されるアセンブルされた核酸分子は、1,500中約1塩基~30,000中約1塩基、2,000中約1塩基~30,000中約1塩基、4,000中約1塩基~30,000中約1塩基、8,000中約1塩基~30,000中約1塩基、10,000中約1塩基~30,000中約1塩基、15,000中約1塩基~30,000中約1塩基、10,000中約1塩基~20,000中約1塩基などのエラー率を有し得る。
アセンブルされた核酸分子におけるエラー数を低くする2つの方法は、(1)正しい配列を有するアセンブリのための核酸分子(例えば、オリゴヌクレオチド、亜断片など)の選択、および(2)核酸分子、部分的にアセンブルされた亜アセンブリ、または完全にアセンブルされた核酸分子のエラーの訂正によるものである。
エラーは、核酸分子が生成される方法に関係なく、核酸分子に組み込まれる場合がある。正しい配列を持つことが既知の核酸分子をアセンブリPCRに使用した場合でさえも、エラーが最終的なアセンブリ産物に入る可能性がある。したがって、多くの場合では、エラーの低減が望まれる。
多くの場合では、化学合成されたオリゴヌクレオチドからより大きな核酸分子を生成する方法に関係なく、化学合成プロセス由来のエラーが存在する。エラーのない核酸分子を同定および選択するために個々の核酸分子の配列決定が実施され得るが、代替アプローチは、1つ以上のエラー訂正または除去ステップを含み得る。したがって、多くの場合では、エラー訂正が望ましい。エラー訂正は、様々な方法で達成され得る。典型的には、かかるエラー除去ステップは、アセンブリPCRの第1のラウンドの後に実施される。したがって、いくつかの態様では、本明細書に記載の方法は、以下を(この順序または異なる順序で)含み得る:(i)断片増幅および/またはアセンブリPCR(例えば、本明細書に記載の方法による)、(ii)エラー訂正、(iii)最終アセンブリ(例えば、本明細書に記載のインビトロまたはインビボ方法による、例えば、図1Aまたは1Bに記載のようなプロトコルを使用して)。
これらの分子を生成するために使用されるワークフローにおける1つ以上の位置で、核酸分子からエラーを除去し得るか、そうでなければ回避し得る。説明のために図1Aに記載したワークフローを使用すると、配列エラーがほとんど導入されない条件下でオリゴヌクレオチド合成が実施され得る。核酸アセンブリPCR(例えば、オリゴヌクレオチドアセンブリ)は、不一致認識ベースのエラー訂正と併せて実施され得る。アセンブルされた核酸分子は、不一致認識ベースのエラー訂正と併せて増幅され得る。アセンブルされた核酸分子は、アセンブリPCRまたは増幅がない場合で、不一致認識ベースのエラー訂正を受けてもよい。これは、多くの場合、対象の核酸分子の熱変性、続く核酸分子の再生によって行われ、続いてそれを1つ以上の不一致認識タンパク質と接触させる。
さらに、核酸分子へのエラーの導入は、多くの方法で回避または軽減され得る。これらの方法のいくつかには、エラーをほとんど含有しない核酸出発物質の使用が含まれる。実施例2ならびに表10および11に記載されるように、エラーをほとんど含有しない核酸出発物質の使用により、アセンブルされたエラー訂正された分子に存在するエラーが少なくなる。これは、エラー訂正方法が存在するエラーを常に100%訂正できるとは限らないためであると考えられている。したがって、概して、訂正のために存在するエラーが少ないほど、エラー訂正後のエラーも少なくなる。
多くの場合では、核酸分子出発物質は、250個中約1つ~2,000個中約1つ(例えば、250個中約1つ~1,900個中約1つ、250個中約1つ~1,500個中約1つ、250個中約1つ~1,200個中約1つ、250個中約1つ~1,000個中約1つ、250個中約1つ~800個中約1つ、400個中約1つ~1,900個中約1つ、400個中約1つ~1,500個中約1つ、400個中約1つ~1,100個中約1つ、650個中約1つ~2,000個中約1つ、650個中約1つ~1,700個中約1つ、650個中約1つ~1,500個中約1つなど)である配列エラーの初期平均数を有する。
実施例2にも記載されているように、エラー訂正効率は、使用される熱サイクル条件である程度変化する。したがって、低エラー数を有する産物核酸分子を得るために変更され得る1つの因子は、熱サイクル条件である。
核酸分子へのエラーの導入を回避する別の方法は、例えば、少ないエラーを有する核酸サブユニットを生成するための合成方法の使用によるものである。別の方法は、核酸分子の低エラー複製アセンブリおよび増幅のための高忠実度ポリメラーゼおよび高忠実度増幅方法を使用することである。
説明のために図2のワークフローを使用すると、合成的に産生されたオリゴヌクレオチドは、一連の加熱および冷却ステップを介してDNAポリメラーゼによってアセンブルされ、各アセンブリPCRサイクルで大きな核酸分子をもたらす。一本鎖核酸分子の相補的領域のハイブリダイゼーションは、各アセンブリPCRサイクル中に生じる。これらのハイブリダイゼーション反応中に、標準のワトソン-クリック塩基対を示さない領域が形成される可能性があり、これが生じると、これらの結果として生じる二本鎖核酸分子は、エラーを含有するものとして「マーク付け」される。本明細書に記載の核酸分子の「エラー訂正された」集団を生成するための方法は、混合集団からのエラーを含有する核酸分子の普及を排除または減少させる(「エラー訂正」)ために、DNAポリメラーゼおよび不一致認識タンパク質を使用する。
説明のために図2のワークフローを再び使用すると、エラー訂正は、任意の1つ以上のステップおよびより大きなワークフローにおける他の場所(例えば、示される一次増幅の後)で実施され得、複数のエラー訂正試薬およびエラー訂正メカニズム、ならびにその他のエラー低減方法を含み得る。さらに、図2は、一連のアセンブリPCRおよび増幅反応を示す。エラー訂正は、これらのステップのいずれにおいても生じないか、これらのステップのいくつか、またはすべてで生じ得る。例えば、図2は、アセンブリPCR反応の4つの重複伸長サイクルを示す(示された下向き矢印(a)~(c)の数に基づく)。例えば、熱安定性不一致認識タンパク質が使用される場合、それは、第1のアセンブリPCRサイクルの前に追加され得るか、アセンブリPCR反応中に(すなわち、伸長サイクルのうちの1つ以上が完了した後に)追加され得る。使用され得るエラー訂正試薬の例には、不一致エンドヌクレアーゼおよび不一致結合タンパク質が挙げられる。
エラー訂正を実施するために使用され得る試薬には、不一致エンドヌクレアーゼ、不一致結合タンパク質、ならびに高忠実度ポリメラーゼ、および高忠実度ポリメラーゼを含む試薬が含まれる。さらに、本明細書に記載の方法において使用されるタンパク質は、熱安定性または非熱安定性であり得る。高忠実度ポリメラーゼを含有する試薬の一例は、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ(Thermo Fisher Scientific、カタログ番号12361010)である。
核酸分子のエラー訂正の1つの一般的なワークフローは、配列相補性の領域を有する一本鎖核酸分子が互いにハイブリダイゼーションされるか、または二本鎖核酸分子が変性され、次いで互いにハイブリダイゼーションされるかのいずれかである。かかる場合では、ヌクレオチド配列が1つ以上のヌクレオチドが異なる2つの核酸鎖が互いにハイブリダイゼーションする場合、得られる二本鎖核酸分子は、概して、ワトソン-クリック塩基対合が示されない領域を形成する。いくつかの場合では、エラー訂正プロセスは、ワトソン-クリック塩基対合が示されていない領域の認識に基づき得る。したがって、多くの場合では、エラー訂正プロセスは、二本鎖核酸分子を形成するための一本鎖核酸分子のハイブリダイゼーションを含む。エラー訂正はDNAポリメラーゼの非存在下で実施され得るが、エラー訂正を含み得るアセンブリPCRおよび増幅プロセスを図1A、図1Bおよび図2に示す。
本明細書に記載の方法は、アセンブリPCRおよび/または増幅ステップに関連するエラー低減、エラー訂正の様々な組み合わせを含む。さらに、エラー訂正プロセスは、かかるステップに統合されるか、またはかかるステップの前もしくは後に生じ得る。
本明細書に記載の方法は、本明細書に記載のワークフローの任意の数のステップおよび組み合わせを含み得る。本明細書に記載の方法の例示的な態様を説明するために図1A、図2、ならびに図5Aおよび5Bのワークフローを使用すると、重複配列相補性の末端を有するオリゴヌクレオチドが生成され得る(図1A)。次いで、これらのオリゴヌクレオチドは、一連のアセンブリPCRサイクルによってアセンブルされ得、一次アセンブリPCRと呼ばれる(図1Aおよび図2)。次いで、末端プライマーを使用してアセンブリ産物が増幅され、一次増幅と呼ばれる(図1Aおよび図2)。例えば、図2に記載されるように、相補的な末端配列を有する別々のアセンブリPCR反応において生成されたアセンブリ産物は、図5Aおよび5Bの上部に記載のようにさらにアセンブルされ得、二次アセンブリPCRと呼ばれる。これらの例では、亜断片PCR産物A、B、およびCを容器に組み合わせて、1カップ不一致切断ベースエラー訂正を実施し、続いて、エラー訂正された断片を融合および伸長するためのPCRステップを実施し(それぞれライン3における第3のPCRと称される)、その結果、断片A、B、およびCを含むより長い核酸アセンブリ産物が得られる。エラー訂正は、各アセンブリおよび/または増幅ステップの前および/または後に生じ得る。
説明のために図7に記載のデータを使用すると、一次アセンブリPCRはTkoEndoMSの存在下または非存在下で実施された。各場合では、TkoEndoMSの存在下または非存在下でも続いて一次増幅が行われた。次いで、T7NIを使用したエラー訂正が行われ、これには、二次増幅が含まれる。
図1Bは、一次アセンブリPCRおよび一次増幅のみ生じるワークフローを示す。
要約すると、いくつかの態様では、本明細書で提供されるのは、アセンブリPCRおよび/または増幅ステップの組み合わせを含む方法であり、エラー訂正は、かかるステップ中またはかかるステップのうちのいずれかの間で生じ得る。多くの場合では、1つ以上の熱安定性不一致認識タンパク質が、アセンブリPCRおよび/または増幅ステップ中に存在し得る。
「一次アセンブリPCR」という用語は、一本鎖核酸分子がアセンブルされて、個々の一本鎖核酸分子よりも長さが長い二本鎖核酸分子を形成するアセンブリPCR反応を指す。図1Bのワークフローは、一本鎖核酸分子が二本鎖核酸分子(すなわち、ベクター)でアセンブルされるアセンブリ反応を示しているが、これは、ベクター挿入物が一本鎖核酸分子から形成されるため、一次アセンブリPCRを含むと考えられる。したがって、かかる場合では、ベクター挿入物は、一次アセンブリPCRを介してアセンブルされる。
「二次アセンブリPCR」という用語は、最初の二本鎖核酸分子がアセンブルされて、最初の二本鎖核酸分子よりも長さが長い産物二本鎖核酸分子を形成するアセンブリPCR反応を指す。
「一次増幅」という用語は、一本鎖核酸分子がアセンブルされて二本鎖核酸分子を形成するアセンブリPCR反応の産物に対して実施される第1のセットの増幅反応を指す。後の増幅サイクルは、「二次」、「三次」、「四次」などと称される。例として、図5Aのステップ3は二次増幅である。一次増幅後の増幅サイクルは、開始核酸分子よりも長さが異なる増幅産物をもたらしてもよく、またはもたらさなくてもよい。ワークフローは、増幅サイクルを互いに区別する。例えば、図7は、TkoEndoMSの存在下または非存在下で生じる一次増幅から得られるデータを示す。さらに、図7は、T7NIを使用したエラー訂正と続く二次増幅を含むデータを示す。
核酸分子の生成
目的の核酸分子またはタンパク質を産生する際の第1のステップのうちの1つは、分子が同定された後の核酸分子の設計である。合成される核酸配列および核酸分子を生成するために使用されるオリゴヌクレオチドの設計には、多くの因子が関与する。これらの因子には、以下のうちの1つ以上が含まれる:(1)核酸分子(例えば、コード領域)の全部または一部のAT/GC含有量、(2)制限エンドヌクレアーゼ切断部位の存在または非存在(制限部位の付加および/または除去を含む)、(3)用いられる特定のタンパク質産生または宿主発現系のための好ましいコドン使用法、(4)アセンブルされるオリゴヌクレオチドの接合部、(5)所望の核酸分子を産生するために使用されるオリゴヌクレオチドの数および長さ、(6)望ましくない領域(例えば、「ヘアピン」配列、細胞核酸との配列相同領域、反復配列、抑制性シス作用要素、制限酵素切断部位、内部スプライシング部位など)の最小化、ならびに(7)5’および3’構成要素の結合に使用され得るコーディング領域隣接セグメント(例えば、制限エンドヌクレアーゼ部位、プライマー結合部位、配列決定アダプターまたはバーコード、組換え部位など)。
多くの場合では、パラメータはコンピュータに入力され、ソフトウェアは入力パラメータのバランスをとるインシリコヌクレオチド配列を生成する。ソフトウェアは、例えば、入力基準のいくつかに厳密に一致する核酸分子であるとみなされるものは、アセンブルするのが困難または不可能である可能性があるという点で、入力パラメータに「重み付け」を配置する場合がある。例示的な核酸設計方法は、米国特許第8,224,578号に記載されている。下でさらに説明するように、配列設計は、産物核酸分子の異なる亜断片に属するオリゴヌクレオチドの多重化の要件も考慮に入れることができる。
さらに、核酸分子の設計因子は、核酸分子の長さにわたって、または分子の特定の領域において考慮され得る。例えば、分子内の特定の位置に起因する合成の「失敗」を防止するために、核酸分子の長さにわたってGC含有量を制限してもよい。したがって、核酸分子の合成可能性は、領域的な「アセンブルの失敗」が、設計された核酸分子がアセンブルされなということをもたらす点で、核酸分子全体の特徴である。領域的な観点から、最適な翻訳のためのコドンが選択され得るが、これは、例えばGC含有量の局所的な制限と競合する場合がある。
アセンブリの成功には、多くの場合、目的の核酸分子の複数のパラメータおよび領域的な特性が関与する。全体および領域的なGC含有量は、パラメータの一例にすぎない。例えば、核酸分子の総GC含有量は50%であり得るが、同じ核酸分子の特定の領域におけるGC含有量は75%であり得る。したがって、多くの場合では、GC含有量は核酸分子全体にわたって「バランスがとれて」おり、領域的に総GC含有量から15%、10%、8%、7%、または5%未満変化し得る。
したがって、目的は、様々な要件を満たす中で可能な限り最適な妥協点に到達することである。産物核酸分子がタンパク質をコードする場合、タンパク質における多数のアミノ酸が、遺伝子コードの縮重に基づいて、原則として、目的のタンパク質を発現できる可能なDNA配列の数の組み合わせ爆発に至る。このため、最適なコドン配列を確認するために、様々なコンピュータ支援方法が提案されている。
所望の核酸分子のアセンブリPCRに使用されるオリゴヌクレオチドまたは核酸亜断片は、多くの供給源から得ることができ、例えば、それらは、クローニング、ポリメラーゼ連鎖反応由来、化学合成または購入され得る。多くの場合では、化学的に合成された核酸は、100ヌクレオチド長未満のものになる傾向がある。PCRおよびクローニングを使用して、はるかに長い核酸を生成し得る。さらに、核酸(例えば、核酸断片)に存在するエラーの塩基のパーセンテージは、それが作られる方法にある程度関係している。典型的には、化学合成された核酸は、エラー率が最も高くなる。
オリゴヌクレオチドの化学合成のための多くの方法が既知である。多くの場合では、オリゴヌクレオチド合成は、所望の長さおよび配列のオリゴヌクレオチドが得られるまで、伸長する鎖の5’末端にヌクレオチドを段階的に付加することによって実施される。さらに、各ヌクレオチド付加は合成サイクルと称され得、多くの場合、4つの化学反応、(1)脱ブロッキング/脱保護、(2)カップリング、(3)キャッピング、および(4)酸化からなる。
EGAおよびPGA脱保護試薬およびかかる酸を生成するための方法、ならびにオリゴヌクレオチド合成におけるそれらの使用は、例えば Maurer et al.,“Electrochemically Generated Acid and Its Containment to 100 Micron Reaction Areas for the Production of DNA Microarrays”,PLoS,Issue 1,e34(2006)、またはPCT公開第2013/049227号および同第2016/094512号に記載されている。したがって、いくつかの場合では、EGAは脱保護プロセスの一部として生成される。さらに、特定の場合では、オリゴヌクレオチド合成反応のすべてまたは一部は、水溶液中で実施され得る。他の例では、有機溶媒が使用される。
多くの場合では、典型的な核酸アセンブリPCRプロトコルは、例えば、一本鎖オーバーハングエキソヌクレアーゼ媒介生成、それに続くPCRベースのアセンブリ(「標準のワークフロー」)などの本明細書に記載の方法の組み合わせを含み得る。いくつかの態様では、かかる標準のワークフローは、少なくとも以下のステップを含み得る:(i)所望のアセンブリ産物の配列を含む一本鎖オリゴヌクレオチドを一緒に合成することであって、各オリゴヌクレオチドは、別のオリゴヌクレオチドの配列領域に相補的である配列領域を有する、合成すること、(ii)オリゴヌクレオチドをそれらの相補的配列領域を介してハイブリダイゼーションさせ、重複伸長PCR反応(一次アセンブリPCR)でオリゴヌクレオチドを伸長させて、1つ以上の二本鎖核酸分子をアセンブルすること、(iii)末端プライマーの存在下でアセンブルされた核酸分子を増幅すること(一次増幅)、(iv)増幅された核酸分子を精製すること、(v)増幅された1つ以上の核酸分子の末端で一本鎖オーバーハングを生成し、任意選択で、後続のクローニングのための線形化された標的ベクターの末端(例えば、制限エンドヌクレアーゼおよび/またはエキソヌクレアーゼでの断片の処理による)で一本鎖オーバーハングを生成すること、(vi)1つ以上の核酸分子を、相補的な一本鎖オーバーハングを介して標的ベクターに挿入し、任意選択で、続いてライゲーションステップを行うこと、および(vii)得られるベクター構築物で宿主細胞(例えば、E.coli)を形質転換すること。いくつかの態様では、アセンブルされた核酸分子は、形質転換された細胞の内因性酵素活性によって「インビボ」でライゲーションされ得る。例えば、ギャップまたはニックの入ったアセンブリ産物をE.coliに直接形質転換し得、ギャップまたはニックはE.coli内因性修復機構によって修復され得る。
核酸分子をアセンブルするための2つの方法を図1Aおよび1Bに示す。これらの方法は両方とも、PCRを使用して、概して、これらの相補的配列領域を介して一緒に「縫い合わされた」末端で重複する配列を含有するオリゴヌクレオチドまたは亜断片から開始することを含む。いくつかの態様では、重複は約10塩基対であり、他の態様では、重複は、15、25、30、50、60、70、80または100塩基対など(例えば、約10~約120、約15~約120、約20~約120、約25~約120、約30~約120、約40~約120、約10~約40、約15~約50、約40~約80、約60~約90、約20~約50、約15~約35などの塩基対)であり得る。アセンブリのミスを避けるために、個々の重複は、典型的には、亜断片間で複製されていないか、または密接に一致しない。ハイブリダイゼーションは関与する核酸分子または領域間で100%の配列同一性を必要としないため、アセンブリのミスを防ぐために各末端は十分に異なっている必要がある。さらに、互いに相同組換えを受けることを意図した末端は、少なくとも90%、93%、95%、または98%の配列同一性を共有する必要がある。
さらに、複数サイクルのポリメラーゼ連鎖反応を使用して、連続的により大きな核酸分子を生成し得る。多くの場合では、縫い合わされたオリゴヌクレオチドは化学的に合成され、100ヌクレオチド長未満(例えば、約40~100、約50~100、約60~100、約40~90、約40~80、約40~75、約50~85などのヌクレオチド)である。クローニングベクターへの挿入が望まれる場合には、制限部位を含有するプライマーが使用され得る。望ましい場合、アセンブルされた核酸分子は、ベクターおよび宿主細胞に直接挿入され得る。所望の構築物がかなり小さい場合(例えば、5キロベース未満)、標的ベクターへのPCRベースの挿入が適切な場合がある。
標準のワークフローは、オリゴヌクレオチド合成、オリゴヌクレオチドをアセンブルするための一次アセンブリPCR、アセンブルされた産物を増幅するための一次増幅、続く増幅された産物の精製、精製された挿入物および標的ベクター間での一本鎖重複を生成するためのヌクレアーゼでの処理、標的ベクターへの挿入物の挿入、続く形質転換ステップの基本的なステップによって図1Aに表されている。
別のアセンブリPCR法は、組み合わせた配列伸長およびライゲーション反応を含み(図1B)、上記の標準のワークフローのステップ(ii)、(iii)および(vi)を単一(「ワンポット」)反応に組み合わせ、一方で、他のステップ(ステップ(iv)および(v)など)は省略されてもよい。特に、かかる方法は、単一ステップでの得られる亜断片-ベクター融合構築物の重複伸長PCRおよび増幅(一次増幅)を介した線状化された標的ベクターへの一本鎖重複オリゴヌクレオチドの直接アセンブリ(一次アセンブリPCR)を含む。いくつかの態様によれば、ベクター挿入前に二本鎖亜断片を生成するために別個のPCR反応は必要とされない。代わりに、アセンブルされるポリヌクレオチドの少なくとも一部を一緒に表す一本鎖オリゴヌクレオチドが、重複伸長反応に直接使用され得る。所与の線状化されたベクターの鎖を分離するための最初の変性ステップの後、一本鎖オリゴヌクレオチドは、それらの相補的な末端を介してアニーリングされる。オリゴヌクレオチドのうちの2つは、変性ベクター鎖の1つの末端とのハイブリダイゼーションを可能にするベクター骨格との配列相同性を保持するように設計されている。アニーリングされたオリゴヌクレオチドの3’末端および/またはベクター鎖の3’末端は、相補的核酸鎖の合成のためのプライマーとして機能する。ハイブリダイゼーションしたオリゴヌクレオチドの5’末端に遭遇すると、ポリメラーゼによる伸長が停止し、ニックの入った環状化された二本鎖核酸分子の産生がもたらされる。融合および増幅されたアセンブリ産物は、さらに精製することなく宿主細胞に直接形質転換され得る。いくつかの態様では、形質転換の前にライゲーションステップは実施されない。ニックの入った融合構築物の最終ライゲーションは、宿主細胞内で内因的に達成される。
アセンブリ連鎖反応では、オリゴヌクレオチドの変性、アニーリング、および相互伸長の連続サイクルによって、重複オリゴヌクレオチドが線状二本鎖DNA断片にアセンブルされる(一次アセンブリPCR)(図2を参照されたい)。後続の増幅反応では、アセンブリPCRによって形成された核酸分子は、末端プライマーを使用してPCRによって増幅され、アセンブルされた核酸分子を生成および/または増幅し(一次増幅)、「そのまま」または下流のプロセス(例えば、ベクターへの挿入、図1Aを参照されたい)において使用され得る。
本明細書に記載のいくつかの態様では、1つ以上の熱安定性不一致認識タンパク質が、アセンブリPCRおよび/または増幅反応に存在する(例えば、図2を参照されたい)。熱安定性不一致認識タンパク質を含めることで、変性ステップ後に不一致認識タンパク質を追加する必要があり、複数ラウンドのエラー訂正および/またはエラー抑制を実施できる。したがって、不一致認識タンパク質を用いて、正しい核酸分子およびエラーを含有する核酸分子を含む集団中の核酸分子の数および/またはパーセンテージを減少させ得る。
増幅中の核酸分子のエラーを訂正するための1つのプロセスの概略図(プライマーは示していない)を図3に示す。この概略図は、上部左に一本鎖核酸分子を示しており、そのうちのいくつかは点変異を含有する(楕円および円で示されている)。ハイブリダイゼーションの際に、点変異を有する一本鎖核酸分子が、同じ点変異を含有しない核酸分子とハイブリダイゼーションする可能性が高い。これの正味の結果は「不一致」である。次いで、二本鎖核酸分子の集団を、認識された不一致を含有する核酸分子を切断する不一致エンドヌクレアーゼと接触させ、切断核酸分子を対数増幅に好適でないようにする。もちろん、他の方法を使用して、不一致を含有する核酸分子の対数増幅を阻害することもできる。例えば、不一致結合タンパク質を使用して、不一致を含有する核酸分子を除去するか、またはそのような核酸分子の増幅を阻害することができる。さらに、エラー低減ポリメラーゼ試薬が増幅中に使用され得る。
より詳細には、図3は、エラーが最小化された核酸分子の合成のための例示的なプロセスのワークフローを示している。第1のステップでは、アセンブルされた核酸分子よりも短い長さの核酸分子が得られる。より小さい核酸分子の各々は、アセンブルされた核酸分子の一部を含む所望のヌクレオチド配列を有することが意図される。図3に記載のプロセスの第2~最後のステップでは、アニーリングされた核酸分子を、エラー訂正プロセスの一部として、1つ以上のエキソヌクレアーゼと反応させる。このプロセスのいくつかのバリエーションは以下のとおりである。第一に、2回以上(例えば、2回、3回、4回、5回、6回など)のエラー訂正が、実施され得る。第二に、1回以上のエラー訂正において、1つより多くのエンドヌクレアーゼが使用され得る。例えば、T7NIおよびCel IIは、エラー訂正の各ラウンドにおいて使用され得る。第三に、異なるエンドヌクレアーゼが異なるエラー訂正ラウンドにおいて使用され得る。例えば、T7NIおよびCel IIは、エラー訂正の第1ラウンドにおいて使用され得、TkoEndoMSは、エラー訂正の第2ラウンドにおいて単独で使用され得る。
多くの場合では、エラー訂正中にリガーゼが反応混合物中に存在してもよい。エラー訂正プロセスにおいて使用されるいくつかのエンドヌクレアーゼは、ニッカーゼ活性を有すると考えられる。1つ以上のリガーゼを含めると、かかる酵素によって密封ニックが引き起こされ、増幅後のエラー訂正された核酸分子の収量が増加すると考えられる。使用され得る例示的なリガーゼは、T4DNAリガーゼ、Taqリガーゼ、およびPBCV-1DNAリガーゼである。本明細書に記載の方法の実施において使用されるリガーゼは、熱不安定性または熱安定性であり得る(例えば、Taqリガーゼ)。熱不安定性リガーゼを使用する場合、典型的には、各エラー訂正ラウンドで反応混合物に再添加する必要がある。熱安定性リガーゼは、温度が変性点以下に保たれている限り、典型的には、各ラウンド中に再添加する必要はない。
多くの場合では、核酸分子のエラー訂正は、1つ以上の異なる不一致認識タンパク質によって媒介され得る。かかるタンパク質のカテゴリーの例は、不一致結合タンパク質および不一致エンドヌクレアーゼである。さらに、不一致結合タンパク質および不一致エンドヌクレアーゼは、熱安定性または非熱安定性であり得、これは多くの場合、タンパク質が使用される条件および特定のタンパク質の生物学的活性(例えば、認識されるエラーのタイプ)の因子に依存する。
本明細書に記載の方法で使用され得るエラー訂正の1つの例示的な方法を、図4および5Aに記載する。図4は、エラーが最小化された核酸分子の合成のための例示的なプロセスのフローチャートである。第1のステップ(ライン1)では、それからアセンブルされた核酸分子よりも短い長さの核酸分子(例えば、オリゴヌクレオチド)が得られる。各オリゴヌクレオチドは、アセンブルされた核酸分子のヌクレオチド配列の一部を含む所望のヌクレオチド配列を有することが意図される。各オリゴヌクレオチドはまた、以下のうちの1つ以上を含むヌクレオチド配列を有することを意図し得る:(1)核酸分子のPCR増幅のためのアダプタープライマー、制限酵素の認識部位、(2)マイクロチップまたは固体支持体への結合のためのテザリング配列、または(3)実験目的またはその他の意図によって決定された任意のその他のヌクレオチド配列。オリゴヌクレオチドは、本明細書の他の箇所に記載されているように、例えば、合成、購入などを介して、1つ以上の方法のうちのいずれかで得ることができる。
任意選択の第2のステップ(図4、ライン2)では、オリゴヌクレオチドを増幅して、各オリゴヌクレオチドをより多く得る。しかしながら、多くの場合では、十分な数のオリゴヌクレオチドが産生されるため、増幅は必要ない。用いられる場合、増幅は、当技術分野で既知の任意の方法、例えば、PCR、ローリングサークル増幅(RCA)、ループ媒介等温増幅(LAMP)、核酸配列ベースの増幅(NASBA)、鎖置換増幅(SDA)、リガーゼ連鎖反応(LCR)、自己維持配列複製(3SR)、またはブリッジPCRなどの固相PCR反応(SP-PCR)などによって達成され得る(例えば、様々な増幅技術の概要については、Fakruddin et al.,J.Pharm.Bioallied.Sci.5(4):245-252(2013)を参照されたい)。核酸分子のうちのいずれかのヌクレオチド配列への追加のエラーの導入は、増幅中に生じ得る。いくつかの場合では、合成後の増幅を避けることが好ましい場合がある。ステップ1で核酸分子が十分な収率で産生された場合、任意選択の増幅ステップは省略されてもよい。これは、例えば、PCT公開第2016/094512号に記載されているように、十分な収量および品質で核酸分子の合成を可能にするように設計された、例えば最適化されたビーズ形式を使用することによって達成され得る。
第3のステップ(図4のライン3)では、任意選択で、増幅された核酸分子が、所望の長さを有することを意図した核酸分子の第1のセットにアセンブルされる(一次アセンブリPCR)。もちろん、いくつかの場合では、ライン3の核酸分子は、さらに大きな核酸分子の亜断片であってもよい。
第4のステップ(図4のライン4)では、アセンブルされた核酸分子の第1のセットを変性する。変性は、二本鎖分子から一本鎖分子にする。変性は、任意の手段によって達成され得る。いくつかの態様では、変性は、分子を加熱することによって達成される。
第5のステップ(図4のライン5)では、変性された分子をアニーリングする。アニーリングは、一本鎖分子から二本鎖核酸分子の第2のセットにする。アニーリングは、任意の手段によって達成され得る。いくつかの態様では、アニーリングは、分子を冷却することによって達成される。アニーリングされた分子のいくつかは、配列エラーの部位を表す1つ以上の不一致を含む場合がある。
第6のステップ(図4のライン6)では、分子の第2のセットを1つ以上の不一致切断エンドヌクレアーゼと反応させて、完全な所望の遺伝子配列の長さよりも短い長さを有することが意図された核酸分子の第3のセットを得る。例示的な不一致結合および/または切断酵素は、本明細書の別の場所に記載されているが、T7NI、エンドヌクレアーゼVII(T4遺伝子49によってコードされる)、RES Iエンドヌクレアーゼ、CEL Iエンドヌクレアーゼ、EndoMS(例えば、PfuEndoMS、TkoEndoMSなど)、およびSPエンドヌクレアーゼまたは酵素複合体を含有するエンドヌクレアーゼが挙げられる。これらのエンドヌクレアーゼは、概して、第2セットの分子のうちの1つ以上をより短い分子に切断(一本鎖または二本鎖切断)することによって機能する。エラー部位で切断された1つ以上の分子の断片のアセンブリが、プロセスの最終ステップで切断エラーを除去する可能性を提供するという点で、任意のヌクレオチド配列エラーの部位での切断が特に望ましい。
第7のステップ(図4のライン7)では、分子の第3のセットが、所望のヌクレオチド配列の全長であることを意図した長さの分子の第4のセットにアセンブルされる。典型的には、重複伸長PCRに基づく第7のステップでは、DNAポリメラーゼの3’->5’エキソヌクレアーゼ活性が、不一致の部位で第6のステップにおいてエンドヌクレアーゼ切断によって生成された3’オーバーハングを除去し、それによってエラーを除去する。したがって、DNAポリメラーゼの固有のエキソヌクレアーゼ活性を使用して、ステップ6において除去されなかったアセンブリ中のエラーを除去し得る(例えば、不一致切断およびエキソヌクレアーゼ活性を有するヌクレアーゼの組み合わせを使用することにより)。この原理は、例えば、Saaemら(“Error correction of microchip synthesized genes using Surveyor nuclease”,Nucl,Acids Res.,40:e23(2012))において概説されている。かかる最終アセンブリステップは、末端プライマーの存在下で実施され得、それにより、クローニングまたはタンパク質発現などの下流プロセスに必要な機能が含まれる。それぞれのPCR反応は、末端プライマーの非存在下での変性、アニーリング、および伸長の約15サイクルでの完全長への重複伸長、続く末端プライマー存在下での追加の20サイクルによって、最初にエラー訂正された断片をアセンブルすることができるように設定され得る。
上記および図4に記載のプロセスは、米国特許第7,704,690号にも記載されている。さらに、上述のプロセスは、プロセッサ実行可能命令としてコンピュータ可読媒体上にコード化され得る。
図5Aに記載の方法において使用され得る1つの代表的なワークフロー。このワークフローでは、3つの核酸亜断片(ライン1)がプールされ、酵素T7エンドヌクレアーゼI(「T7NI」)を使用してエラー訂正に供される(ライン2)。次いで、得られる産物は、PCRによってアセンブルされ(ライン3)、次いでエラー訂正の第2のラウンドに供される(ライン4)。PCRの別のラウンド(ライン5)の後、得られる核酸分子をE.coliへ形質転換し(ステップ6)、次いで、完全長のものをスクリーニングし(ライン7)、続いてDNA調製を行う(ライン8)。次いで、これらの核酸分子は、例えば配列決定によって残りのエラーについてスクリーニングされ得る(ライン9)。図5Aのワークフローの第1のバリエーションでは、プールされた亜断片は、エラー訂正プロセスに供される前に、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIなど)で処理され得る。エキソヌクレアーゼ処理は、後続のPCR反応を妨害し、非特異的な増幅産物を生成する可能性があるPCR反応産物に残った一本鎖プライマー分子を除去する。ワークフローの第2のバリエーションでは、第1のエラー訂正ステップは、例えば、RES Iと組み合わせたT7NIなどの2つ以上のエンドヌクレアーゼを使用し得る。任意選択で、ワークフローは、断片融合PCR後に残っている不一致を排除するために、第3のエラー訂正またはエラー除去ステップを含み得る。かかる第3のステップは、例えば、MutSなどの不一致結合タンパク質で実施され得る。当業者は、アセンブルされた核酸分子のエラー率をさらに減少させるために、第1、第2および/または第3の、場合によってはさらなるエラー訂正および/または除去ラウンドの様々な順序および組み合わせが適用され得ることを理解するであろう。
本明細書に記載の方法で使用され得る、化学的に合成された核酸分子のエラー訂正を達成するための別のプロセスは、ERRASE(商標)(Novici Biotech)と称される商業的プロセスによるものである。
図5Aのワークフローのバリエーションは、図5Bに概説されている。この実施形態では、3つの亜断片(図5B、ライン1)がプールされ、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIなど、右側のワークフローのライン2a)で処理されて、二重エラー訂正処理に供される(図5B、ライン2bおよび4)。エキソヌクレアーゼは、後続のPCR反応(ライン3)を妨害し、非特異的な増幅産物を生成する可能性があるPCR反応産物に残った一本鎖プライマー分子を除去する。ワークフローの別のバリエーションでは、第1のエラー訂正ステップは、例えば、RES Iと組み合わせたT7NIなどの1つより多くのエンドヌクレアーゼを使用し得る(図5B、ライン2b)。任意選択で、ワークフローは、セグメントアセンブリPCRの後に残っている不一致を排除するための第3のエラー訂正ステップを含み得る(ライン3、この例3では二次アセンブリPCR)。かかる第3のエラー訂正ステップは、例えば、MutSなどの不一致結合タンパク質で実施され得る(ライン4)。もちろん、アセンブルされた核酸分子のエラー率をさらに減少させるために、第1、第2および/または第3の、場合によってはさらなるエラー訂正のラウンドの様々な順序および組み合わせが適用され得る。
説明のために図5Aに示したワークフローを使用すると、エラーを含有する核酸分子は、1つ以上のステップで除去され得る。例えば、「不一致」の核酸分子は、図5Aのステップ1と2との間および/またはステップ1の前に除去され得る。これは、不一致エンドヌクレアーゼでの核酸分子の「予め選択された」集団の処理をもたらす。さらに、これらなどの2つのエラー訂正ステップは組み合わせて使用され得る。一例として、核酸分子を変性させ、次いで再アニーリングさせ、続いて固定化MutSとの結合を介して不一致を有する核酸分子を除去し、次いで続いてMutS結合により分離されなかった核酸分子を、変性および再アニーリングのステップ介在することなく不一致エンドヌクレアーゼと接触させ得る。理論に拘束されることを望まないが、核酸分子の増幅は、増幅される分子にエラーを導入すると考えられている。増幅媒介エラーの導入を回避する、および/またはかかるエラーを除去するための1つの手段は、ほとんどまたはすべての増幅ステップが実施された後に正しい配列を有する核酸分子の選択によるものである。説明のために図5Bに記載のワークフローを再度使用すると、ステップ5の後に、不一致結合タンパク質を使用する追加の分離ステップによって、不一致を有する核酸分子が不一致を有しない核酸分子から分離され得る(図5Bには示していない)。
このプロセスのバリエーションは、以下のとおりである。第一に、2回以上(例えば、2回、3回、4回、5回、6回など)のエラー訂正が、実施され得、各回で熱安定性不一致認識タンパク質が使用され得る。第二に、1回以上のエラー訂正において、1つより多くのエンドヌクレアーゼが使用され得る。例えば、T7NIおよびCel IIは、エラー訂正の各ラウンドにおいて使用され得る。第三に、異なるエンドヌクレアーゼを、異なるエラー訂正ラウンドで使用し得るか、不一致結合タンパク質を使用するエラーフィルタリングのステップと組み合わせ得る。例えば、再アニーリングされたオリゴヌクレオチドのプールは、不一致結合タンパク質(MutSなど)を使用するエラーフィルタリングステップに供され、プールからエラーを有する第1の複数のオリゴヌクレオチドを除去し(図5Bを参照されたい)、次いで、残りの「結合していない」)オリゴヌクレオチドは、例えばT7NIなどのエンドヌクレアーゼを使用してエラー訂正ステップに供されて、残りのエラーを訂正し得る。
いくつかの場合では、例えば、T7NIおよびCel IIは、エラー訂正の第1ラウンドにおいて使用され得、Cel IIは、エラー訂正の第2ラウンドにおいて単独で使用され得る。もちろん、他の不一致エンドヌクレアーゼも使用され得る。別の例示的な実施形態では、分子は、1つのエンドヌクレアーゼ(緑豆エンドヌクレアーゼなどの一本鎖ヌクレアーゼもしくはT7NIなどのリゾルバーゼまたは同様の機能の別のエンドヌクレアーゼであり得る)のみで切断される。さらに別の実施形態では、同じエンドヌクレアーゼ(例えば、T7NI)が、2つの後続のエラー訂正ラウンドにおいて使用され得る(図5Aのライン4)。さらに別の実施形態では、不一致切断活性を有する酵素を、エキソヌクレアーゼ活性を有する酵素と組み合わせて、不一致切断後の一本鎖オーバーハングに含有されるエラーの除去が可能にし得る。特定の態様では、固有のエキソヌクレアーゼ活性を有する不一致エンドヌクレアーゼを使用して、切断および後続のエラー除去を単一ステップにおいて達成し得る。エンドヌクレアーゼおよびエキソヌクレアーゼの両方の活性を有する酵素には、例えば緑豆ヌクレアーゼ、Cel IまたはSP1エンドヌクレアーゼが含まれる。他の態様では、エラーの除去は、例えばPCT公開第2005/095605(A1)号に記載されているように、さらなるエキソヌクレアーゼ処理を含む分離ステップによって達成され得る。
多くの場合では、エラー訂正中に1つ以上のリガーゼが反応中に存在してもよい。エラー訂正プロセスにおいて使用されるいくつかのエンドヌクレアーゼは、ニッカーゼ活性を有すると考えられる。1つ以上のリガーゼを含めると、かかる酵素によって密封ニックが引き起こされ、増幅後のエラー訂正された核酸分子の収量が増加すると考えられる。使用され得る例示的なリガーゼは、T4 DNAリガーゼ、Taqリガーゼ、およびPBCV-1 DNAリガーゼである。本明細書に記載の方法の実施において使用されるリガーゼは、熱不安定性または熱安定性であり得る(例えば、Taqリガーゼ)。熱不安定性リガーゼを使用する場合、典型的には、各エラー訂正ラウンドで反応混合物に添加する必要がある。熱安定性リガーゼは、温度が変性点以下に保たれている限り、典型的には、各ラウンド中に再添加する必要はない。
分子の第2のセットがより大きな核酸分子の亜断片を表す場合、一緒になってより大きな核酸分子を表す2つ以上の亜断片(例えば、2つまたは3つまたはそれ以上の亜断片)を組み合わせて、単一の反応混合物中で1つ以上の不一致切断エンドヌクレアーゼと反応させ得る。例えば、アセンブルされるオープンリーディングフレームが1kbよりも長い場合、図5Aに示されるように、ステップ3において並行反応で別々にアセンブルされた2つ以上の亜断片に分割され、得られる2つ以上の亜断片が組み合わされて、単一の反応においてエラー訂正され得る。単回のエラー訂正ラウンドで組み合わされる亜断片の量は、個々の亜断片の長さに依存する場合がある。例えば、長さ約1kbの亜断片を最大3つまで、単一の反応混合物において効率的に組み合わせることができる。もちろん、3つ以上(例えば、4、5、6、7、8、9つなど)の亜断片を組み合わせてもよい。少なくとも1つの正確にアセンブルされた増幅可能および/または複製可能な核酸分子が得られる限り、アセンブリ効率が減少する可能性がある。したがって、多数の亜断片(例えば、長さ約1kbの亜断片)は、正確にアセンブルされた産物核酸分子がアセンブリプロセスから得られる限り、アセンブルされ得る。
不一致を有する核酸分子は、多くの方法で不一致結合剤と結合することにより、不一致を有しない核酸分子から分離され得る。例えば、いくらかが不一致を有する、核酸分子の混合物は、(1)結合された不一致結合タンパク質を含有するカラムを通過させるか、または(2)不一致結合タンパク質が結合された表面(例えば、ビーズ(磁気ビーズなど)、プレート表面など)と接触させ得る。
例示的な形式および関連する方法には、不一致結合タンパク質が結合されたビーズまたは他の支持体を使用するものが含まれる。例えば、核酸分子の溶液を、不一致結合タンパク質が結合されたビーズと接触させ得る。次いで、不一致結合タンパク質に結合した核酸分子は、表面に連結し、溶液から容易に除去または移動されない。
図6に記載の特定の形式では、不一致結合タンパク質が結合されたビーズを、不一致結合タンパク質への不一致を有する核酸分子の結合が可能になる条件下で(例えば、5mMのMgCl2、100mMのKCl、20mMのTris-HCl(pH7.6)、1mMのDTT、25℃で10分間)、核酸分子が溶液中に存在する容器(例えば、マルチウェルプレートのウェル)に入れることができる。次いで、ビーズおよび/または不一致核酸分子を移すことなく、流体を別の容器(例えば、マルチウェルプレートのウェル)に移すことができる。使用できる特定のタイプのビーズの1つは、磁気不一致結合ビーズ(Μ2Β2)、MAGDETECT(商標)(United States Biological、Salem,ΜΑ、カタログ番号M9557-01A)である。さらに、図6に記載のものと同様または同一のワークフローにおいて使用される不一致結合タンパク質は、熱安定性または非熱安定性であり得る。
一例として、不一致を含有する二本鎖核酸分子に結合することが示されているタンパク質は、E.coli MutSである(Wagner et al.,Nucleic Acids Res.,23:3944-3948(1995))。Wan et al.,Nucleic Acids Res.,42:e102(2014)は、エラーを含有する化学的に合成された核酸分子が、エラーを含有しない核酸分子が保持されないMutS固定化セルロースカラム上に保持され得ることを実証した。
したがって、本明細書に記載の主題は、核酸分子が変性され、続いて再アニーリングされ、続いて不一致を含有する再アニーリングされた核酸分子が分離される方法および関連する組成物を含む。いくつかの態様では、使用される不一致結合タンパク質は、MutS(例えば、E.coli MutS)である。もちろん、表12および15に記載のものなどの他の不一致結合タンパク質も使用され得る。
さらに、不一致結合タンパク質の混合物は、本明細書に記載の方法の実施において使用され得る。異なる不一致結合タンパク質は、それらが結合する不一致のタイプに関して異なる活性を有することが見出されている。例えば、Thermus aquaticus MutSは挿入/欠失エラーを効果的に除去することが示されているが、E.coli MutSよりも置換エラーを除去する効果が低い。さらに、2つのMutSホモログの組み合わせは、置換および挿入/欠失エラーの両方の除去に関してエラー訂正の効率をさらに改善し、バイアスがかかった結合の影響も軽減することが示された。したがって、本明細書に記載の主題は、2つ以上(例えば、約2~約10、約3~約10、約4~約10、約2~約5、約3~約5、約4~約6、約3~約7など)の不一致結合タンパク質混合物を含む。
本明細書に記載の主題は、不一致結合タンパク質を使用したエラー訂正の複数のラウンド(例えば、約2~約10、約3~約10、約4~約10、約2~約5、約3~約5、約4~約6、約3~約7など)の使用をさらに含む。エラー訂正のこれらのラウンドのうちの1つ以上は、2つ以上の不一致結合タンパク質の使用を用い得る。あるいは、単一の不一致結合タンパク質をエラー訂正の第1のラウンドにおいて使用し、同じまたは別の不一致結合タンパク質をエラー訂正の第2のラウンドにおいて使用し得る。
オリゴヌクレオチド合成が完了すると、得られるオリゴヌクレオチドは、典型的には、以下のうちの1つ以上を含む一連の後処理ステップに供される:(a)オリゴヌクレオチドの切断もしくはそれらが合成された支持体からの溶出、(b)濃度測定、(c)各オリゴヌクレオチド種の均等に濃縮された希釈液を得るために、多くの場合、「正規化」と呼ばれる、オリゴヌクレオチド溶液の濃度調整または希釈、および/または(d)2つ以上の正規化されたオリゴヌクレオチド試料のアリコートをプールもしくは混合し、1つ以上の特定の核酸分子をアセンブルするのに必要なすべてのオリゴヌクレオチドの等モル混合物を得ることであり、前述のステップは異なる順序で組み合わされ得る。
本明細書に記載の主題の態様で使用され得る核酸合成中のエラーを低減するためのさらに別のプロセスは、環状アセンブリ増幅と称され、PCT公開第2008/112683(A2)号に記載されている。
合成で生成された核酸分子は、典型的には、300~500塩基中約1塩基のエラー率を有する。合成エラーが、300~500塩基中1塩基より実質的に低くなるように条件が調整され得る。さらに、多くの場合では、エラーの80%超が、単一の塩基フレームシフトの欠失および挿入である。また、高忠実度PCR増幅が用いられた場合、ポリメラーゼの作用により2%未満のエラーがもたらされる。したがって、上述のPCRベースのアセンブリステップを使用するエラー訂正プロセスを、ポリメラーゼ活性を含まない1つ以上のエラー訂正方法と組み合わせることができる。多くの場合では、不一致エンドヌクレアーゼ(MME)訂正は、固定されたタンパク質:DNA比を使用して実施される。非PCRベースのエラー訂正は、例えば、多くの方法で不一致結合剤と結合することにより、不一致を有する核酸分子を不一致を有しない核酸分子から分離することにより達成され得る。例えば、いくらかが不一致を有する、核酸分子の混合物は、(1)結合された不一致結合タンパク質を含有するカラムを通過させるか、または(2)不一致結合タンパク質が結合された表面(例えば、ビーズ(磁気ビーズなど)、プレート表面など)と接触させ得る。
例示的な形式および関連する方法は、不一致結合タンパク質が結合された表面または支持体(例えば、ビーズ)を使用するものが含まれる。例えば、核酸分子の溶液を、不一致結合タンパク質が結合されたビーズと接触させ得る。本明細書に記載の方法の様々な態様において使用され得る1つの不一致結合タンパク質は、Thermus aquaticus由来のMutSであり、その遺伝子配列は、Biswas and Hsieh,J.Biol.Chem.271:5040-5048(1996)に記載されており、GenBank、アクセッション番号U33117で入手可能である。さらに、EndoMS(例えば、PfuEndoMS、TkoEndoMSなど)、例えばセロリ由来のT7NIまたはCelIなどの不一致切断エンドヌクレアーゼを遺伝子操作して、不一致結合に基づくエラーフィルタリングプロセスにおいての使用のための切断機能を不活性化することができる。不一致結合タンパク質に結合される核酸分子は、核酸分子のプールから能動的に除去されるか(例えば、不一致結合タンパク質でコーティングされた磁気ビーズが使用される磁力を介して)、または未結合の核酸は試料から(ピペッティング、音響液体処理などによって)除去または移動されるが、それらは試料中に残るように表面に固定化もしくは連結され得る。かかる方法は、例えば、PCT公開第2016/094512号に記載されている。
上記のように、不一致認識タンパク質は、核酸分子のハイブリダイゼーションと組み合わせて使用され得る。組成物中に含まれ、本明細書に記載の方法において使用される不一致認識タンパク質は、熱安定性または非熱安定性であり得る。さらに、本明細書に記載の方法は、核酸関連のワークフロー(例えば、アセンブリPCR、増幅、エラー訂正単独、またはこれらのプロセスの1つ以上の組み合わせ)において、1つより多くの不一致認識タンパク質が1つより多くの位置で使用される方法を含む。
熱安定性不一致認識タンパク質(例えば、1つ以上の熱安定性不一致エンドヌクレアーゼ)により、各熱変性ステップ後に不一致認識タンパク質を再添加する必要なく、アセンブリPCR、増幅、およびエラー訂正などのプロセス中に配列エラーを排除することができる。したがって、本明細書に記載の組成物および方法は、不一致認識タンパク質が各核酸変性ステップ後に添加されない複数ラウンドのエラー訂正を可能にする。もちろん、非熱安定性不一致認識タンパク質もかかるワークフローにおいて使用され得るが、かかるタンパク質の不一致認識活性は、概して、各熱変性サイクルによって排除されるか、実質的に減少する。多くの場合では、各熱変性サイクルで非熱安定性不一致認識タンパク質をさらに追加することが必要または望ましい。
ワークフローで使用される不一致認識タンパク質のタイプは、変化し得る。いくつかの場合では、ワークフローにおける1つ以上の場所でエラー訂正が実施され得る。いくつかの場合では、熱安定性不一致認識タンパク質が、多くの場合、非熱安定性不一致認識タンパク質と組み合わせて使用される。
エラーを有する核酸分子を除去するための1つの方法は、エラーを含有しない核酸分子からかかる核酸分子を分離することによるものである。したがって、本明細書では、エラーを含有する核酸分子に結合する薬剤、およびエラーを含まない核酸分子からのそれらの分離を使用するワークフロー、ならびにかかるワークフローで使用される組成物が提供される。かかる薬剤の例は、不一致結合タンパク質である。
不一致結合タンパク質は、支持体に結合され得、例えば、不一致を有する核酸分子が支持体に結合される条件下で、不一致を有する核酸分子および不一致を有しない核酸分子を含有する試料と接触され得る。次いで、不一致を有する核酸分子が結合される支持体を不一致を有しない核酸分子との接触から除去し得、それによって不一致を有する核酸分子を不一致のない核酸分子から分離することができる。
組成物中の正しい核酸分子のパーセンテージを増加させるための別の方法は、エラー(例えば、欠失、挿入、不一致など)を含有する核酸分子の増幅を抑制することによるものである。いくつかの場合では、1つ以上のエラーを含有する核酸分子のアセンブリPCRおよび/または増幅を阻害することによって、核酸分子の集団におけるエラーの数を低減させる、1つ以上のタンパク質(例えば、1つ以上の不一致結合タンパク質)が使用され得る。いくつかの場合では、1つ以上のエラーを含有する核酸分子のアセンブリPCRおよび/または増幅を冷遇することによって、核酸分子の集団におけるエラーの数を低減させる、ポリメラーゼ試薬が使用され得る。
実施され得るワークフローのいくつかの例を表1に記載する。
Figure 2023516827000005
例えば、表1に記載のワークフローバリエーションによって示されるように、本明細書で提供されるのは、核酸分子の集団を生成するための組成物および方法である。いくつかのかかる方法では、これらのワークフローは、一本鎖核酸分子が互いにハイブリダイゼーションして二本鎖核酸分子を形成する、2つ以上の異なるタイプのプロセス(例えば、核酸アセンブリ、核酸増幅、核酸変性/再生など)を含む。かかるワークフローのすべてまたは一部で、エラー訂正またはエラー低減のいずれかが生じ得る。いくつかの場合では、表1で参照されているステップ間でエラー訂正が生じ得る。例えば、1つ以上の非熱安定性不一致エンドヌクレアーゼ(例えば、T7NI)が一次増幅後に使用される場合、典型的には二次増幅の前に増幅産物と接触される。これは、通常、熱サイクルが非熱安定性不一致エンドヌクレアーゼを変性させるためである。不一致結合タンパク質はまた、不一致結合タンパク質を用いて不一致核酸分子を不一致していない核酸分子から分離する増幅ステップ間に使用され得る。
いくつかの場合では、本明細書に記載のプロセスの集合的効果により、500塩基対当たり1未満のエラー(例えば、500塩基対当たり約1つ~2,000塩基対当たり約1つ、600塩基対当たり約1つ~2,000塩基対当たり約1つ、700塩基対当たり約1つ~2,000塩基対当たり約1つ、800塩基対当たり約1つ~2,000塩基対当たり約1つ、900塩基対当たり約1つ~2,000塩基対当たり約1つ、1,000塩基対当たり約1つ~2,000塩基対当たり約1つ、700塩基対当たり約1つ~1,500塩基対当たり約1つ、700塩基対当たり約1つ~1,200塩基対当たり約1つ、700塩基対当たり約1つ~1,000塩基対当たり約1つ、800塩基対当たり約1つ~1,200塩基対当たり約1つなど)を含有する核酸分子の集団がもたらされ得る。
1つ以上の不一致結合タンパク質(例えば、熱安定性不一致結合タンパク質)のアセンブリPCR混合物への添加は、不一致結合タンパク質がアニーリング中に形成された不一致に結合する場合、ポリメラーゼによる伸長を遮断することにより、配列エラーを含有するオリゴヌクレオチドの機能的除去に使用され得る(Fukui et al.,“Simultaneous Use of MutS and RecA for Suppression of Nonspecific Amplification during PCR”J.Nucleic Acids,Volume 2013,Article ID 823730を参照されたい)。
不一致結合タンパク質および不一致エンドヌクレアーゼは、多くの場合、特定のタイプの不一致に対して特異性を示す。したがって、いくつかの場合では、1つより多くの不一致認識タンパク質が、本明細書に記載のワークフローで使用され得る。さらに、1つより多くの不一致認識タンパク質が存在する場合、多くの場合では、タンパク質のエラー認識活性が異なる。例えば、不一致エンドヌクレアーゼTkoEndoMSおよびT7NIは、T7NIがTkoEndoMSよりも欠失および挿入に関して高い活性を有すると考えられるという点で異なる(図9~11を参照されたい)。さらに、1つより多くの不一致認識タンパク質が使用される場合、これらのタンパク質は、異なるタイプの不一致に関して異なる活性を有する場合がある。
図7は、オリゴヌクレオチドが一次アセンブリPCRによってアセンブルされたデータを示す。次いで、アセンブルされた核酸分子を、TkoEndoMSの存在下での一次増幅、およびT7NIとともに、またはT7NIを含まず一次増幅産物のインキュベーション後の二次増幅のいずれかに供した。次いで、得られた核酸分子を配列決定して、エラー率を決定した。
試料番号1(Std-ECなし)は、エラー訂正なしで66個の断片がアセンブルされた対照実行であった。この図からわかり得るように、試料番号1のエラー率の中央値は、308中1である。これは、一次後増幅T7NI媒介エラー訂正を使用した場合(試料番号2)、456中1に増加する。試料番号1および2は、エラー訂正なしの条件、およびアセンブルされた断片のT7NI一次後増幅を使用したエラー訂正の条件のエラー訂正ベースラインを表す。
図7の試料番号3および4のデータは、熱安定性不一致エンドヌクレアーゼ(TkoEndoMS)が増幅プロセスのみに存在し、アセンブリPCRプロセスには存在しない条件下で生成された。さらに、試料番号4については、一次後増幅後T7NI媒介エラー訂正が使用され、試料番号3については、一次後増幅T7NI媒介エラー訂正は使用されなかった。図7からわかり得るように、試料番号3のエラー率は、353中1である。これは、一次後増幅T7NI媒介エラー訂正を使用した場合(試料番号4)、716中1に増加する。
図7の試料番号5および6のデータは、熱安定性不一致エンドヌクレアーゼ(TkoEndoMS)がアセンブリPCRプロセスに存在するが増幅プロセスには存在しない条件下で生成された。さらに、試料番号6については、一次後増幅後T7NI媒介エラー訂正が使用され、試料番号5については、一次後増幅T7NI媒介エラー訂正は使用されなかった。図7からわかり得るように、試料番号5のエラー率の中央値は、398中1である。これは、一次後増幅T7NI媒介エラー訂正を使用した場合(試料番号6)、830中1に増加する。
図4の試料番号7および8のデータは、熱安定性不一致エンドヌクレアーゼ(TkoEndoMS)がアセンブリPCRおよび増幅プロセスの両方に存在する条件下で生成された。さらに、試料番号8については、一次後増幅後T7NI媒介エラー訂正が使用され、試料番号7については、一次後増幅T7NI媒介エラー訂正は使用されなかった。図7からわかり得るように、試料番号7のエラー率の中央値は、488中1である。これは、一次後増幅T7NI媒介エラー訂正を使用した場合(試料番号8)、803中1に増加する。
図7に記載のデータは、熱安定性不一致エンドヌクレアーゼを使用して調製され、T7NI媒介エラー訂正に供されたアセンブルされ増幅された核酸分子が、最低の総エラー率を有することを示す。
以下の表1は、図7から導き出されたデータを示す。表2から、以下の実施例1に記載のTkoEndoMS方法を使用して調製された核酸分子に存在する総エラーの最低レベルは、試料番号4、6、および8において見出されたことがわかり得る。これらの試料は、(1)アセンブリPCRプロセス、(2)増幅プロセス、または(3)アセンブリPCRおよび増幅プロセスの両方中にTkoEndoMSが存在したという共通点を共有している。さらに、これらの試料の3つすべては、一次後増幅T7NI媒介エラー訂正にも供された。
Figure 2023516827000006
図7および表2のデータは、(1)アセンブリPCRプロセス単独における不一致エンドヌクレアーゼの存在は、増幅プロセス単独における不一致エンドヌクレアーゼの存在よりも低いエラー率をもたらすこと、ならびに(2)一次後増幅不一致エンドヌクレアーゼ媒介エラー訂正ステップを含めることは、アセンブリPCRプロセスおよび/または増幅プロセスにおける熱安定性不一致エンドヌクレアーゼ活性の使用と組み合わせて使用される場合、エラー訂正強化を提供することを示唆している。
本明細書では、アセンブルされ増幅された核酸分子のエラー率が、500塩基対中約1つ~5,000塩基対中約1つ(例えば、550塩基対中約1つ~1,500塩基対中約1つ、600塩基対中約1つ~1,500塩基対中約1つ、650塩基対中約1つ~1,500塩基対中約1つ、700塩基対中約1つ~1,500塩基対中約1つ、800塩基対中約1つ~1,500塩基対中約1つ、500塩基対中約1つ~1,400塩基対中約1つ、500塩基対中約1つ~1,350塩基対中約1つ、500塩基対中約1つ~1,300塩基対中約1つ、500塩基対中約1つ~1,250塩基対中約1つ、500塩基対中約1つ~1,200塩基対中約1つ、500塩基対中約1つ~1,150塩基対中約1つ、500塩基対中約1つ~1,000塩基対中約1つ、600塩基対中約1つ~1,000塩基対中約1つ、650塩基対中約1つ~1,000塩基対中約1つ、600塩基対中約1つ~900塩基対中約1つ、650塩基対中約1つ~900塩基対中約1つ、700塩基対中約1つ~850塩基対中約1つ、550塩基対中約1つ~2,000塩基対中約1つ、550塩基対中約1つ~2,500塩基対中約1つ、550塩基対中約1つ~3,500塩基対中約1つ、550塩基対中約1つ~4,500塩基対中約1つ、900塩基対中約1つ~3,500塩基対中約1つ、1,500塩基対中約1つ~5,000塩基対中約1つ、2,000塩基対中約1つ~5,000塩基対中約1つ、2,500塩基対中約1つ~5,000塩基対中約1つなど)である組成物および方法が提供される。かかる核酸分子は、一次アセンブリPCRおよび一次アセンブリ、任意選択で、続く二次増幅によって生成され得る。
本明細書では、単一の対照/「ベンチマーク」試料実行または対照/「ベンチマーク」試料実行の平均のいずれかを使用して、エラー訂正なしでアセンブルされ増幅された核酸分子のエラー率と比較した場合、アセンブルされ増幅された核酸分子のエラー率の倍率減少(「X」)が、1.75より大きい(例えば、約1.75~約8、約1.75~約7、約1.75~約8、約1.75~約5、約1.75~約4、約1.75~約3、約2.0~約8、約2.1~約8、約2.2~約8、約2.3~約8、約2.5~約8、約2.75~約8、約2.0~約7、約2.0~約6、約2.0~約5、約2.0~約4.5、約2.2~約8、約2.2~約7、約2.2~約6、約2.2~約5、約2.2~約3、約2.2~約2.8、約2.1~約2.8など)組成物および方法が提供される(図7および表2のデータを参照されたい)。エラー率の倍率減少を計算するために使用され得る式は、以下のとおりである。
Figure 2023516827000007
式中、Xは、エラーの倍率減少、Yは、エラー訂正ステップ後のエラー率の数、Zはエラー訂正ステップ前のエラー率の数である。図7のライン8は、803中1のエラー率(Y)を示している。図7のライン1は、308中1のエラー率(Y)を示している。これらの数値を使用すると、エラー率の倍率減少(X)は、2.6である。
図9、10、および11は、図7および8を生成するために使用された実験データを使用する、欠失、挿入、および置換に関連するエラー率に関連する詳細なデータを示す。
試料番号8、6、4、および2(T7NI処理)はすべて、図9および10において同様に低レベルの欠失および挿入を示している。これらのデータは、アセンブリPCRおよび増幅中にTkoEndoMSによって除去されなかった欠失および挿入が、一次後増幅T7NI媒介エラー訂正によって除去されることを示している。
図10は、TkoEndoMSが、アセンブリPCRプロセス、増幅プロセス、またはアセンブリPCRおよび増幅プロセスの両方に含まれる場合、置換エラーを排除することを示す。
二本鎖核酸分子においては、多くの異なるタイプの置換が見出され得る。さらに、不一致認識タンパク質は、多くの場合、それらが活性を示す置換のタイプの特異性が変わる。この特異性は、二価金属イオンの存在または非存在、および周囲の核酸領域などの特定の条件によって変わり得る。EndoMSのこれらのバリエーションのいくつかは、Ishino et al.,Nucl.Acids Res.44:2977-2989(2016)に記載されている。追加のEndoMSタンパク質を表15に記載する。また、Pyrococcus furiosus由来の野生型熱安定性不一致エンドヌクレアーゼの改変された形態が生成された(米国特許第10,196,618号および米国特許公開第2017/253909号を参照されたい)。さらに、不一致認識活性が変わるように野生型不一致認識タンパク質(例えば、不一致エンドヌクレアーゼ)の改変された形態が生成され得る。野生型不一致認識タンパク質のかかる改変された形態は、本明細書に記載の方法に含まれ、および/またはそれらにおいて使用され得る。
図12A~12Dは、実施例1において使用された条件下でのTkoEndoMSのいくつかのエラー訂正特性を示す。図12Aおよび12Cは、エラー訂正がない場合(図12A)およびTkoEndoMSがアセンブリPCRプロセスおよび増幅プロセスの両方に含まれた場合(図12C)に生成されたアセンブルおよび増幅された核酸分子において見出された欠失、挿入および置換レベルを比較する。わかり得るように、欠失および挿入の数は、両方のセットの条件下で類似している。データにはかなりの変動があるが、これらのデータから、TkoEndoMSが存在する場合は置換率が低いことがわかる。
図12Bおよび12Dは、特定の置換に関するTkoEndoMSのいくつかのエラー訂正活性を示す。TkoEndoMSは、ほとんどのトランジションおよびトランスバージョンを訂正するのに効果的であるようだが、TV1(C-TおよびG-A)およびTV4(C-TおよびG-A)不一致に関連した活性が低いようである(図12D)。さらに、T7NIはまた、TV1(C-TおよびG-A)およびTV4(C-TおよびG-A)不一致に関連する活性が低いようである(図12B)。
SURVEYOR(登録商標)ヌクレアーゼはすべてのタイプの不一致を切断するが、いくつかは他よりも優先されると考えられている。特に、C-T、A-C、およびC-Cは、等しくT-Tよりも優先され、A-AおよびG-Gが続き、最後に最も優先度の低いA-GおよびG-Tが続く。
多くの不一致認識タンパク質(例えば、表15に記載の不一致認識タンパク質)は、異なるタイプの不一致に対する認識活性を有することが既知である。いくつかの不一致認識タンパク質のエラー訂正特異性を表3に示す。
Figure 2023516827000008
本明細書に記載の方法には、1つより多くの不一致認識タンパク質を組み合わせて使用する方法が含まれる。説明のために図1Aに示すワークフローを使用すると、PfuEndoMSおよびTkoEndoMSは、オリゴヌクレオチドアセンブリプロセスにおいて一緒に使用され得る。これは、重複しているが異なるエラー認識活性を有する2つの異なる不一致エンドヌクレアーゼの存在をもたらす。さらに、TaqMutSおよびTthMutSの一方または両方は、互いに、または例えば、PfuEndoMSおよびTkoEndoMSと組み合わせて、それらによって認識されるエラーを含有する二本鎖核酸分子を除去するため使用され得る。
本明細書では、認識されるエラーのタイプが異なる不一致認識タンパク質の配列または同時使用を含む、核酸分子のエラーの訂正のための方法が提供される。
本明細書で提供される方法における使用に好適なエラー訂正方法および試薬は、米国特許第7,838,210号および同第7,833,759号、米国特許公開第2008/0145913(A1)号(不一致エンドヌクレアーゼ)、PCT公開第2011/102802(A1)号、ならびにMa et al.,Trends in Biotechnology,30(3):147-154(2012)に記載されている。さらに、当業者は、エラー訂正および/またはエラーフィルタリング(すなわち、エラーを含有する分子を特異的に除去する)の他の方法、例えば米国特許公開第2006/0127920(AA)号、同第2007/0231805(AA)号、同第2010/0216648(A1)号、または同第2011/0124049(A1)号に記載されているものなどが、本明細書に記載されている主題の特定の態様において実施され得ることを認識するであろう。
本明細書で提供されるのは、多くの異なるエラー訂正剤を含有および使用する組成物および方法である。かかるエラー訂正剤は、不一致とも称される以下のエラーのタイプ:欠失、挿入および置換のうちの1つ以上の訂正に関連する活動を有する。さらに、置換に関しては、活性は、概して異なるタイプの置換に指向される。
多くの異なるポリメラーゼおよび異なるタイプのポリメラーゼが、本明細書に記載の組成物および方法に含有され、使用され得る。アセンブリPCRおよび増幅ワークフローの1つ以上のステップにおいて使用されるポリメラーゼのタイプは、アセンブルされた核酸分子に存在するエラーの数に影響を与えると考えられている。
図13および14A~14Dは、異なるタイプのポリメラーゼを使用して生成されたデータを示す。図13は、PHUSION(商標)DNAポリメラーゼと組み合わせて、エラー訂正なしで生成されたデータを示し、アセンブリPCRおよび増幅エラーの訂正は、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ試薬と組み合わせたTkoEndoMSを使用して実施された。
本明細書で提供される方法の代表的なワークフローを図5Aに記載する。このワークフローでは、3つの核酸セグメント(「亜断片」と称される)をプールし、酵素T7エンドヌクレアーゼI(「T7NI」)を使用してエラー訂正に供する(図5A、ライン2)。次いで、3つの核酸セグメントをPCR(二次アセンブリPCR)によってアセンブルし(図5A、ライン3)、次いで、エラー訂正の第2のラウンドに供する(図5A、ライン4)。PCRの別のラウンド(三次アセンブリPCR)(ライン5)の後、得られる核酸分子を全長のものに対してスクリーニングする(図5A、ライン7)。次いで、これらの核酸分子を、例えばヌクレオチド配列決定によって残りのエラーについてスクリーニングし得る。
合成後、オリゴヌクレオチドは、段階的により大きな核酸分子にアセンブルされ(一次アセンブリPCR)、任意選択で増幅され得る。核酸分子をアセンブルするために使用される方法は、変化し得る(例えば、図1Aおよび1Bを参照されたい)。さらに、エラー訂正は、使用される方法に関係なく、好適なアセンブリプロセスに統一され得る。多くの場合では、エラー訂正は、不一致認識タンパク質(例えば、不一致結合タンパク質および不一致エンドヌクレアーゼなどの熱安定性不一致認識タンパク質)を使用して実施され得る。
いくつかの態様では、アセンブルされた核酸分子の長さは、約20塩基対~約10,000塩基対、約100塩基対~約5,000塩基対、約150塩基対~約5,000塩基対、約200塩基対~約5,000塩基対、約250塩基対~約5,000塩基対、約300塩基対~約5,000塩基対、約350塩基対~約5,000塩基対、約400塩基対~約5,000塩基対、約500塩基対~約5,000塩基対、約700塩基対~約5,000塩基対、約800塩基対~約5,000塩基対、約1,000塩基対~約5,000塩基対、約100塩基対~約4,000塩基対、約150塩基対~約4,000塩基対、約200塩基対~約4,000塩基対、約300塩基対~約4,000塩基対、約500塩基対~約4,000塩基対、約50塩基対~約3,000塩基対、約100塩基対~約3,000塩基対、約200塩基対~約3,000塩基対、約250塩基対~約3,000塩基対、約300塩基対~約3,000塩基対、約400塩基対~約3,000塩基対、約600塩基対~約3,000塩基対、約800塩基対~約3,000塩基対、約100塩基対~約2,000塩基対、約200塩基対~約2,000塩基対、約300塩基対~約1,500塩基対など変化し得る。
核酸の増幅およびアセンブリのために、任意の数の方法が使用され得る。1つの例示的な方法は、Yang et al.,Nucleic Acids Research 21:1889-1893(1993)および米国特許第5,580,759号に記載されている。Yangらに記載されたプロセスでは、線状ベクターが、末端で配列相同性を共有する二本鎖核酸分子と混合される。エキソヌクレアーゼ活性を有する酵素(すなわち、T4 DNAポリメラーゼ、T5エキソヌクレアーゼ、T7エキソヌクレアーゼなど)が添加され、それは混合物中に存在するすべての末端の一本鎖オーバーハングを生成する。次いで、一本鎖オーバーハングを有する核酸分子をアニーリングし、一本鎖ギャップの充填を可能にする条件下でDNAポリメラーゼおよびデオキシヌクレオチド三リン酸とともにインキュベーションする。得られる核酸分子におけるニックは、分子を細胞に導入することによって、またはリガーゼを添加することによって修復され得る。もちろん、用途およびワークフローによってベクターを省略してもよい。さらに、得られる核酸分子またはその亜部分は、ポリメラーゼ連鎖反応によって増幅され得る。
核酸アセンブリの他の方法には、米国特許公開第2010/0062495(A1)号、同第2007/0292954(A1)号、同第2003/0152984(AA)号、および同第2006/0115850(AA)号、米国特許第6,083,726号、同第6,110,668号、同第5,624,827号、同第6,521,427号、同第5,869,644号、および同第6,495,318号ならびにWO2020/001783(A1)に記載のものが含まれる。
核酸分子の等温アセンブリのための方法は、米国特許公開第2012/0053087号に記載されている。この方法の一態様では、アセンブリのための核酸分子は、エキソヌクレアーゼ活性を有する熱不安定性タンパク質(例えば、T5ポリメラーゼ)と接触され、任意選択で、エキソヌクレアーゼ活性が時間とともに減少する条件下(例えば、50℃)で、熱安定性ポリメラーゼおよび/または熱安定性リガーゼと接触される。エキソヌクレアーゼは、核酸分子の1本の鎖を「噛み返し」、配列の相補性がある場合、核酸分子は互いにアニールする。一実施形態では、熱安定性ポリメラーゼを使用してギャップを埋めることができ、熱安定性リガーゼを提供してニックを密封することができる。別の実施形態において、アニーリングされた核酸産物は、宿主細胞を形質転換するために直接使用され得、ギャップおよびニックは、形質転換された細胞の内因性酵素活性によって「インビボ」で修復される。
T4遺伝子32タンパク質およびRecAなどの一本鎖結合タンパク質、ならびに当技術分野で既知の他の核酸結合タンパク質または組換えタンパク質が、例えば、核酸分子のアニーリングを容易にするために含まれ得る。
いくつかの場合では、部分的および完全にアセンブルされた核酸分子の標準的なリガーゼベースの結合が使用され得る。例えば、アセンブルされた核酸分子は、それらの末端近くに制限酵素部位を有するように生成され得る。次いで、これらの核酸分子をより好適な制限酵素のうちの1つで処理して、例えば、1つまたは2つのいずれかの「粘着末端」を生成し得る。次いで、これらの粘着末端分子は、標準の制限酵素-リガーゼ法によってベクターに導入され得る。不活性核酸分子が粘着末端を1つだけ有する場合、「非粘着」末端の平滑末端ライゲーションのためにリガーゼが使用され得る。
核酸分子の多重アセンブリ
オリゴヌクレオチド集団の複雑さは、部分的に、存在する異なるオリゴヌクレオチドの数によって決定される。いくつかの場合では、異なるヌクレオチド配列を有するように設計された存在するオリゴヌクレオチドの数は、約2,000~約20,000個であり得る(例えば、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個、約2,000~約20,000個など)。
さらに、反応混合物中のオリゴヌクレオチドは、1つより多くのより大きな核酸分子の亜断片を表し得る。例として、1つの反応混合物中で3つのアセンブルされた核酸分子をアセンブルすることが望まれ、アセンブルされた核酸分子の各々をアセンブルするために10個のオリゴヌクレオチドが必要である場合、反応混合物は最初に少なくとも30個のオリゴヌクレオチドを含むであろう。
本明細書において提供されるのは、1つより多くのアセンブルされてエラー訂正された核酸をアセンブルするのに有用な組成物および方法である。いくつかの場合では、これらの方法によって生成されるアセンブルされたエラー訂正された核酸分子の数は、約2~約100個である(例えば、約2~約90個、約2~約80個、約2~約70個、約2~約50個、約5~約90個、約5~約60個、約8~約90個、約8~約50個、約8~約35個、約10~約90個、約2~約60個、約15~約90個、約15~約55など)。
ポリメラーゼおよびポリメラーゼ試薬
多くの異なるタイプのDNAポリメラーゼがある。例として、多くの原核細胞は、DNAポリメラーゼI型、II型およびIII型を含有する。DNAポリメラーゼには、プルーフリーディング活性を有する場合があるか、または有しない場合がある。プルーフリーディングDNAポリメラーゼは、典型的には、3’から5’へのエキソヌクレアーゼ活性も有している。さらに、DNAポリメラーゼは、熱安定性または非熱安定性であり得る。
任意のタイプのDNAポリメラーゼが、本明細書に記載の組成物および方法に含有され、使用され得るが、多くの場合では、プルーフリーディングポリメラーゼが本明細書で用いられる。いくつかの場合では、DNAポリメラーゼは「ホットスタート」用に製剤化され、この場合、DNAポリメラーゼは、加熱するとDNAポリメラーゼを放出する抗体に結合する。
本明細書に記載の組成物および方法に含有され、使用され得るDNAポリメラーゼ。例示的なDNAポリメラーゼおよびDNAポリメラーゼ試薬には、Phi29 DNAポリメラーゼもしくはその誘導体、Bsm、Bst、T4、T7、DNA PolI、もしくはKlenow Fragment、またはそれらの変異体、バリアントおよび誘導体が挙げられる。さらなる例示的なDNAポリメラーゼおよびDNAポリメラーゼ試薬には、Taq、Tbr、Tfl、Tth、Tli、Tfi、Tne、Tma、Pfu、Pwo、およびKod DNAポリメラーゼ、ならびにVENT(登録商標)DNAポリメラーゼ(New England Biolabs)、DEEP VENT(登録商標)DNAポリメラーゼ(New England Biolabs)、PHUSION(商標)DNAポリメラーゼ、PHUSION(商標)U DNAポリメラーゼ、SUPERFI(商標)II DNAポリメラーゼ、SUPERFI(商標)U DNAポリメラーゼ、もしくはそれらの変異体、バリアントおよび誘導体、ならびに/またはGoTaq G2ホットスタートポリメラーゼ(Promega)、ONETAQ(登録商標)ホットスタートDNAポリメラーゼ(New England Biolabs)、TAKARA TAQ(商標)DNAポリメラーゼホットスタートTakara)、KAPA2G堅牢ホットスタートDNAポリメラーゼ(KAPA)、FASTSTART(商標)Taq DNAポリメラーゼ(Sigma-Aldrich)、ホットスタートTaq DNAポリメラーゼ(New England Biolabs)、Q5(登録商標)DNAポリメラーゼ(New England Biolabs)、KAPA HiFi DNAポリメラーゼ(Roche)、PRIMESTAR(登録商標)Max DNAポリメラーゼ(Takara)、およびPRIMESTAR(登録商標)GXL DNAポリメラーゼ(Takara)が挙げられる。
いくつかの場合では、DNAポリメラーゼは、キメラDNAポリメラーゼを含み得る。さらに、キメラDNAポリメラーゼは、配列非特異的二本鎖DNA(dsDNA)結合ドメインを含み得る。いくつかの場合では、dsDNA結合ドメインは、Sulfolobus solfataricus由来のSso7d;S.acidocaldarius由来のSac7d、Sac7a、Sac7b;およびSac7e、Sulfolobus shibatae由来のSsh7aおよびSsh7b;Pae3192;Pae0384;Ape3192;HMfファミリー古細菌ヒストンドメイン;または古細菌の増殖細胞核抗原(PCNA)ホモログを含み得る。加えて、本明細書に記載の組成物中に存在し、本明細書に記載の方法において使用されるDNAポリメラーゼは、エキソヌクレアーゼ活性および/またはエキソヌクレアーゼドメインも含み得る。
さらに、本明細書に記載の組成物および方法に含有され、使用され得るDNAポリメラーゼには、表14に記載のDNAポリメラーゼの全部または一部、およびかかるポリメラーゼの修飾された形態(例えば、表14に記載のDNAポリメラーゼと少なくとも90%、少なくとも95%、または少なくとも97.5%同一であるDNAポリメラーゼ)を含む。
PHUSION(商標)U DNAポリメラーゼ(Thermo Fisher Scientific、カタログ番号F555S)は、融合技術を使用して開発された、設計された高忠実度酵素である。PHUSION(商標)UのdUTP結合ポケットの変異により、PHUSION(商標)Uは、dUTPを組み込み、DNA テンプレートに存在するウラシルを読み取ることができるという点で、プルーフリーディング酵素の制限を克服している。この特性に加えて、PHUSION(商標)Uは、20kbまでの長いアンプリコンを増幅できる。
本明細書に記載の組成物中に存在し得、本明細書に記載の方法において使用され得るDNAポリメラーゼには、阻害物質の効果を低減するように修飾されたもの、および/または阻害物質の効果を低減する1つ以上の化合物が製剤化されたものが含まれる。例として、PLATINUM(商標)II TaqホットスタートDNAポリメラーゼ(Thermo Fisher Scientific、カタログ番号14966001)は、DNAポリメラーゼが干渉化合物(例えば、フミン酸、キシラン、ヘミンなど)の影響を低減するように修飾された「ホットスタート」ポリメラーゼ製剤である。さらに、これは60℃でのプライマーのアニーリングを可能にするように製剤化されている。
DNAポリメラーゼ試薬は、干渉化合物の影響を軽減するように製剤化され得る。かかる製剤に使用され得る化合物の1つのカテゴリーは「アミン」である。アミンは、(1)核酸合成産物の収率および/または(2)核酸合成の阻害剤に対する耐性を改善することが見出された。アミンは、式Iの1つ以上のアミンまたはそれらの塩を含む化合物を含む、本明細書に記載の組成物および方法に含有および使用され得る化合物を含有し、
Figure 2023516827000009
式中、R1はHであり、R2は、アルキル、アルケニル、アルキニル、または(CH2)n-R5から選択され、n=1~3であり、R5は、アリール、アミノ、チオール、メルカプタン、ホスフェート、ヒドロキシ、アルコキシであり、R3およびR4は同じか、または異なってもよく、独立して、Hまたはアルキルから選択され、ただし、R2が、(CH2)n-R5である場合、R3および/またはR4のうちの少なくとも1つは、アルキルである。
本明細書に記載の組成物および方法に含有され、使用され得る特定のアミン含有化合物には、ジメチルアミン塩酸塩、ジエチルアミン塩酸塩、ジイソプロピルアミン塩酸塩、エチル(メチル)アミン塩酸塩、および/またはトリメチルアミン塩酸塩が含まれる。
1つ以上のアミン化合物が製剤中に存在する場合、この化合物またはこれらの化合物の濃度は、概して5mM~500mMの範囲である(例えば、約5mM~約500mM、約10mM~約500mM、約20mM~約500mM、約30mM~約500mM、約40mM~約500mM、約5mM~約300mM、約5mM~約250mM、約5mM~約200mM、約5mM~約100mM、約10mM~約250mM、約20mM~約200mM、約25mM~約180mM、約50mM~約110mMなど)。
本明細書に記載の方法で使用され得るDNAポリメラーゼ試薬の1つの特定の例は、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ(Thermo Fisher Scientific、カタログ番号12361010)である。
ベクター
本明細書に記載の方法で使用され得るベクターは、宿主細胞のクローニングおよび形質転換に好適な任意のベクターであり得る。多くの場合では、所望のポリヌクレオチドを高収量で得るために、高コピー数ベクターが使用され得る。一般的な高コピー数ベクターには、pUC(約500~約700コピー)、PBLUESCRIPT(登録商標)もしくはPGEM(登録商標)(それぞれ約300~約500コピー)またはその派生物が挙げられる。いくつかの場合では、例えば所与の挿入物の高発現が形質転換された細胞にとって有毒である可能性がある場合、低コピー数ベクターを使用してもよい。約5~約30のコピー数を有するかかる低コピー数ベクターには、例えば、pBR322、様々なpETベクター、pGEX、pColE1、pR6K、pACYCまたはpSC101が含まれる。
本明細書に開示されるアセンブリまたはクローニング方法のうちのいずれかにおいて使用され得るベクターの例示的なリストには、以下が挙げられる:BACULODIRECT(商標)線状、DNAクローニング断片DNA、BACULODIRECT(商標)N末端線状DNA、BACULODIRECT(商標)C末端Baculovirus線状DNA、BACULODIRECT(商標)N末端Baculovirus線状DNA、CHAMPION(商標)pET100/D-TOPO(登録商標)、CHAMPION(商標)pET 101/D-TOPO(登録商標)、CHAMPION(商標)pET104-DEST、CHAMPION(商標)pcDN3.1A/5-His-TOPO、pcDNA3.1(-)、pcDNA3.1(+)、pcDNA3.1(+)/myc-HisA、pcDNA3.1(+)/myc-Hisシリーズ、pcDNA3.1/Hisシリーズ、pcDNA3.1/Hygro(-)、pcDNA3.1/Hygro(+)、pcDNA3.1/NT-GFP-TOPO、pcDNA3.1/nV5-DEST、pcDNA3.1A/5-Hisシリーズ、pcDNA3.1/Zeo(+)、pcDNA3.1/Zeo(+)、pcDNA3.1DA/5-His-TOPO、pcDNA3.2/V5-DEST、pcDNA3.2-DEST、pcDNA4/Hisシリーズ、pcDNA4/HisMax-TOPO、pcDNA4/HisMax-TOPO、pcDNA4/myc-Hisシリーズ、pcDNA4/TO、pcDNA4/TO、pcDNA4/TO/myc-Hisシリーズ、pcDNA4/V5-Hisシリーズ、pcDNA5/FRT、pcDNA5/FRT/TO/CAT、pcDNA5/FRT/TO-TOPO、pcDNA-DEST47、pcDNA-DEST53、PDEST(商標)10、PDEST(商標)14、PDEST(商標)15、pDEST(商標)17、pDEST(商標)20、pDEST(商標)22、PDEST(商標)24、pDEST(商標)26、pDES(商標)27、pDEST(商標)32、pDEST(商標)8、pDEST(商標)38、pDEST(商標)39、pDisplay、pDONR(商標)P2R P3、PDONR(商標)P2R-P3、pDONR(商標)P4-P1R、pDONR(商標)P4-P1R、pDONR(商標)/Zeo、pDONR(商標)201、pDONR(商標)207、pDONR(商標)221、pEF/myc/cyto、pEF/myc/mito、pEF/myc/nuc、pEFi/Hisシリーズ、pEF4/V5-Hisシリーズ、pEF5/FRT V5 D-TOPO、pEF5/FRT/V5-DEST(商標)、pEF6/Hisシリーズ、pEF6/myc-Hisシリーズ、pEF6A/5-His-TOPO、pEF-DEST51、pENTR-TEV/D-TOPO、pENTR(商標)/D-TOPO、pENTR(商標)/D-TOPO、pHybLex/Zeo、pHyBLex/Zeo-MS2、pIB/Hisシリーズ、pIBA/5-His Topo、pYES2.1A/5-His-TOPO、pYES2/CT、pYES2/NT、pYES2/NTシリーズ、pYES3/CT、pYES6/CT、pYES-DEST(商標)52、pYESTrp、pYESTrp2、pZeoSV2、pZeoSV2(+)、pZErO-1、およびpZErO-2。
いくつかの態様では、ベクターは、全長融合構築物のPCR媒介伸長を可能にするために制限されたサイズを有し得る。特定の条件下では、融合構築物の全長伸長および/または増幅は、必要ない場合がある。かかる状況では、標的ベクターのサイズは制限されない場合がある。したがって、いくつかの態様では、標的ベクターは、約0.5~約5kb、または約1kb~約3kbのサイズを有し得るが、他の態様では、標的ベクターは、約2kb~約10kbまたは約5kb~約20kbのサイズを有し得る。
アセンブルされた核酸分子はまた、望ましい特性を付与する機能的要素を含み得る。これらの要素は、複数のオリゴヌクレオチドまたは標的ベクターのいずれかによって提供され得る。かかる要素の例には、複製起点、長い末端反復、耐性マーカー(抗生物質耐性遺伝子など)、選択可能なマーカーおよび解毒剤コード配列(例えば、ccdBの毒性効果に対抗するためのccdAコード配列)、プロモーター、エンハンサー、ポリアデニル化シグナルコード配列、5’および3’UTR、ならびに核酸分子の特定の使用(例えば、mRNAまたはタンパク質産生効率の増強)に好適な他の構成要素が挙げられる。核酸分子がアセンブルされてオペロンを形成する態様では、アセンブルされた核酸産物は、多くの場合、プロモーターおよびターミネーター配列を含有する。さらに、アセンブルされた核酸分子は、例えばII型またはIIs型切断部位および/またはGATEWAY(登録商標)組換え部位、ならびに核酸分子の相互接続のための他の部位などの複数のクローニング部位を含有し得る。
ベクターは、閉鎖環状テンプレートベクター分子のPCR増幅を含む任意の手段によって線状化され得る。あるいは、ベクターは、平滑末端または付着末端のいずれかを産生する1つ以上の酵素での制限酵素切断によって線状化することができる。かかる酵素には、その認識配列に関して固定された位置で核酸を切断するII型の制限エンドヌクレアーゼが含まれる。二本鎖核酸の切断時に「平滑」末端または「粘着」末端のいずれかを産生するように選択され得る制限酵素は、当業者に既知であり、ベクター配列およびアセンブリ要件に応じて当業者によって選択され得る。いくつかの場合では、ベクターは、平滑末端を生成する制限エンドヌクレアーゼを使用して線状化され得る。
切断後、ベクターは、例えば、アセンブリPCR反応(例えば、配列伸長およびライゲーション反応)で直接使用され得るか、またはゲル抽出を使用して精製され得るか、またはアセンブリPCR反応で使用する前にPCR反応で増幅され得るかのいずれかである。PCR増幅によって生成された線形化されたベクターの精製は、多くの場合、必要なく、PCR産物はアセンブリPCR反応において直接使用され得る。あるいは、IIS型制限酵素切断部位を含む環状ベクターを使用し、1ステップの切断およびライゲーションプロセスに供して、1つ以上のアセンブルされた核酸分子を以下で説明するゴールデンゲートクローニングシステムとして一般的に既知であるベクターにシームレスでクローニングすることができる。
アセンブリPCRの後、アセンブルされた環状構築物またはそのアリコートを含む反応混合物を直接使用して、標準プロトコルに従って、例えば一般的なE.coli株などの好適なコンピテント宿主細胞を形質転換することができる。当業者は、構築物のサイズおよびヌクレオチド組成、プラスミドのコピー数、選択基準などに応じて、好適な宿主細胞を選択することができる。有用な株は、American Type Culture CollectionおよびYaleのE. coli Genetic Stock Center、ならびにAgilent、Promega、Merck、Thermo Fisher ScientificおよびNew England Biolabsなどのサプライヤーを介して、それぞれ、商業的に入手可能である。
多くの場合では、本明細書で提供される方法によって調製された核酸分子は複製可能である。さらに、これらの複製可能な核酸分子の多くは環状である(例えば、プラスミド)。複製可能な核酸分子は、それらが環状であるかどうかに関係なく、概して、2つ以上(例えば、3、4、5、8、10、12個など)の核酸断片のアセンブリから形成される。いくつかの場合では、本明細書で提供される方法は、異なる核酸断片の連結から生じる1つ以上(例えば、2、3、4個など)の選択マーカーまたは1つ以上(例えば、2、3、4個など)の複製起点の再構成に基づく選択を使用する。複製に環状性が必要な場合には、環状核酸分子の形成からさらなる選択がもたらされる場合がある。
別の実施形態では、配列伸長およびライゲーション反応(図1B)において使用される一本鎖オリゴヌクレオチドは、相補的な末端を有する1つ以上の二本鎖核酸断片によって置き換えられて、線形化された標的ベクター(および2つ以上の断片が標的ベクターに同時にアセンブルされる場合は、断片間)での重複伸長PCRを可能にし得る。相補的末端(すなわち重複)は、例えば40bpなどの約15bp~約50bp、約20bp~約40bpのサイズを有し得る。必要な重複のサイズは、融合される断片のサイズおよびその融解温度に依存する場合がある。二本鎖断片は、最初に一本鎖オリゴヌクレオチドからアセンブルされ、図1Aに記載のものなどのワークフローの上記のステップ(ii)および(iii)においてそれぞれ説明されているように、末端プライマーの存在下で増幅される。次いで、増幅された断片を、1回以上のエラー訂正および/またはエラー除去ラウンド(例えば、上記の不一致エンドヌクレアーゼ処理による)に供し、その後、上記の配列伸長およびライゲーション反応についての記載のように、挿入、伸長反応と組み合わせて使用することができる。いくつかの態様では、相互接続された隣接断片の重複および/または線状化ベクターへの末端断片の重複は、約15~約40または約18~約30ヌクレオチド長であり得る。アセンブリの成功を保証するために、より長い領域にわたるハイブリダイゼーションが必要とされる態様では、重複は、約30~約60ヌクレオチド長、またはさらに60ヌクレオチド長を超える場合がある。
アセンブリワークフローによって得られたアセンブルされた構築物は、他のアセンブリワークフロー産物または他の供給源から得られた核酸分子とさらに組み合わせて、より大きな核酸分子(例えば、遺伝子)をアセンブルすることができる。より大きなサイズの構築物は、当業者に既知の任意の手段によってアセンブルされ得る。例えば、より大きな構築物(例えば、5~100キロ塩基)が望まれる場合、IIs型制限部位媒介アセンブリ法を使用して、複数の断片(例えば、2、3、5、8、10個など)をアセンブルすることができる。1つの好適なクローニングシステムは、ゴールデンゲートと称され、米国特許公開第2010/0291633(A1)号およびPCT公開第2010/040531号において様々な形で記載されている。
本明細書で提供されるワークフロー中の多くの時点で、反応混合物構成要素(例えば、dNTP、プライマー、短縮型オリゴヌクレオチド、tRNA分子、緩衝液、塩、タンパク質など)から核酸分子またはアセンブリ産物を分離することが望ましい場合がある。これは、例えば、上記のエキソヌクレアーゼ、制限酵素またはUNGグリコシラーゼを用いて望ましくない核酸副産物を酵素的に除去することによるなど、多くの方法で行うことができる。いくつかの場合では、核酸分子を固体支持体(例えば、磁気ビーズ)に沈殿または結合させ得る。プロセス(例えば、選択されたオリゴヌクレオチドのプールまたは多重化、核酸合成、エラー訂正など)を促進するために反応構成要素から分離されると、次いで、核酸分子は、追加の反応(例えば、アセンブリPCR反応、増幅、クローニングなど)において使用され得る。
より大きな核酸分子もインビボでアセンブルされ得る。インビボアセンブリ方法では、標準のトランスフェクション技術を使用して、宿主細胞をトランスフェクションするために、多くの場合、アセンブルされるすべての亜断片の混合物が使用される。トランスフェクションされる培養物中の細胞数に対する混合物中の亜断片の分子数の比率は、混合物中に異なる亜断片が存在するよりも、少なくともいくつかの細胞でより多くの亜断片分子を取り込めるように十分に高い必要がある。したがって、ほとんどの場合、トランスフェクションの効率が高いほど、最終的な所望のアセンブリ産物を形成するために必要な核酸亜断片のすべてを含有する細胞の数が多くなる。これらのラインに沿った技術パラメータは、米国特許公開第2009/0275086(A1)号に記載されている。
大きな核酸分子は比較的壊れやすく、したがって容易に剪断される。かかる分子を安定化するための1つの方法は、それらを細胞内に維持することによるものである。したがって、いくつかの態様では、本明細書に記載の主題は、宿主細胞における大きな核酸分子のアセンブリおよび/または維持を含む。大きな核酸分子は、典型的には20kb以上である(例えば、25kb超、35kb超、50kb超、70kb超、85kb超、100kb超、200kb超、500kb超、700kb超、900kb超など)。
大きな核酸分子を産生し、さらに分析するための方法は、当技術分野で既知である。例えば、Karas et al.,“Assembly of eukaryotic algal chromosomes in yeast,Journal of Biological Engineering 7:30(2013)は、酵母における藻類染色体のアセンブリおよび、かかる大きな核酸分子のパルスフィールドゲル分析を示している。
上で示唆されたように、かなり効率的に相同組換えを実施すると既知の生物の1つのグループは、酵母である。したがって、本明細書に記載の方法の実施において使用される宿主細胞は、酵母細胞(例えば、Saccharomyces cerevisiae、Schizosaccharomyces pombe、Pichia,pastorisなど)であり得る。
酵母宿主は、独自の遺伝子操作ツールセットのため、ドナーゲノム物質の操作に特に好適である。酵母細胞の自然な能力および数十年にわたる研究により、酵母のDNAを操作するための豊富なツールのセットが作成された。これらの利点は、当技術分野で周知である。例えば、豊富な遺伝子システムを有する酵母は、相同組換えによってヌクレオチド配列をアセンブルおよび再アセンブルすることができ、これは、多くの容易に入手可能な生物によって共有されていない能力である。酵母細胞は、DNAのより大きな断片、例えば、他の生物ではクローニングできない細胞全体、細胞小器官、およびウイルスゲノムのクローニングに使用され得る。したがって、いくつかの態様では、大きな核酸分子を生成する酵母遺伝学の膨大な能力(例えば、合成ゲノミクス)は、アセンブリおよび維持のための宿主細胞として酵母を使用することによって利用され得る。
実施例1
アミノ末端シグナルペプチド(METDTLLLWV LLLWVPGSTG SKDKVTVIT(配列番号5))およびカルボキシ末端6ヒスチジン精製タグ(図15)を含有するTkoEndoMSのコドン最適化コード配列を、以下のパラメータを使用して設計した。コドンの使用法は、ホモサピエンス遺伝子のコドンバイアスに対して調整された。加えて、GC含有量が非常に高い(>80%)または非常に低い(<30%)領域は、可能な限り回避された。
最適化プロセス中、該当する場合、以下のシス作用性配列モチーフは回避された:(1)内部TATAボックス、カイ部位およびリボソーム侵入部位、(2)ATリッチまたはGCリッチ配列ストレッチ、(3)RNA不安定性モチーフ、(4)反復配列およびRNA二次構造、ならびに(5)高等真核生物における(不可解な)スプライシングドナーおよびアクセプター部位。結果は図15に示されるヌクレオチド配列であり、図15に示されるアミノ酸配列を有するタンパク質をコードする。
図15に記載のヌクレオチド配列を、EXPI(商標)293細胞にトランスフェクションし、発現させた。EXPI(商標)293細胞をトランスフェクション後6日間培養し、続いて発現したタンパク質を回収した。分泌されたTkoEndoMSタンパク質を、Tris-HCl、500mMのNaCl中の20~500mMイミダゾールの直線勾配を使用して、HisTrapカラムによってHisタグを使用して精製した。精製されたTkoEndoMSタンパク質を、50mMのTris-HCl pH8.0、0.5mMのDTT、0.1mMのEDTA、0.5MのNaClに対して16時間透析した。クーマシーブルー染色によって純度を評価し、得られたTkoEndoMSは、95%の純度であると決定された。TkoEndoMSは、50mMのTris-HCl pH8.0、0.5mMのDTT、0.1mMのEDTA、0.5MのNaCl、50%のグリセロール中、130ng/μlの最終濃度で保管された。
ベンチマークオリゴヌクレオチドアセンブリプロトコル
アセンブリPCR
Figure 2023516827000010
アセンブリのためのオリゴヌクレオチドの混合物を除いて、すべての反応構成要素のマスター混合物を作成した。730nlのマスター混合物を、ECHO(登録商標)555リキッドハンドラー(Labcyte Inc.)を使用して384ウェルプレートのウェルに移した。次いで、500nlのオリゴヌクレオチドの混合物を、ECHO(登録商標)555を使用して添加した。次いで、以下に示すサイクラープロトコルを使用して熱サイクルを実施した。
Figure 2023516827000011
増幅
Figure 2023516827000012
アセンブリPCR産物を除くすべての構成要素のマスター混合物を準備した。次いで、8.8μlのマスター混合物を、マルチステップピペッターを使用して、アセンブリPCR産物を含有する384ウェルプレートのウェルに移した。次いで、以下に示すサイクラープロトコルを使用して熱サイクルを実施した。
Figure 2023516827000013
PHUSION(商標)DNAポリメラーゼを使用したEndoMSオリゴヌクレオチドアセンブリプロトコル
A.アセンブリPCR
ベンチマークプロトコルと同じであるが、反応液には0.020μlのTkoEndoMS(130ng/μl)が含有されている。したがって、H2Oは、0.420μlである。
B.増幅
ベンチマークプロトコルと同じであるが、反応液には0.140μlのTkoEndoMS(130ng/μl)が含有されている。したがって、H2Oは、6.386μlである。
SUPERFI(商標)II DNAポリメラーゼを使用したオリゴヌクレオチドアセンブリプロトコル(EndoMS任意選択)
A.アセンブリPCR
Figure 2023516827000014
Figure 2023516827000015
アセンブリのためのオリゴヌクレオチドの混合物を除いて、すべての反応構成要素のマスター混合物を作成した。730nlのマスター混合物を、ECHO(登録商標)555リキッドハンドラーを使用して384ウェルプレートのウェルに移した。次いで、500nlのオリゴヌクレオチドの混合物を、ECHO(登録商標)555を使用して添加した。次いで、以下に示すサイクラープロトコルを使用して熱サイクルを実施した。
Figure 2023516827000016
B.増幅
Figure 2023516827000017
Figure 2023516827000018
アセンブリPCR産物を除くすべての構成要素のマスター混合物を準備した。次いで、8.8μlのマスター混合物を、マルチステップピペッターを使用して、アセンブリPCR産物を含有する384ウェルプレートのウェルに移した。次いで、以下に示すサイクラープロトコルを使用して熱サイクルを実施した。
Figure 2023516827000019
T7エンドヌクレアーゼI(T7NI)を使用したエラー訂正プロトコル
A.エラー訂正I(変性および再アニーリング)
Figure 2023516827000020
Figure 2023516827000021
エラー訂正II(不一致切断)
Figure 2023516827000022
B.エラー訂正III(増幅)
Figure 2023516827000023
Figure 2023516827000024
実施例2
熱安定性不一致エンドヌクレアーゼ(TsMME)
アセンブリおよび/または増幅中のTkoEndoMSの使用により、エラー率が減少した核酸分子の生成がもたらされることを実施例1で示した後、エラー率のさらなる低減のための条件を試験した。これらの条件には、TkoEndoMSの相同体、異なるDNAポリメラーゼ、および異なるサイクラープロトコルなど、異なる熱安定性不一致エンドヌクレアーゼ(本明細書では「TsMME」と略記する)の使用が含まれた。
材料および方法:
表15に示されるこれらの酵素のアミノ酸配列とともに、表4に記載され、この実施例で記載の実験において使用される「TsMME」を、熱安定エラー訂正(本明細書では「TsEC」と略される)のためにExpi293で産生した。Thermo Fisher Scientific GeneArt GmbH(Regensburg,DE)によって産生されたこれらの酵素は、95%超の純度であり、以下の緩衝液:50mMのTris-HCl pH8.0、0.5mMのDTT、0.1mMのEDTA、0.5MのNaCl、50%のグリセロール中で各々保管された。
この実施例で設定された実験において、T7エンドヌクレアーゼIを使用したエラー訂正は実施されなかった。
Figure 2023516827000025
ベンチマークオリゴヌクレオチドアセンブリプロトコル
この実施例に記載のベンチマークデータは、PHUSION(商標)DNAポリメラーゼおよびエラー訂正なし、または指定された熱安定性酵素を使用して媒介されるエラー訂正のいずれかを使用して生成された。別段明記しない限り、「ベンチマーク」データは、エラー訂正なしでPHUSION(商標)DNAポリメラーゼを使用して生成された。エラー訂正が実施される前に、異なる配列を有するオリゴヌクレオチドには異なる数のエラーが含有されていたため、ベンチマークが行われた。この変数を訂正するために、ベンチマークデータは、本明細書で別段の記載がない限り、比較データの生成に使用したものと同じオリゴヌクレオチドを使用して生成された。
アセンブリPCR
Figure 2023516827000026
オリゴヌクレオチド混合物を除くすべての構成要素を含有するマスター混合物を作製した。730nlのマスター混合物を、Labcyte ECHO(登録商標)555アコースティックリキッドハンドラーを使用して384ウェルプレートの個々のウェルに移した。次いで、Labcyte ECHO(登録商標)555アコースティックリキッドハンドラーを使用して、500nlのオリゴヌクレオチド混合物も同じウェルに添加した。
Figure 2023516827000027
増幅
Figure 2023516827000028
アセンブリ反応産物を除くすべての構成要素を含有するマスター混合物を調製した。次いで、8.8μlのこのマスター混合物を、マルチステップピペッターで、アセンブリ反応産物を含有する384ウェルプレートの個々のウェルに移した。
Figure 2023516827000029
PHUSION(商標)DNAポリメラーゼを使用したTsECオリゴヌクレオチドアセンブリプロトコル
アセンブリ
使用した方法は、この実施例で先に記載したベンチマークプロトコルと同じであるが、反応混合物には0.020μlのTkoEndoMS(130ng/μl)および0.420μlのH2Oが含有されていた。
増幅
使用した方法は、上記のベンチマークプロトコルと同じであるが、反応混合物には0.140μlのTkoEndoMS(130ng/μl)および6.386μlのH2Oが含有されていた。
PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼを使用したオリゴヌクレオチドアセンブリプロトコル(TsMME任意選択)
Figure 2023516827000030
Figure 2023516827000031
Figure 2023516827000032
オリゴヌクレオチド混合物を除くすべての構成要素を含有するマスター混合物を作製した。730nlのマスター混合物を、Labcyte ECHO(登録商標)555アコースティックリキッドハンドラーを使用して384ウェルプレートの個々のウェルに移した。次いで、Labcyte ECHO(登録商標)555アコースティックリキッドハンドラーを使用して、500nlのオリゴヌクレオチド混合物も同じウェルに添加した。
Figure 2023516827000033
Figure 2023516827000034
Figure 2023516827000035
Figure 2023516827000036
Figure 2023516827000037
増幅
Figure 2023516827000038
Figure 2023516827000039
アセンブリ反応産物を除くすべての構成要素を含有するマスター混合物を調製した。次いで、8.8μlのこのマスター混合物を、マルチステップピペッターで、アセンブリ反応産物を含有する384ウェルプレートのウェルに移した。
Figure 2023516827000040
結果:
「ベンチマークオリゴヌクレオチドアセンブリプロトコル」およびPHUSION(商標)DNAポリメラーゼ(PHUSION(商標))を使用した20個の個々の断片のアセンブリを使用して、「ベンチマーク」/エラーの参照数を確立した。同じ20の個々の断片をまた、PhoNucSまたはSacEndoMSおよびサイクラープロトコルCを使用したエラー訂正を伴って、「オリゴヌクレオチドアセンブリプロトコル」、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ(「SUPERFI(商標)II」)を使用してアセンブルした。得られたデータを以下の表5および6に示す。
Figure 2023516827000041
表5に記載のデータは、SUPERFI(商標)IIおよびPhoNucSでの処理が、SUPERFI(商標)IIおよびSacEndoMSでの処理よりも全体的なエラー率が平均的に改善されることを示している。SacEndoMSは主に置換を訂正し、削除および挿入への効果は小さいが、PhoNucSは、置換に対するより高い活性に加えて、削除および挿入に対する顕著なエラー訂正活性を有していることが見出された。データはまた、いくつかの核酸断片における配列エラーは、他の断片よりも容易に訂正できることを示している。例えば、SUPERFI(商標)IIおよびPhoNucSでの処理は、2つの断片について全体的なエラー率を100%改善し、3つの断片については275%改善し、SUPERFI(商標)IIおよびSacEndoMSでの処理は、1つの断片について全体的なエラー率を25%改善し、4つの断片については100%改善した。この変動性は、部分的に核酸断片の配列の違いによるものであると考えられている。ヌクレオチド配列の違いは、核酸断片における異なるエラーのタイプの普及の変化をもたらす可能性があり、本明細書の他の場所で論じるように、エラー訂正酵素は、異なるエラーのタイプを認識して相互作用する(例えば、結合および/または切断する)能力が異なる。
Figure 2023516827000042
表6に記載のデータは、PhoNucSおよびSacEndoMS酵素によって媒介されるエラー訂正を伴うPLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼを使用してアセンブルおよび増幅された核酸分子は、6つの置換タイプのうちの4つをほぼ完全に欠いているが、ベンチマーク試料には6つの置換タイプすべての顕著な量が含有されている。野生型分子とハイブリダイゼーションすると、酵素によって除去される置換は、それらのホモログTkoEndoMSが顕著な切断活性を有する不一致を形成する(Ishino et al.,Nucl.Acids Res.44:2977-2989(2016))。
表6に記載のデータは、PhoNucSおよびSacEndoMS酵素が、(1)A>CおよびT>Gならびに(2)G>TおよびC>Aトランスバージョンに対して高レベルの切断活性を示さないことも示唆している。野生型分子とハイブリダイゼーションすると、これらのトランスバージョンは、それらのホモログTkoEndoMSが低い切断活性を有する不一致を形成する(Ishino et al.,Nucl.Acids Res.44:2977-2989(2016))。
Figure 2023516827000043
表7は、SUPERFI(商標)II対PHUSION(商標)DNAポリメラーゼによる核酸断片のアセンブリおよび増幅のエラー率データの比較を示している。2つの異なる熱サイクラープロトコルが使用された(プロトコルAおよびC)。データからわかり得るように、表7に記載の2回の実行では、SUPERFI(商標)IIによる核酸断片のアセンブリおよび増幅は、PHUSION(商標)DNAポリメラーゼの場合と比較して、低いエラー率をもたらすことが見出された。このデータはまた、表5に見られるエラー率の改善は、SUPERFI(商標)IIの使用による部分が小さいようであることを示している。これは、表5に見られるエラー率の改善の大部分がTsMMEの使用によるものであることを示唆している。
Figure 2023516827000044
表8に見られるように、PHUSION(商標)DNAポリメラーゼおよびエラー訂正のためのTkoEndoMSを伴う「ベンチマークオリゴヌクレオチドアセンブリプロトコル」の使用は、生成された産物核酸分子における配列エラー数の実質的な減少をもたらした。
Figure 2023516827000045
表9に記載のデータは、6つのすべての置換タイプを顕著な量を含有するベンチマーク試料と比較して、TkoEndoMS酵素によって媒介されるエラー訂正を伴うPHUSION(商標)DNAポリメラーゼを使用してアセンブルおよび増幅された核酸分子は、6つの置換タイプのうちの4つについての比率が大幅に低減した。野生型分子とハイブリダイゼーションすると、TkoEndoMSによって除去される置換は、その酵素が顕著な切断活性を有する不一致を形成する(Ishino et al.,Nucl.Acids Res.44:2977-2989(2016))。
表9に記載のデータは、TkoEndoMS酵素が、(1)A>CおよびT>Gならびに(2)G>TおよびC>Aトランスバージョンに対して高レベルの切断活性を示さないことも示唆している。野生型分子とハイブリダイゼーションすると、これらのトランスバージョンは、TkoEndoMSが低い切断活性を有する不一致を形成する(Ishino et al.,Nucl.Acids Res.44:2977-2989(2016))。
Figure 2023516827000046
表10において多くの効果が見られ、1つは、異なる熱安定性エラー訂正酵素の使用が、アセンブリおよび増幅後の産物核酸分子の異なるエラー率をもたらすことである。また、アセンブリおよび増幅後の核酸分子に存在するエラーの数は、使用するサイクラープロトコルによってある程度変化する。したがって、低エラー率を有するアセンブルされ増幅された核酸分子を得るために変更され得る2つの因子は、(1)使用するエラー訂正酵素(または複数のエラー訂正酵素)、および(2)核酸分子の亜構成要素をアセンブルし、増幅する方法(例えば、熱サイクラープロトコル、使用/存在する緩衝液および緩衝液構成要素など)である。
Figure 2023516827000047
表11のデータは、初期エラー率とは無関係にエラー率の効率的な低減が達成されることも示している。SUPERFI(商標)IIポリメラーゼおよびPhoNucSを使用したアセンブリおよび増幅の場合では、ベンチマークのエラー率が222中1~303中1の場合に、2.1~2.6倍のエラー低減が達成され(表10)、ベンチマークのエラー率が1092中1の場合に1.9倍のエラー低減が達成された。SUPERFI(商標)IIポリメラーゼおよびTkoEndoMSを使用したアセンブリおよび増幅の場合では、ベンチマークのエラー率が205中1~283中1の場合に、1.5~1.8倍のエラー低減が達成され(表10)、ベンチマークのエラー率が1092中1の場合に2.1倍のエラー低減が達成された。
本明細書に記載の主題の特定の態様が本明細書に示され、説明されてきたが、かかる態様が例としてのみ提供されることは当業者には明らかであろう。当業者は、本明細書に記載の主題から逸脱することなく、多数のバリエーション、変更、および置換を想起するであろう。本明細書に記載の本明細書に記載の主題の態様に対する様々な代替物が、本明細書に記載の主題を実施する際に使用され得ることが理解されるべきである。以下の特許請求の範囲は、本明細書に記載の主題の範囲を定義し、これらの特許請求の範囲の範囲内の方法および構造、ならびにそれらの等価物が、それによって網羅されることが意図される。
Figure 2023516827000048
Figure 2023516827000049
Figure 2023516827000050
Figure 2023516827000051
Figure 2023516827000052
Figure 2023516827000053
Figure 2023516827000054
Figure 2023516827000055
Figure 2023516827000056
Figure 2023516827000057
Figure 2023516827000058
Figure 2023516827000059
Figure 2023516827000060
Figure 2023516827000061
Figure 2023516827000062
Figure 2023516827000063
Figure 2023516827000064
参照による組み込み
本明細書に言及されるすべての公開物、特許、および特許出願は、各個別の公開物、特許、または特許出願が、具体的かつ個別に参照により組み込まれることが示されるのと同程度に、参照により本明細書に組み込まれる。これには、以下の特許文書が含まれる:米国特許公開第2003/0152984号、同第2006/0115850号、同第2006/0127920号、同第2007/0231805号、同第2007/0292954号、同第2009/0275086号、同第2010/0062495号、同第2010/0216648号、同第2010/0291633号、同第2011/0124049号、同第2012/0053087号、および同第2017/253909号。米国特許第5,580,759号、同第5,624,827号、同第5,869,644号、同第6,110,668号、同第6,495,318号、同第6,521,427号、同第7,704,690号、同第7,833,759号、同第7,838,210号、同第8,224,578号、同第10,626,383号、および同第10,196,618号。PCT公開第2005/095605号、同第2010/040531号、同第2011/102802号、同第2013/049227号、同第2016/094512号、および同第2020/001783号。
本発明の例示的な主題を、以下の条項によって表す。
条項1.核酸分子のエラー訂正された集団を生成するための方法であって、方法が、
(a)一次アセンブリPCRによって末端配列相補性の領域を有するオリゴヌクレオチドをアセンブルして、アセンブルされた核酸分子の集団を形成することと、
(b)ステップ(a)において形成されたアセンブルされた核酸分子の集団を一次増幅によって増幅して、増幅されたアセンブルされた核酸分子の集団を形成することと、を含み、
ステップ(a)および/または(b)は、1つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。
条項2.1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、熱安定性不一致結合タンパク質である、条項1に記載の方法。
条項3.熱安定性不一致結合タンパク質が、表13または表15に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、条項2に記載の方法。
条項4.1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、熱安定性不一致エンドヌクレアーゼある、条項1に記載の方法。
条項5.熱安定性不一致エンドヌクレアーゼが、表12または表15に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、条項1または4に記載の方法。
条項6.熱安定性不一致エンドヌクレアーゼが、TkoEndoMSである、条項4または5に記載の方法。
条項7.高忠実度DNAポリメラーゼが、ステップ(a)および/または(b)において使用される、条項1~6のいずれか一項に記載の方法。
条項8.高忠実度DNAポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、条項7に記載の方法。
条項9.高忠実度DNAポリメラーゼが、表14に記載の(1)DNAポリメラーゼ1、(2)DNAポリメラーゼ2、(3)DNAポリメラーゼ3、(4)DNAポリメラーゼ4、(5)DNAポリメラーゼ5、(6)DNAポリメラーゼ6、(7)DNAポリメラーゼ7からなる群から選択されるアミノ酸配列を有するポリメラーゼである、条項7または8に記載の方法。
条項10.エラー低減ポリメラーゼ試薬が、1つ以上のアミン化合物を含む、条項8または9に記載の方法。
条項11.1つ以上のアミン化合物が、
(a)ジメチルアミン塩酸塩
(b)ジイソプロピルアミン塩酸塩、
(c)エチル(メチル)アミン塩酸塩、および
(d)トリメチルアミン塩酸塩からなる群から選択される、条項10に記載の組成物。
条項12.1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、ステップ(a)に存在する、条項1~11のいずれか一項に記載の方法。
条項13.1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、ステップ(b)に存在する、条項1~12のいずれか一項に記載の方法。
条項14.1つ以上のエラー訂正ステップが、一次増幅の後に実施される、条項1~13のいずれか一項に記載の方法。
条項15.増幅されたアセンブルされた核酸分子の集団の一次後増幅が、ステップ(b)の後に実施される、条項1~14のいずれか一項に記載の方法。
条項16.増幅されたアセンブルされた核酸分子の集団を、一次後増幅の前に、1つ以上の不一致認識タンパク質と接触させる、条項1~15のいずれか一項に記載の方法。
条項17.1つ以上の不一致認識タンパク質のうちの少なくとも1つが、不一致エンドヌクレアーゼである、条項16に記載の方法。
条項18.不一致エンドヌクレアーゼが、非熱安定性不一致エンドヌクレアーゼである、条項17に記載の方法。
条項19.非熱安定性不一致エンドヌクレアーゼが、
(a)T7エンドヌクレアーゼI、
(b)CEL IIヌクレアーゼ、
(c)CEL Iヌクレアーゼ、および
(d)T4エンドヌクレアーゼVIIからなる群から選択される、条項18に記載の方法。
条項20.増幅されたアセンブルされた核酸分子の集団が、より大きな核酸分子の亜断片を含み、かつより大きな核酸分子の亜断片でもある別の核酸分子と組み合わされて、核酸分子プールを形成する、条項1~19のいずれか一項に記載の方法。
条項21.核酸分子プールの核酸分子が、二次アセンブリPCRによってアセンブルされて、より大きな核酸分子を形成する、条項20に記載の方法。
条項22.亜断片を、二次アセンブリPCRによるアセンブリの前またはアセンブリ中に、1つ以上の不一致認識タンパク質と接触させる、条項21に記載の方法。
条項23.より大きな核酸分子が、熱変性され、次いで再生され、続いて1つ以上の不一致認識タンパク質と接触する、条項20~22のいずれか一項に記載の方法。
条項24.1つ以上の不一致認識タンパク質のうちの少なくとも1つが、不一致結合タンパク質である、条項23に記載の方法。
条項25.不一致結合タンパク質が、固体支持体に結合されている、条項24に記載の方法。
条項26.増幅されたアセンブルされた核酸分子の集団が、配列決定される、条項1~25のいずれか一項に記載の方法。
条項27.増幅されたアセンブルされた核酸分子の集団が、1,000塩基対当たり2つ未満のエラーを含有する、条項1~26のいずれか一項に記載の方法。
条項28.熱安定性不一致認識タンパク質、DNAポリメラーゼ、および1つ以上のアミン化合物を含む組成物。
条項29.DNAポリメラーゼが、高忠実度DNAポリメラーゼである、条項28に記載の組成物。
条項30.高忠実度DNAポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、条項29に記載の組成物。
条項31.高忠実度DNAポリメラーゼが、表14に記載のアミノ酸配列を含む、条項29または30に記載の組成物。
条項32.1つ以上のアミン化合物が、
(a)ジメチルアミン塩酸塩、
(b)ジイソプロピルアミン塩酸塩、
(c)エチル(メチル)アミン塩酸塩、および
(d)トリメチルアミン塩酸塩からなる群から選択される、条項28に記載の組成物。
条項33.2つ以上の核酸分子をさらに含む、条項28~32のいずれか一項に記載の組成物。
条項34.2つ以上の核酸分子が、より大きな核酸分子の亜断片である、条項33に記載の組成物。
条項35.2つ以上の核酸分子が、一本鎖である、条項33または34に記載の組成物。
条項36.2つ以上の一本鎖核酸分子が、100ヌクレオチド長未満である、条項35に記載の組成物。
条項37.2つ以上の一本鎖核酸分子が、約35~約90ヌクレオチド長である、条項35に記載の組成物。
条項38.2つ以上の一本鎖核酸分子が、約30~約65ヌクレオチド長である、条項35に記載の組成物。
条項39.熱安定性不一致認識タンパク質が、不一致エンドヌクレアーゼである、条項28~38のいずれか一項に記載の組成物。
条項40.熱安定性不一致エンドヌクレアーゼが、表12または表15に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、条項39に記載の組成物。
条項41.熱安定性不一致エンドヌクレアーゼが、TkoEndoMSである、条項40に記載の組成物。
条項42.熱安定性不一致認識タンパク質が、不一致結合タンパク質である、条項28~38のいずれか一項に記載の組成物。
条項43.熱安定性不一致結合タンパク質が、表13または表15に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、条項42に記載の組成物。
条項44.2つ以上の核酸分子のうちの少なくとも1つが、一本鎖であり、2つ以上の核酸分子のうちの少なくとも1つが、二本鎖である、条項33または34に記載の組成物。
条項45.所定の配列を有する核酸分子を生成する方法であって、方法が、
(a)相補的重複領域を有する複数の一本鎖オリゴヌクレオチドを提供することであって、一本鎖オリゴヌクレオチドの各々が、標的核酸分子の配列領域を含み、複数の一本鎖オリゴヌクレオチドが、
(i)複数の内部オリゴヌクレオチドであって、複数において2つの他のオリゴヌクレオチドと重複する配列領域を有する、複数の内部オリゴヌクレオチド、ならびに
(ii)全長核酸分子の5’および3’末端に位置するように設計され、複数において内部オリゴヌクレオチドのうちの1つと重複する配列領域を有する、2つの末端オリゴヌクレオチドを含む、提供すること、
(b)一次アセンブリPCRによって複数のオリゴヌクレオチドをアセンブルして、アセンブルされた二本鎖核酸アセンブリ産物を得ること、
(c)ステップ(b)において得られたアセンブリ産物の少なくとも一部分を、一対のプライマーと組み合わせることであって、プライマーが、アセンブリ産物の5’および3’末端に結合するように設計された、組み合わせること、ならびにPCR増幅反応を実施して、増幅されたアセンブリ産物を産生すること、を含み、
ステップ(b)および/またはステップ(c)が、1つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。
条項46.(d)1つ以上のエラー訂正ステップを実施することをさらに含み、エラー訂正ステップが、
(iii)ステップ(c)の増幅されたアセンブリ産物を変性および再アニーリングして、二本鎖核酸を含有する1つ以上の不一致を生成すること、ならびに
(iv)二本鎖核酸を含有する不一致を、1つ以上の不一致認識タンパク質で処理すること、ならびに
(v)任意選択で、増幅反応を実施すること、を含む、条項45に記載の方法。
条項47.ステップ(d)において使用される不一致認識タンパク質が、不一致エンドヌクレアーゼまたは不一致結合タンパク質である、条項46に記載の方法。
条項48.不一致エンドヌクレアーゼが、T7エンドヌクレアーゼIである、条項47に記載の方法。
条項49.不一致結合タンパク質が、MutSである、条項47に記載の方法。
条項50.熱安定性不一致認識タンパク質が、熱安定性不一致エンドヌクレアーゼとしてである、条項45または46に記載の方法。
条項51.熱安定性不一致エンドヌクレアーゼが、超好熱性古細菌に由来し、任意選択で、超好熱性古細菌が、Pyrococcus furiosusまたはPyrococcus abyssiである、条項50に記載の方法。
条項52.熱安定性不一致認識タンパク質が、表12、13、または15に示されるアミノ酸配列を有するタンパク質、およびそれらと少なくとも95%の配列同一性を有するそれらのバリアントの群から選択される、条項45または46に記載の方法。
条項53.熱安定性不一致認識タンパク質が、インビトロ転写/翻訳によって得られる、条項49~52のいずれか一項に記載の方法。
条項54.ステップ(b)、(c)および(d)(iii)のうちの1つ以上が、高忠実度DNAポリメラーゼの存在下で実施され、任意選択で、ポリメラーゼが、PHUSION(商標)DNAポリメラーゼ、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ、Q5 DNAポリメラーゼ、およびPRIMESTAR GXL DNAポリメラーゼからなる群から選択される、条項45~53のいずれか一項に記載の方法。
条項55.ステップ(b)、(c)および(d)(iii)のうちの1つ以上が、高忠実度DNAポリメラーゼの存在下で実施され、任意選択で、ポリメラーゼが、表14に記載の(1)DNAポリメラーゼ1、(2)DNAポリメラーゼ2、(3)DNAポリメラーゼ3、(4)DNAポリメラーゼ4、(5)DNAポリメラーゼ5、(6)DNAポリメラーゼ6、(7)DNAポリメラーゼ7からなる群から選択されるアミノ酸配列を有するポリメラーゼである、条項45~53のいずれか一項に記載の方法。
条項56.2つ以上の増幅されたアセンブリ産物が、1つ以上のエラー訂正ステップを実施する前にプールされる、条項45~53のいずれか一項に記載の方法。
条項57.1つ以上のエラー訂正ステップの前に、増幅されたアセンブリ産物をエキソヌクレアーゼで処理することをさらに含み、任意選択で、エキソヌクレアーゼが、エキソヌクレアーゼIである、条項46~53のいずれか一項に記載の方法。

Claims (57)

  1. 核酸分子のエラー訂正された集団を生成するための方法であって、前記方法が、
    (a)一次アセンブリPCRによって末端配列相補性の領域を有するオリゴヌクレオチドをアセンブルして、アセンブルされた核酸分子の集団を形成することと、
    (b)ステップ(a)において形成された前記アセンブルされた核酸分子の集団を一次増幅によって増幅して、増幅されたアセンブルされた核酸分子の集団を形成することと、を含み、
    ステップ(a)および/または(b)は、1つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。
  2. 前記1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、熱安定性不一致結合タンパク質である、請求項1に記載の方法。
  3. 前記熱安定性不一致結合タンパク質が、表13または表15に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、請求項2に記載の方法。
  4. 前記1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、熱安定性不一致エンドヌクレアーゼある、請求項1に記載の方法。
  5. 前記熱安定性不一致エンドヌクレアーゼが、表12または表15に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、請求項1または4に記載の方法。
  6. 前記熱安定性不一致エンドヌクレアーゼが、TkoEndoMSである、請求項4または5に記載の方法。
  7. 高忠実度DNAポリメラーゼが、ステップ(a)および/または(b)において使用される、請求項1~6のいずれか一項に記載の方法。
  8. 前記高忠実度DNAポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、請求項7に記載の方法。
  9. 前記高忠実度DNAポリメラーゼが、表14に記載の(1)DNAポリメラーゼ1、(2)DNAポリメラーゼ2、(3)DNAポリメラーゼ3、(4)DNAポリメラーゼ4、(5)DNAポリメラーゼ5、(6)DNAポリメラーゼ6、(7)DNAポリメラーゼ7からなる群から選択されるアミノ酸配列を有するポリメラーゼである、請求項7または8に記載の方法。
  10. 前記エラー低減ポリメラーゼ試薬が、1つ以上のアミン化合物を含む、請求項8または9に記載の方法。
  11. 前記1つ以上のアミン化合物が、
    (a)ジメチルアミン塩酸塩
    (b)ジイソプロピルアミン塩酸塩、
    (c)エチル(メチル)アミン塩酸塩、および
    (d)トリメチルアミン塩酸塩からなる群から選択される、請求項10に記載の方法。
  12. 前記1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、ステップ(a)に存在する、請求項1~11のいずれか一項に記載の方法。
  13. 前記1つ以上の熱安定性不一致認識タンパク質のうちの少なくとも1つが、ステップ(b)に存在する、請求項1~12のいずれか一項に記載の方法。
  14. 1つ以上のエラー訂正ステップが、一次増幅の後に実施される、請求項1~13のいずれか一項に記載の方法。
  15. 前記増幅されたアセンブルされた核酸分子の集団の一次後増幅が、ステップ(b)の後に実施される、請求項1~14のいずれか一項に記載の方法。
  16. 前記増幅されたアセンブルされた核酸分子の集団を、前記一次後増幅の前に、1つ以上の不一致認識タンパク質と接触させる、請求項1~15のいずれか一項に記載の方法。
  17. 前記1つ以上の不一致認識タンパク質のうちの少なくとも1つが、不一致エンドヌクレアーゼである、請求項16に記載の方法。
  18. 前記不一致エンドヌクレアーゼが、非熱安定性不一致エンドヌクレアーゼである、請求項17に記載の方法。
  19. 前記非熱安定性不一致エンドヌクレアーゼが、
    (a)T7エンドヌクレアーゼI、
    (b)CEL IIヌクレアーゼ、
    (c)CEL Iヌクレアーゼ、および
    (d)T4エンドヌクレアーゼVIIからなる群から選択される、請求項18に記載の方法。
  20. 前記増幅されたアセンブルされた核酸分子の集団が、より大きな核酸分子の亜断片を含み、かつ前記より大きな核酸分子の亜断片でもある別の核酸分子と組み合わされて、核酸分子プールを形成する、請求項1~19のいずれか一項に記載の方法。
  21. 前記核酸分子プールの前記核酸分子が、二次アセンブリPCRによってアセンブルされて、前記より大きな核酸分子を形成する、請求項20に記載の方法。
  22. 前記亜断片を、二次アセンブリPCRによるアセンブリの前またはアセンブリ中に、前記1つ以上の不一致認識タンパク質と接触させる、請求項21に記載の方法。
  23. 前記より大きな核酸分子が、熱変性され、次いで再生され、続いて前記1つ以上の不一致認識タンパク質と接触する、請求項20~22のいずれか一項に記載の方法。
  24. 前記1つ以上の不一致認識タンパク質のうちの前記少なくとも1つが、不一致結合タンパク質である、請求項23に記載の方法。
  25. 前記不一致結合タンパク質が、固体支持体に結合されている、請求項24に記載の方法。
  26. 前記増幅されたアセンブルされた核酸分子の集団が、配列決定される、請求項1~25のいずれか一項に記載の方法。
  27. 前記増幅されたアセンブルされた核酸分子の集団が、1,000塩基対当たり2つ未満のエラーを含有する、請求項1~26のいずれか一項に記載の方法。
  28. 熱安定性不一致認識タンパク質、DNAポリメラーゼ、および1つ以上のアミン化合物を含む、組成物。
  29. 前記DNAポリメラーゼが、高忠実度DNAポリメラーゼである、請求項28に記載の組成物。
  30. 前記高忠実度DNAポリメラーゼが、エラー低減ポリメラーゼ試薬の構成要素である、請求項29に記載の組成物。
  31. 前記高忠実度DNAポリメラーゼが、表14に記載のアミノ酸配列を含む、請求項29または30に記載の組成物。
  32. 前記1つ以上のアミン化合物が、
    (a)ジメチルアミン塩酸塩、
    (b)ジイソプロピルアミン塩酸塩、
    (c)エチル(メチル)アミン塩酸塩、および
    (d)トリメチルアミン塩酸塩からなる群から選択される、請求項28に記載の組成物。
  33. 2つ以上の核酸分子をさらに含む、請求項28~32のいずれか一項に記載の組成物。
  34. 前記2つ以上の核酸分子が、より大きな核酸分子の亜断片である、請求項33に記載の組成物。
  35. 前記2つ以上の核酸分子が、一本鎖である、請求項33または34に記載の組成物。
  36. 前記2つ以上の一本鎖核酸分子が、100ヌクレオチド長未満である、請求項35に記載の組成物。
  37. 前記2つ以上の一本鎖核酸分子が、約35~約90ヌクレオチド長である、請求項35に記載の組成物。
  38. 前記2つ以上の一本鎖核酸分子が、約30~約65ヌクレオチド長である、請求項35に記載の組成物。
  39. 前記熱安定性不一致認識タンパク質が、不一致エンドヌクレアーゼである、請求項28~35のいずれか一項に記載の組成物。
  40. 前記熱安定性不一致エンドヌクレアーゼが、表12または表15に記載のアミノ酸配列を有するエンドヌクレアーゼから選択される、請求項39に記載の組成物。
  41. 前記熱安定性不一致エンドヌクレアーゼが、TkoEndoMSである、請求項40に記載の組成物。
  42. 前記熱安定性不一致認識タンパク質が、不一致結合タンパク質である、請求項28~38のいずれか一項に記載の組成物。
  43. 前記熱安定性不一致結合タンパク質が、表13または表15に記載のアミノ酸配列を有する不一致結合タンパク質から選択される、請求項42に記載の組成物。
  44. 前記2つ以上の核酸分子のうちの少なくとも1つが、一本鎖であり、前記2つ以上の核酸分子のうちの少なくとも1つが、二本鎖である、請求項33または34に記載の組成物。
  45. 所定の配列を有する核酸分子を生成する方法であって、前記方法が、
    (a)相補的重複領域を有する複数の一本鎖オリゴヌクレオチドを提供することであって、前記一本鎖オリゴヌクレオチドの各々が、標的核酸分子の配列領域を含み、前記複数の一本鎖オリゴヌクレオチドが、
    (i)複数の内部オリゴヌクレオチドであって、前記複数において2つの他のオリゴヌクレオチドと重複する配列領域を有する、複数の内部オリゴヌクレオチド、ならびに
    (ii)全長核酸分子の5’および3’末端に位置するように設計され、前記複数において前記内部オリゴヌクレオチドのうちの1つと重複する配列領域を有する、2つの末端オリゴヌクレオチドを含む、提供すること、
    (b)一次アセンブリPCRによって前記複数のオリゴヌクレオチドをアセンブルして、アセンブルされた二本鎖核酸アセンブリ産物を得ること、
    (c)ステップ(b)において得られた前記アセンブリ産物の少なくとも一部分を、一対のプライマーと組み合わせることであって、前記プライマーが、前記アセンブリ産物の5’および3’末端に結合するように設計された、組み合わせること、ならびにPCR増幅反応を実施して、増幅されたアセンブリ産物を産生すること、を含み、
    ステップ(b)および/またはステップ(c)が、1つ以上の熱安定性不一致認識タンパク質の存在下で実施される、方法。
  46. (d)1つ以上のエラー訂正ステップを実施することをさらに含み、エラー訂正ステップが、
    (iii)ステップ(c)の前記増幅されたアセンブリ産物を変性および再アニーリングして、二本鎖核酸を含有する1つ以上の不一致を生成すること、ならびに
    (iv)前記二本鎖核酸を含有する不一致を、1つ以上の不一致認識タンパク質で処理すること、ならびに
    (v)任意選択で、増幅反応を実施すること、を含む、請求項45に記載の方法。
  47. ステップ(d)において使用される前記不一致認識タンパク質が、不一致エンドヌクレアーゼまたは不一致結合タンパク質である、請求項46に記載の方法。
  48. 前記不一致エンドヌクレアーゼが、T7エンドヌクレアーゼIである、請求項47に記載の方法。
  49. 前記不一致結合タンパク質が、MutSである、請求項47に記載の方法。
  50. 前記熱安定性不一致認識タンパク質が、熱安定性不一致エンドヌクレアーゼとしてである、請求項50に記載の方法。
  51. 前記熱安定性不一致エンドヌクレアーゼが、超好熱性古細菌に由来し、任意選択で、前記超好熱性古細菌が、Pyrococcus furiosusまたはPyrococcus abyssiである、請求項50に記載の方法。
  52. 前記熱安定性不一致認識タンパク質が、表12、13、または15に記載のアミノ酸配列を有するタンパク質、およびそれらと少なくとも95%の配列同一性を有するそれらのバリアントの群から選択される、請求項45または46に記載の方法。
  53. 前記熱安定性不一致認識タンパク質が、インビトロ転写/翻訳によって得られる、請求項49~52のいずれか一項に記載の方法。
  54. ステップ(b)、(c)および(d)(iii)のうちの1つ以上が、高忠実度DNAポリメラーゼの存在下で実施され、任意選択で、前記ポリメラーゼが、PHUSION(商標)DNAポリメラーゼ、PLATINUM(商標)SUPERFI(商標)II DNAポリメラーゼ、Q5 DNAポリメラーゼ、およびPRIMESTAR GXL DNAポリメラーゼからなる群から選択される、請求項45~53のいずれか一項に記載の方法。
  55. ステップ(b)、(c)および(d)(iii)のうちの1つ以上が、高忠実度DNAポリメラーゼの存在下で実施され、任意選択で、前記ポリメラーゼが、表14に記載の(1)DNAポリメラーゼ1、(2)DNAポリメラーゼ2、(3)DNAポリメラーゼ3、(4)DNAポリメラーゼ4、(5)DNAポリメラーゼ5、(6)DNAポリメラーゼ6、(7)DNAポリメラーゼ7からなる群から選択されるアミノ酸配列を有するポリメラーゼである、請求項45~53のいずれか一項に記載の方法。
  56. 2つ以上の増幅されたアセンブリ産物が、前記1つ以上のエラー訂正ステップを実施する前にプールされる、請求項45~53のいずれか一項に記載の方法。
  57. 前記1つ以上のエラー訂正ステップの前に、前記増幅されたアセンブリ産物をエキソヌクレアーゼで処理することをさらに含み、任意選択で、前記エキソヌクレアーゼが、エキソヌクレアーゼIである、請求項46~53のいずれか一項に記載の方法。
JP2022578942A 2020-03-06 2021-03-05 高配列忠実度の核酸合成およびアセンブリ Pending JP2023516827A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062986209P 2020-03-06 2020-03-06
US62/986,209 2020-03-06
PCT/US2021/021104 WO2021178809A1 (en) 2020-03-06 2021-03-05 High sequence fidelity nucleic acid synthesis and assembly

Publications (1)

Publication Number Publication Date
JP2023516827A true JP2023516827A (ja) 2023-04-20

Family

ID=75223516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022578942A Pending JP2023516827A (ja) 2020-03-06 2021-03-05 高配列忠実度の核酸合成およびアセンブリ

Country Status (5)

Country Link
US (1) US20240025939A1 (ja)
EP (1) EP4114972A1 (ja)
JP (1) JP2023516827A (ja)
CN (1) CN115244189A (ja)
WO (1) WO2021178809A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023147239A1 (en) * 2022-01-28 2023-08-03 Chen cheng yao Enzymatic synthesis of polynucleotide

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
RU2142015C1 (ru) 1991-09-06 1999-11-27 Рисерч Дивелопмент Фаундейшн Фрагмент днк, кодирующий белок гелонина, и способ его получения, вектор, обеспечивающий экспрессию белка гелонина, рекомбинантный штамм e.coli - продуцент белка гелонина
US5869644A (en) 1992-04-15 1999-02-09 The Johns Hopkins University Synthesis of diverse and useful collections of oligonucleotidies
US5580759A (en) 1994-02-03 1996-12-03 Board Of Regents, The University Of Texas System Construction of recombinant DNA by exonuclease recession
US6495318B2 (en) 1996-06-17 2002-12-17 Vectorobjects, Llc Method and kits for preparing multicomponent nucleic acid constructs
US6110668A (en) 1996-10-07 2000-08-29 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Gene synthesis method
WO1999014318A1 (en) 1997-09-16 1999-03-25 Board Of Regents, The University Of Texas System Method for the complete chemical synthesis and assembly of genes and genomes
US6083726A (en) 1998-02-03 2000-07-04 Lucent Technologies, Inc. Methods for polynucleotide synthesis and articles for polynucleotide hybridization
US8137906B2 (en) 1999-06-07 2012-03-20 Sloning Biotechnology Gmbh Method for the synthesis of DNA fragments
AU2002314712C1 (en) 2001-02-02 2008-10-02 Novici Biotech Llc A method of increasing complementarity in a heteroduplex polynucleotide
DE50213541D1 (de) 2002-01-11 2009-06-25 Biospring Ges Fuer Biotechnolo Verfahren zur Herstellung von DNA
US7078211B2 (en) 2002-02-01 2006-07-18 Large Scale Biology Corporation Nucleic acid molecules encoding endonucleases and methods of use thereof
US7129075B2 (en) 2002-10-18 2006-10-31 Transgenomic, Inc. Isolated CEL II endonuclease
US7879580B2 (en) * 2002-12-10 2011-02-01 Massachusetts Institute Of Technology Methods for high fidelity production of long nucleic acid molecules
DE10260805A1 (de) 2002-12-23 2004-07-22 Geneart Gmbh Verfahren und Vorrichtung zum Optimieren einer Nucleotidsequenz zur Expression eines Proteins
JP2007534320A (ja) 2004-02-27 2007-11-29 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ ポリヌクレオチド合成法
EP1574570A1 (en) 2004-03-12 2005-09-14 Universität Regensburg Process for reducing the number of mismatches in double stranded polynucleotides
US7892725B2 (en) 2004-03-29 2011-02-22 Inguran, Llc Process for storing a sperm dispersion
JP4789271B2 (ja) 2005-12-02 2011-10-12 シンセティック ゲノミクス、インク. エラーが最小化された核酸分子の合成
US20070231805A1 (en) 2006-03-31 2007-10-04 Baynes Brian M Nucleic acid assembly optimization using clamped mismatch binding proteins
US20070292954A1 (en) 2006-04-21 2007-12-20 The Brigham And Women's Hospital, Inc. Generation of recombinant DNA by sequence-and ligation-independent cloning
EP2115144A1 (en) 2007-02-05 2009-11-11 Philipps-Universität Marburg Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases
WO2008112683A2 (en) 2007-03-13 2008-09-18 President And Fellows Of Harvard College Gene synthesis by circular assembly amplification
EP2190988A4 (en) 2007-08-07 2010-12-22 Agency Science Tech & Res INTEGRATED MICROFLUID DEVICE FOR GENE SYNTHESIS
CN101932725A (zh) 2007-10-08 2010-12-29 合成基因组股份有限公司 大核酸的装配
SG10201800778QA (en) 2008-02-15 2018-02-27 Synthetic Genomics Inc Methods for in vitro joining and combinatorial assembly of nucleic acid molecules
WO2010030776A1 (en) 2008-09-10 2010-03-18 Genscript Corporation Homologous recombination-based dna cloning methods and compositions
ES2364920T3 (es) 2008-10-08 2011-09-16 Icon Genetics Gmbh Proceso de clonación limpia.
WO2010094772A1 (en) 2009-02-20 2010-08-26 Febit Holding Gmbh Synthesis of sequence-verified nucleic acids
WO2011102802A1 (en) 2010-02-18 2011-08-25 Agency For Science, Technology And Research Method for reducing mismatches in double-stranded dna molecules
CN103945931B (zh) 2011-09-26 2017-03-22 基因技术股份公司 高效的小体积核酸合成
US20150353921A9 (en) * 2012-04-16 2015-12-10 Jingdong Tian Method of on-chip nucleic acid molecule synthesis
KR102126744B1 (ko) 2013-03-14 2020-06-26 다카라 바이오 가부시키가이샤 내열성 미스매치 엔도뉴클레아제의 이용방법
KR20170053636A (ko) 2014-09-11 2017-05-16 다카라 바이오 가부시키가이샤 내열성의 미스매치 엔도뉴클레아제의 이용방법
EP3229959B1 (en) 2014-12-09 2019-05-15 Life Technologies Corporation High efficiency, small volume nucleic acid synthesis
EP3402880B1 (en) 2016-01-15 2024-01-03 Thermo Fisher Scientific Baltics UAB Thermophilic dna polymerase mutants
US20210147830A1 (en) 2018-06-29 2021-05-20 Thermo Fisher Scientific Geneart Gmbh High throughput assembly of nucleic acid molecules

Also Published As

Publication number Publication date
EP4114972A1 (en) 2023-01-11
US20240025939A1 (en) 2024-01-25
WO2021178809A1 (en) 2021-09-10
WO2021178809A9 (en) 2021-10-07
CN115244189A (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
US11725307B2 (en) Immuno-PETE
CN109844134B (zh) 闭合线性dna的生产
CN107075511B (zh) 合成子的形成
CA2751470C (en) Template-independent ligation of single-stranded dna
US20100167954A1 (en) Method of library preparation avoiding the formation of adaptor dimers
EP3650543B1 (en) Dna production method and dna fragment joining kit
WO2008054543A2 (en) Oligonucleotides for multiplex nucleic acid assembly
SG192870A1 (en) Use of template switching for dna synthesis
US20230002754A1 (en) Vitro Cleavage of DNA Using Argonaute
EP1419248B1 (en) Method for the selective combinatorial randomization of polynucleotides
JP2023516827A (ja) 高配列忠実度の核酸合成およびアセンブリ
US20230083751A1 (en) Method For Constructing Gene Mutation Library
KR20230161955A (ko) 등온 상보적 dna 및 라이브러리 제조의 개선된 방법
CN101535478B (zh) 核酸扩增方法
JP2022533366A (ja) プライマー認識が改良されたPhi29 DNAポリメラーゼ変異体
WO2023220110A1 (en) Highly efficient and simple ssper and rrpcr approaches for the accurate site-directed mutagenesis of large plasmids

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240304