JP7335165B2 - デノボ合成されたコンビナトリアル核酸ライブラリー - Google Patents

デノボ合成されたコンビナトリアル核酸ライブラリー Download PDF

Info

Publication number
JP7335165B2
JP7335165B2 JP2019549581A JP2019549581A JP7335165B2 JP 7335165 B2 JP7335165 B2 JP 7335165B2 JP 2019549581 A JP2019549581 A JP 2019549581A JP 2019549581 A JP2019549581 A JP 2019549581A JP 7335165 B2 JP7335165 B2 JP 7335165B2
Authority
JP
Japan
Prior art keywords
nucleic acid
library
examples
mutant
polynucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019549581A
Other languages
English (en)
Other versions
JP2020511135A5 (ja
JP2020511135A (ja
Inventor
コックス,アンソニー
チェン,スーユアン
レドガー,チャールズ
トッパニ,ドミニク
Original Assignee
ツイスト バイオサイエンス コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ツイスト バイオサイエンス コーポレーション filed Critical ツイスト バイオサイエンス コーポレーション
Publication of JP2020511135A publication Critical patent/JP2020511135A/ja
Publication of JP2020511135A5 publication Critical patent/JP2020511135A5/ja
Priority to JP2023011285A priority Critical patent/JP2023087685A/ja
Application granted granted Critical
Publication of JP7335165B2 publication Critical patent/JP7335165B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/565Complementarity determining region [CDR]

Description

相互参照
本出願は、2017年10月27日に出願された米国仮特許出願62/578,326号;および、2017年3月15日に出願された米国仮特許出願第61/471,723号の利益を主張し、その各々は、全体として引用によって本明細書に組み込まれる。
配列表
本出願は配列表を包含しており、これは、ASCIIフォーマットで電子的に提出され、その全体を引用することで本明細書に組み込まれる。2018年3月13日に作成された上記ASCIIのコピーは、44854-729_601_SL.txtという名称であり、18,419バイトのサイズである。
合成生物学の基礎は設計、構築、および試験のプロセス--これらの特定用途向けの経路と生命体の迅速かつ手軽な生成と最適化のためにDNAを入手しやすいことを要求する反復するプロセスである。設計段階では、DNAを構成するA、C、T、およびGのヌクレオチドは、各々の配列変異体が試験される特定の仮説を表す、所望の遺伝子座あるいは経路を含む様々な遺伝子配列へ組み立てられる。こうした変異体遺伝子配列は、進化生物学から始まり、遺伝子、ゲノム、トランスクリプトーム、およびプロテオームを構築する配列の全体性に関係する概念である、配列空間の部分集合を表す。
多くの様々な変異体は典型的には、配列空間の適切なサンプリングを可能にし、かつ最適化された設計の可能性を最大化するために、それぞれの設計-構築-試験のサイクルのために設計されている。概念上は直接的であるが、従来の合成方法の速度、スループット、および品質に関するプロセスの障害は、このサイクルが進行するペースを低下させ、開発時間を引き延ばす。非常に正確なDNAのコストが高いことと、現在の合成技術のスループットが限定されていることが原因で、配列空間を十分に探索することができないことは、律速段階に留まっている。
構築相から始まって、2つのプロセス:核酸合成と遺伝子合成が注目に値する。歴史上、様々な遺伝子変異体の合成は分子クローニングを通じて遂行された。頑丈であるが、この手法はスケーラブルではない。初期の化学的な遺伝子合成の試みは、重複する配列相同性を備えた多くのポリヌクレオチドを生成することに重点を置いていた。これらをプールし、複数回のポリメラーゼ連鎖反応(PCR)にさらして、重複するポリヌクレオチドを完全長の二重鎖遺伝子に連結できるようにした。時間がかかる上に多くの人手を要する構造、大量のホスホラミダイトを必要とすること、高価な原料、および下流工程に必要とされるよりも著しく少ない最終生成物のナノモル量の生成を含む、多くの因子がこの方法の妨げとなっており、1つの遺伝子の合成をセットアップするために多くの別々のポリヌクレオチドは1つの96ウェルプレートを必要とした。
マイクロアレイ上でのポリヌクレオチドの合成は、遺伝子合成のスループットを著しく増大させた。多くのポリヌクレオチドをマイクロアレイ表面上で合成し、その後、切断して、まとめてプールすることができる。特定遺伝子に運命づけられたそれぞれのポリヌクレオチドは、ポリヌクレオチドのその特定の亜集団を取り除いて(depooled)、所望の遺伝子へ組み立てることを可能にした独自のバーコード配列を含んでいる。プロセスのこの段階では、各サブプールを96ウェルプレート中の1つのウェルへ移し、スループットを96の遺伝子に増加させる。これは、古典的方法よりもスループットが2桁高いが、コスト効率に欠け、かつ、所用時間がかかることから、一度に数千もの配列を要求する設計、構築、試験サイクルを適切に支援するものではない。
変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、(a)少なくとも500のポリヌクレオチド配列をコードするあらかじめ定められた配列を提供する工程であって、少なくとも500のポリヌクレオチド配列はあらかじめ選択されたコドン分布を有する、工程と;(b)少なくとも500のポリヌクレオチド配列をコードする複数のポリヌクレオチドを合成する工程と;(c)複数のポリヌクレオチドによってコードされた核酸、または複数のポリヌクレオチドに基づいて翻訳されたタンパク質について活性を分析する工程と;(d)工程(c)のアッセイからの結果を収集する工程であって、収集する工程は、否定的な結果または無効の結果に関連するあらかじめ定められた配列の結果を収集することを含む、工程、とを含んでいる。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、ここで、工程(d)はあらかじめ定められた配列の少なくとも80%に関する結果を収集することを含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、ここで、工程(d)はあらかじめ定められた配列の少なくとも90%に関する結果を収集することを含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、ここで、工程(d)はあらかじめ定められた配列の少なくとも100%に関する結果を収集することを含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約70%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約90%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約95%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、少なくとも500のポリヌクレオチド配列の少なくとも80%は適切なサイズである。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、少なくとも500のポリヌクレオチド配列の少なくとも約80%は、変異体核酸ライブラリーのポリヌクレオチド配列の各々について平均頻度の2倍以内の量で変異体核酸ライブラリー中に存在する。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、活性の増強または低下に関連するあらかじめ定められた配列について工程(c)のアッセイから結果を収集する工程をさらに含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、活性は細胞活性である。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、細胞活性は、繁殖、成長、接着、死亡、遊走、エネルギー産生、酸素利用、代謝活性、細胞シグナル伝達、遊離ラジカル損傷に対する反応、またはそれらの任意の組み合わせを含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、変異体遺伝子あるいはその断片のための配列をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、ここで、変異体核酸ライブラリーは、抗体、酵素、あるいはペプチドの少なくとも一部をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、核酸ライブラリーはガイドRNA(gRNA)をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、核酸ライブラリーは、siRNA、shRNA、RNAi、あるいはmiRNAをコードする。
核酸のコンビナトリアルライブラリーを生成する方法が本明細書で提供され、上記方法は:(a)(i)第1の複数のポリヌクレオチドであって、第1の複数のポリヌクレオチドのそれぞれのポリヌクレオチドが、単一の参照配列と比較して、変異体配列をコードする、第1の複数のポリヌクレオチドと、(ii)第2の複数のポリヌクレオチドであって、第2の複数のポリヌクレオチドのそれぞれのポリヌクレオチドが、上記単一の参照配列と比較して、変異体配列をコードする、第2の複数のポリヌクレオチドと、をコードするあらかじめ定められた配列を設計する工程と;(b)第1の複数のポリヌクレオチドと第2の複数のポリヌクレオチドを合成する工程と;(c)核酸のコンビナトリアルライブラリーを形成するために第1の複数のポリヌクレオチドと第2の複数のポリヌクレオチドを混合する工程であって、予測された多様性の少なくとも約70%が表される、工程とを含む。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、非飽和コンビナトリアルライブラリーである。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、飽和コンビナトリアルライブラリーである。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、少なくとも10,000のポリヌクレオチドが合成される。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、非飽和コンビナトリアルライブラリーの生成のためのポリヌクレオチドの合計数は、飽和コンビナトリアルライブラリーの生成のためのポリヌクレオチドの合計数の少なくとも25%未満である。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、変異体の少なくとも80%は適切なサイズである。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、予測された多様性の少なくとも約90%が表される。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、予測された多様性の少なくとも約95%が表される。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、第1の参照配列あるいは第2の参照配列をコードする。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、翻訳時のコンビナトリアルライブラリーはタンパク質ライブラリーをコードする。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーの核酸はベクターに挿入される。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとしてコンビナトリアルライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、変異体遺伝子あるいはその断片のための配列をコードする。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、抗体、酵素、あるいはペプチドの少なくとも一部をコードする。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、抗体の可変領域あるいは定常領域の少なくとも一部をコードする。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、ここで、コンビナトリアルライブラリーは抗体の少なくとも1つのCDR領域をコードする。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、抗体の重鎖上のCDR1、CDR2、および、CDR3と、軽鎖上のCDR1、CDR2、および、CDR3をコードする。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーはガイドRNA(gRNA)をコードする。
変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、(a)複数のポリヌクレオチドをコードするあらかじめ定められた配列を提供する工程であって、ポリヌクレオチドは、単一の参照配列と比較して、変異体配列を有する複数のコドンをコードする、工程と;(b)あらかじめ定められた核酸参照配列中のあらかじめ選択された位置のコドンに対する分布値を選択する工程と;(c)選択された分布値に合う分布値を有する核酸配列のセットをランダムに生成する機械命令を提供する工程であって、核酸配列のセットは、飽和コドン変異体ライブラリーを生成するために必要とされる核酸配列の量未満である、工程と;(d)あらかじめ選択された分布の変異体核酸ライブラリーを合成する工程であって、予測された多様性の少なくとも約70%が表される、工程を含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体の少なくとも80%は適切なサイズである。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約90%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約95%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、翻訳時の変異体核酸ライブラリーはタンパク質ライブラリーをコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーの核酸はベクターに挿入される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとして変異体核酸ライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては、変異体配列を有する複数のコドンの各コドンを決定するために使用される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては生物中のコドン配列の頻度に基づく。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、上記生物は、動物、植物、真菌、原生生物、古細菌、および細菌の少なくとも1つである。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当てはコドン配列の多様性に基づく。
変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、(a)複数のポリヌクレオチドをコードするあらかじめ定められた配列を提供する工程であって、ポリヌクレオチドは、単一の参照配列と比較して、変異体配列を有するコドンをコードする、工程と;(b)複数のポリヌクレオチドをポリヌクレオチドの5’断片とポリヌクレオチドの3’断片に分割する工程と;(c)あらかじめ定められた核酸参照配列中のあらかじめ選択された位置のコドンに対する分布値を選択する工程と;(d)選択された分布値に合う分布値を有する核酸のセットをランダムに生成する機械命令を提供する工程であって、核酸のセットは、飽和核酸ライブラリーを生成するために必要とされる核酸の量未満である、工程と;(e)ポリヌクレオチドの5’断片とポリヌクレオチドの3’断片を合成する工程と;(f)変異体核酸ライブラリーを形成するためにポリヌクレオチドの5’断片とポリヌクレオチドの3’断片を混合する工程であって、予測された多様性の少なくとも約70%が表される、工程を含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、少なくとも10000のポリヌクレオチドが合成される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体の少なくとも80%は適切なサイズである。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約90%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約95%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、複数のポリヌクレオチドは、1を超える5’断片と1を超える3’断片の少なくとも1つに分割される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、翻訳時の変異体核酸ライブラリーはタンパク質ライブラリーをコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーの核酸はベクターに挿入される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとして変異体核酸ライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。さらに、増強または低下した活性を有する変異体配列を同定する工程をさらに含む、変異体核酸ライブラリーを合成する方法が本明細書で提供される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、活性は細胞活性である。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、細胞活性は、繁殖、成長、接着、死亡、遊走、エネルギー産生、酸素利用、代謝活性、細胞シグナル伝達、遊離ラジカル損傷に対する反応、またはそれらの任意の組み合わせを含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、変異体遺伝子あるいはその断片のための配列をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、ここで、変異体核酸ライブラリーは、抗体、酵素、あるいはペプチドの少なくとも一部をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、抗体の可変領域あるいは定常領域の少なくとも一部をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、抗体の少なくとも1つのCDR領域をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、抗体の重鎖上のCDR1、CDR2、および、CDR3と、軽鎖上のCDR1、CDR2、および、CDR3をコードする。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリー中で合成された多くの様々な配列は、50~1,000,000の範囲である。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリー中の合成された多くの様々な配列は、500~25000の範囲である。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリー中の合成された多くの様々な配列は、1000~15000の範囲である。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとして変異体核酸ライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては、変異体配列を有するコドンを決定するために使用される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては生物中のコドン配列の頻度に基づく。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、上記生物は、動物、植物、真菌、原生生物、古細菌、および細菌の少なくとも1つである。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当てはコドン配列の多様性に基づく。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーはガイドRNA(gRNA)をコードする。
核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、上記方法は:(a)(i)第1の複数のポリヌクレオチドであって、第1の複数のポリヌクレオチドのそれぞれのポリヌクレオチドが、単一の参照配列と比較して、変異体配列をコードする、第1の複数のポリヌクレオチドと、(ii)第2の複数のポリヌクレオチドであって、第2の複数のポリヌクレオチドのそれぞれのポリヌクレオチドが、上記単一の参照配列と比較して、変異体配列をコードする、第2の複数のポリヌクレオチドと、をコードするあらかじめ定められた配列を提供する工程と;(b)表面を有する構造を提供する工程と;(c)第1の複数のポリヌクレオチドを合成する工程であって、第1の複数のポリヌクレオチドのそれぞれのポリヌクレオチドが表面から伸びている、工程と;(d)第2の複数のポリヌクレオチドを合成する工程であって、第2の複数のポリヌクレオチドのそれぞれのポリヌクレオチドが表面から伸びている、工程と;(e)第1の複数のポリヌクレオチドと第2の複数のポリヌクレオチドを表面から放出する工程と;(f)核酸のコンビナトリアルライブラリーを形成するために第1の複数のポリヌクレオチドと第2の複数のポリヌクレオチドを混合する工程であって、予測された多様性の少なくとも約70%が表される、工程を含む。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、予測された多様性の少なくとも約90%が表される。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、予測された多様性の少なくとも約95%が表される。
変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、(a)複数のポリヌクレオチドをコードするあらかじめ定められた配列を設計する工程であって、ポリヌクレオチドは、単一の参照配列と比較して、変異体配列を有する複数のコドンをコードする、工程と;(b)変異体核酸ライブラリーを生成するために複数のポリヌクレオチドを合成する工程であって、予測された多様性の少なくとも約70%が表される、工程と;(c)変異体核酸ライブラリーを発現させる工程と;(d)変異体核酸ライブラリーに関連する活性を評価する工程を含む。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約90%が表される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、予測された多様性の少なくとも約95%が表される。
核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、上記方法は:(a)(i)第1の複数の同一でないポリヌクレオチドであって、第1の複数の同一でないポリヌクレオチドのそれぞれの同一でないポリヌクレオチドが、単一の参照配列と比較して、変異体配列をコードする、第1の複数の同一でないポリヌクレオチドと、(ii)第2の複数の同一でないポリヌクレオチドであって、第2の複数の同一でないポリヌクレオチドのそれぞれの同一でないポリヌクレオチドが、上記単一の参照配列と比較して、変異体配列をコードする、第2の複数の同一でないポリヌクレオチドと、をコードするあらかじめ定められた配列を提供する工程と;(b)表面を有する構造を提供する工程と;(c)第1の複数の同一でないポリヌクレオチドを合成する工程であって、第1の複数の同一でないポリヌクレオチドのそれぞれの同一でないポリヌクレオチドが表面から伸びている、工程と;(d)第2の複数の同一でないポリヌクレオチドを合成する工程であって、第2の複数の同一でないポリヌクレオチドのそれぞれの同一でないポリヌクレオチドが表面から伸びている、工程と;(e)第1の複数の同一でないポリヌクレオチドと第2の複数の同一でないポリヌクレオチドを表面から放出する工程と;(f)核酸のコンビナトリアルライブラリーを形成するために第1の複数のポリヌクレオチドと第2の複数のポリヌクレオチドを混合する工程であって、予測された多様性の少なくとも約70%が表される、工程を含む。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、非飽和コンビナトリアルライブラリーである。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、飽和コンビナトリアルライブラリーである。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、少なくとも10,000のポリヌクレオチドが合成される。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、非飽和コンビナトリアルライブラリーの生成のためのポリヌクレオチドの合計数は、飽和コンビナトリアルライブラリーの生成のためのポリヌクレオチドの合計数の少なくとも25%未満である。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、変異体の少なくとも80%は適切なサイズである。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、変異体コンビナトリアルライブラリーは、第1の参照配列あるいは第2の参照配列をコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、翻訳時のコンビナトリアルライブラリーはタンパク質ライブラリーをコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーの核酸はベクターに挿入される。さらに、核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとしてコンビナトリアルライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、変異体遺伝子あるいはその断片のための配列をコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、抗体、酵素、あるいはペプチドの少なくとも一部をコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、抗体の可変領域あるいは定常領域の少なくとも一部をコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、ここで、コンビナトリアルライブラリーは抗体の少なくとも1つのCDR領域をコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、抗体の重鎖上のCDR1、CDR2、および、CDR3と、軽鎖上のCDR1、CDR2、および、CDR3をコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーはガイドRNA(gRNA)をコードする。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、コンビナトリアルライブラリーは、あらかじめ定められた配列と比較して、1000塩基中1未満の総エラー率を有する。核酸のコンビナトリアルライブラリーを生成するための方法が本明細書で提供され、上記構造は、固体の支持体、ゲル、あるいはビーズであり、固体の支持体はプレートまたはカラムである。
変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、(a)複数の同一でないポリヌクレオチドをコードするあらかじめ定められた配列を提供する工程であって、上記同一でないポリヌクレオチドは、単一の参照配列と比較して、変異体配列を有する複数のコドンをコードする、工程と;(b)あらかじめ定められた核酸参照配列中のあらかじめ選択された位置のコドンに対する分布値を選択する工程と;(c)核酸のセットをランダムに生成するために機械命令を提供する工程であって、核酸のセットは、飽和コドン変異体ライブラリーを生成するために必要とされる核酸の量未満である、工程と;(d)あらかじめ選択された分布の核酸ライブラリーを合成する工程であって、予測された多様性の少なくとも約70%が表される、工程を含む。変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体の少なくとも80%は適切なサイズである。変異体核酸ライブラリーを合成する方法が本明細書で提供され、翻訳時のコンビナトリアルライブラリーはタンパク質ライブラリーをコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コンビナトリアルライブラリーの核酸はベクターに挿入される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとしてコンビナトリアルライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては、変異体配列を有する複数のコドンの各コドンを決定するために使用される。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては生物中のコドン配列の頻度に基づく。変異体核酸ライブラリーを合成する方法が本明細書で提供され、上記生物は、動物、植物、真菌、原生生物、古細菌、および細菌の少なくとも1つである。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当てはコドン配列の多様性に基づく。
変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、(a)複数の同一でないポリヌクレオチドをコードするあらかじめ定められた配列を提供する工程であって、上記同一でないポリヌクレオチドは、単一の参照配列と比較して、変異体配列を有するコドンをコードする、工程と;(b)複数の同一でないポリヌクレオチドを、同一でないポリヌクレオチドの5’断片と同一でないポリヌクレオチドの3’断片に分割する工程と;(c)あらかじめ定められた核酸参照配列中のあらかじめ選択された位置のコドンに対する分布値を選択する工程と;(d)核酸のセットをランダムに生成するために機械命令を提供する工程であって、核酸のセットは、飽和核酸ライブラリーを生成するために必要とされる核酸の量未満である、工程と;(e)同一でないポリヌクレオチドの5’断片と同一でないポリヌクレオチドの3’断片を合成する工程と;(f)変異体核酸ライブラリーを形成するために同一でないポリヌクレオチドの5’断片と同一でないポリヌクレオチドの3’断片を混合する工程であって、予測された多様性の少なくとも約70%が表される、変異体核酸ライブラリーを合成する方法が本明細書で提供され、少なくとも10000の非同一のポリヌクレオチドが合成される。変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体の少なくとも80%は適切なサイズである。変異体核酸ライブラリーを合成する方法が本明細書で提供され、複数の非同一のポリヌクレオチドは、1を超える5’断片と1を超える3’断片の少なくとも1つに分割される。変異体核酸ライブラリーを合成する方法が本明細書で提供され、翻訳時のコンビナトリアルライブラリーはタンパク質ライブラリーをコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コンビナトリアルライブラリーの核酸はベクターに挿入される。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとしてコンビナトリアルライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。増強または低下した活性を有する変異体配列を同定する工程をさらに含む、変異体核酸ライブラリーを合成する方法が本明細書で提供される。変異体核酸ライブラリーを合成する方法が本明細書で提供され、活性は細胞活性である。変異体核酸ライブラリーを合成する方法が本明細書で提供され、細胞活性は、繁殖、成長、接着、死亡、遊走、エネルギー産生、酸素利用、代謝活性、細胞シグナル伝達、遊離ラジカル損傷に対する反応、またはそれらの任意の組み合わせを含む。変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、変異体遺伝子あるいはその断片のための配列をコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、抗体、酵素、あるいはペプチドの少なくとも一部をコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーはガイドRNA(gRNA)をコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、抗体の可変領域あるいは定常領域の少なくとも一部をコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、変異体核酸ライブラリーは、抗体の少なくとも1つのCDR領域をコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、核酸ライブラリーは、抗体の重鎖上のCDR1、CDR2、および、CDR3と、軽鎖上のCDR1、CDR2、および、CDR3をコードする。変異体核酸ライブラリーを合成する方法が本明細書で提供され、核酸ライブラリーは、複数の同一でないポリヌクレオチドのためのあらかじめ定められた配列と比較して、1000の塩基中1未満の総エラー率を有する。変異体核酸ライブラリーを合成する方法が本明細書で提供され、核酸ライブラリー中で合成された多くの様々な配列は、約50~約1,000,000の範囲である。変異体核酸ライブラリーを合成する方法が本明細書で提供され、核酸ライブラリー中の合成された多くの様々な配列は、約500~約25000の範囲である。変異体核酸ライブラリーを合成する方法が本明細書で提供され、核酸ライブラリー中の合成された多くの様々な配列は、約1000~約15000の範囲である。さらに、変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、PCR突然変異誘発反応のためのプライマーとしてコンビナトリアルライブラリーを使用して、核酸のPCR突然変異誘発を行う工程をさらに含む。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては、変異体配列を有するコドンを決定するために使用される。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当ては生物中のコドン配列の頻度に基づく。変異体核酸ライブラリーを合成する方法が本明細書で提供され、上記生物は、動物、植物、真菌、原生生物、古細菌、および細菌の少なくとも1つである。変異体核酸ライブラリーを合成する方法が本明細書で提供され、コドンの割り当てはコドン配列の多様性に基づく。
変異体核酸ライブラリーを合成する方法が本明細書で提供され、該方法は、(a)複数の同一でないポリヌクレオチドをコードするあらかじめ定められた配列を設計する工程であって、上記同一でないポリヌクレオチドは、単一の参照配列と比較して、変異体配列を有する複数のコドンをコードする、工程と;(b)変異体核酸ライブラリーを生成するために複数の同一でないポリヌクレオチドを合成する工程であって、予測された多様性の少なくとも約70%が表される、工程と;(c)変異体核酸ライブラリーを発現させる工程と;(d)変異体核酸ライブラリーに関連する活性を評価する工程を含む。引用による組み込み
本明細書で言及されるすべての公報、特許、および特許出願は、個々の公報、特許、または特許出願が引用によって組み込まれるように具体的且つ個別に示されるのと同じ程度まで、引用によって本明細書に組み込まれる。
非飽和コンビナトリアルライブラリーの生成の概略を描く。 飽和コンビナトリアルライブラリーの生成の概略を描く。 A-Dは、PCR変異原性工程を組み込む変異体生体分子の合成のためのプロセスワークフローを描く。 A-Dは、1つのあらかじめ定められたコドン部位の参照核酸配列とは異なる核酸配列を含む核酸の生成のプロセスワークフローを描く。 鋳型核酸からの核酸変異体のセットの生成の代替的なワークフローを描いており、各変異体は1つのコドン位置で異なる核酸配列を含んでいる。各々の変異体核酸はその単一のコドン位置で異なるアミノ酸をコードし、異なるコドンはX、Y、およびZによって表される。 鋳型核酸からの核酸変異体のセットの生成の代替的なワークフローを描いており、各変異体は1つのコドン位置で異なる核酸配列を含んでいる。各々の変異体核酸はその単一のコドン位置で異なるアミノ酸をコードし、異なるコドンはX、Y、およびZによって表される。 鋳型核酸からの核酸変異体のセットの生成の代替的なワークフローを描いており、各変異体は1つのコドン位置で異なる核酸配列を含んでいる。各々の変異体核酸はその単一のコドン位置で異なるアミノ酸をコードし、異なるコドンはX、Y、およびZによって表される。 鋳型核酸からの核酸変異体のセットの生成の代替的なワークフローを描いており、各変異体は1つのコドン位置で異なる核酸配列を含んでいる。各々の変異体核酸はその単一のコドン位置で異なるアミノ酸をコードし、異なるコドンはX、Y、およびZによって表される。 鋳型核酸からの核酸変異体のセットの生成の代替的なワークフローを描いており、各変異体は1つのコドン位置で異なる核酸配列を含んでいる。各々の変異体核酸はその単一のコドン位置で異なるアミノ酸をコードし、異なるコドンはX、Y、およびZによって表される。 鋳型核酸からの核酸変異体のセットの生成の代替的なワークフローを描いており、各変異体は1つのコドン位置で異なる核酸配列を含んでいる。各々の変異体核酸はその単一のコドン位置で異なるアミノ酸をコードし、異なるコドンはX、Y、およびZによって表される。 A-Eは、多くのアミノ酸を有する参照アミノ酸配列(A)を描いており、各々の残基は1つの円によって示され、および変異体アミノ酸配列(B、C、D、およびE)は本明細書に記載される方法を用いて生成される。参照アミノ酸配列と変異体配列は、本明細書に記載されたプロセスによって生成された核酸とその変異体によってコードされる。 A-Bは、参照アミノ酸配列(A、SEQ ID NO:24)と、変異体アミノ酸配列のライブラリー(B、出現する順でそれぞれSEQ ID NOS:25-31)を描いており、各々の変異体は(「X」によって示される)単一の残基変異体を含んでいる。参照アミノ酸配列と変異体配列は、本明細書に記載されたプロセスによって生成された核酸とその変異体によってコードされる。 A-Bは、参照アミノ酸配列(A)と、変異体アミノ酸配列のライブラリー(B)を描いており、各々の変異体は単一位置の変異体の2つの部位を含んでいる。変異体はそれぞれ異なる模様のある円によって示される。参照アミノ酸配列と変異体配列は、本明細書に記載されたプロセスによって生成された核酸とその変異体によってコードされる。 A-Bは、参照アミノ酸配列(A)と変異体アミノ酸配列のライブラリー(B)を描いており、各々の変異体は、アミノ酸の一続きを含んでおり(円のまわりのボックスによって示される)、それぞれの一続きは、参照アミノ酸配列とは配列が異なる(ヒスチジンをコードする)位置変異体の3つの部位を有する。参照アミノ酸配列と変異体配列は、本明細書に記載されたプロセスによって生成された核酸とその変異体によってコードされる。 A-Bは、参照アミノ酸配列(A)と変異体アミノ酸配列のライブラリー(B)を描いており、各々の変異体は、アミノ酸配列の2つの一続きを含んでおり(円のまわりのボックスによって示される)、それぞれの一続きは、参照アミノ酸配列とは配列が異なる(模様のある円によって例示される)単一位置の変異体の1つの部位を有する。参照アミノ酸配列と変異体配列は、本明細書に記載されたプロセスによって生成された核酸とその変異体によってコードされる。 A-Bは、参照アミノ酸配列(A)とアミノ酸配列変異体のライブラリー(B)を描いており、各々の変異体は(模様のある円によって示される)アミノ酸の一続きを含んでおり、それぞれの一続きは、参照アミノ酸配列とは配列が異なる複数の位置変異体の1つの部位を有する。この図では、5つの位置が異なり、第1の位置は50/50 K/R比を有し、第2の位置は50/25/25のV/L/S比を有し、第3の位置は50/25/25のY/R/D比を有し、第4の位置はすべてのアミノ酸で等しい比を有し、第5の位置はG/Pで75/25の比を有する。参照アミノ酸配列と変異体配列は、本明細書に記載されたプロセスによって生成された核酸とその変異体によってコードされる。 CDR1、CDR2、およびCDR3の領域を有する抗体をコードする鋳型核酸を描いており、それぞれのCDR領域は変異のための複数の部位を含み、それぞれの単一の部位(星形によって示されている)は、鋳型核酸配列とは異なる任意のコドン配列と交換可能な、単一位置、および/または、複数の連続した位置の一続きを含む。 予測された変異体分布と結果として生じた変異体多様性のプロットを描く。 発現カセットの変異体ライブラリーを生成するために2つの発現カセット(例えば、プロモーター、オープンリーディングフレーム、およびターミネーター)の相互交換部分によって生成された典型的な数の変異体を描く。 本明細書で開示されるような遺伝子合成のための典型的なプロセスワークフローを実証する工程の図を提示する。 コンピュータシステムの例を例証する。 コンピュータシステムの構造を例証するブロック図である。 複数のコンピュータシステム、複数の携帯電話および個人用携帯情報端末、ならびにネットワーク接続ストレージ(NAS)を組み込むように構成されたネットワークを実証する図である。 共有仮想アドレスメモリ空間を用いる、マルチプロセッサコンピュータシステムのブロック図である。 ゲル電気泳動によって分離したPCR反応生成物のBioAnalyzerプロットを描く。 96セットのPCR産物を示す電気泳動図を描いており、各セットのPCR産物は、1つのコドン位置の野生型の鋳型核酸とは配列が異なり、各セットの単一のコドン位置は野生型の鋳型核酸配列で異なる部位に位置している。各セットのPCR産物は19の変異体核酸を含み、各変異体は単一のコドン位置の異なるアミノ酸をコードする。 変異体の観察頻度と期待確率を比較するプロットを描いている。 確率ビンあたりの平均数のプロットを描く。 PCR産物の分析のプロットを描く。X軸は塩基対であり、Y軸は蛍光単位である。 観察されたコンビナトリアル変異体の分布のプロットを描く。 非飽和コンビナトリアルライブラリーの生成を例証する。 非飽和コンビナトリアルライブラリーの生成を例証する。 非飽和コンビナトリアルライブラリーの生成を例証する。 非飽和コンビナトリアルライブラリーの生成を例証する。 単一あるいは複数のCDR領域における変異体のスキーマを描く。 単一または複数の重鎖および軽鎖スキャフォールド中の変異体のスキーマを描く。 単一または複数のフレームワーク中の変異体のスキーマを描く。
本開示は、別段の定めのない限り、当該技術の範囲内である従来の分子生物学的技術を採用する。別段の定めのない限り、本明細書で使用される全ての技術用語および科学用語は、当業者により共通して理解されるもののと同じ意味を有する。
定義
本開示全体にわたって、数値的特徴は範囲形式で示される。範囲形式での記載は単に利便性と簡潔さのためのものに過ぎず、任意の実施形態の範囲に対する確固たる限定として解釈されてはならないということを理解されたい。これに応じて、範囲の記載は、文脈で別段の定めのない限り、すべての可能性のある下位範囲と、下限の単位の小数第2位までのその範囲内の個々の数値を具体的に開示していると考えられなければならない。例えば、1乃至6などの範囲の記載は、1乃至3、1乃至4、1乃至5、2乃至4、2乃至6、3乃至6などの下位範囲と、例えば、1.1、2、2.3、5、および5.9のその範囲内の個々の数値を具体的に開示していると考えられなければならない。これは、範囲の広さにかかわらず適用される。これらの介在する範囲の上限および下限は、より小さな範囲内に独立して含まれてもよく、また、定められた範囲内のあらゆる具体的に除外された限界に従って、本発明内に包含される。定められた範囲が上限および下限の1つまたはその両方を含む場合、これらの含まれた上限および下限のいずれかまたは両方を除く範囲も、文脈が明らかに他に指示しない限り、本発明内に包含される。
本明細書で使用される用語は、特定の実施形態のみを記載するためのものあり、任意の実施形態を限定することを意図してはいない。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が他に明白に示していない限り、同様に複数形を含むように意図される。用語「含む」および/または「含むこと」は、本明細書での使用時に、明示された特徴、整数、工程、操作、要素、および/または構成要素の存在を特定するが、1以上の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在または追加を妨げないことが、さらに理解される。本明細書で使用されるように、用語「および/または」は、関連する列挙された項目の1つ以上のあらゆる組み合わせを含む。
別段の定めのない限り、あるいは文脈から明らかでない限り、本明細書で使用されるように、数あるいは数の範囲に関連して用語「約」とは、明示された数とその数+/-10%、あるいはある範囲の列挙された値について列挙された下限の10%以下と列挙された10%以上を意味するものと理解されたい。
本明細書で使用されているように、用語「あらかじめ選択された配列(preselected sequence)」、「あらかじめ決められた配列(predefined sequence)」、または「あらかじめ定められた配列(predetermined sequence)」は、交換可能に使用される。用語は、ポリマー配列が知られており、ポリマーの合成または組立の前に選択されることを意味する。特に、本発明の様々な態様は、主に核酸分子の調製に関して本明細書に記載されており、オリゴヌクレオチドまたはポリヌクレオチドの配列は知られており、核酸分子の合成または組立の前に選択される。
合成(すなわち、デノボで合成されるか、化学的に合成される)のポリヌクレオチドの産生のための方法と組成物が本明細書で提供される。オリゴヌクレオチド、オリゴ、およびポリヌクレオチドとの用語は全体で同義であると定義される。本明細書に記載される合成されたポリヌクレオチドのライブラリーは、1つ以上の遺伝子または遺伝子断片をコードする複数のポリヌクレオチドをまとめて含むこともある。いくつかの例では、ポリヌクレオチドライブラリーはコード配列または非コード配列を含む。いくつかの例では、ポリヌクレオチドライブラリーは複数のcDNA配列をコードする。cDNA配列が基づく参照遺伝子配列はイントロンを含むこともあるが、cDNA配列はイントロンを除外する。本明細書に記載されるポリヌクレオチドは、生物の遺伝子または遺伝子断片をコードすることがある。例示的な生物は、限定されないが、前核生物(例えば細菌)および真核生物(例えばマウス、ウサギ、ヒト、および非ヒト霊長類)を含む。いくつかの例では、ポリヌクレオチドライブラリーは、1つ以上のポリヌクレオチドを含み、1つ以上のポリヌクレオチドの各々は複数のエクソンの配列をコードする。本明細書に記載されるライブラリー内の各ポリヌクレオチドは異なる配列(すなわち同一でない配列)をコードすることもある。いくつかの例では、本明細書に記載されるライブラリー内のそれぞれのポリヌクレオチドは、ライブラリー内の別のポリヌクレオチドの配列に相補的な少なくとも1つの部分を含む。本明細書に記載されるポリヌクレオチド配列は、別段の定めのない限り、DNAまたはRNAを含むことがある。
合成(すなわち、デノボで合成された)遺伝子の産生のための方法と組成物が本明細書で提供される。合成遺伝子を含むライブラリーは、PCA、非PCA遺伝子アセンブリ法、または階層的遺伝子アセンブリなどの、本明細書の他の場所で詳細に記載されるさまざまな方法によって構築され、2つ以上の2本鎖ポリヌクレオチドを組み合わせて(「ステッチング(stitching)、より大きなDNA単位(すなわち、シャーシ)を生成する。大きな構築物のライブラリーは、少なくとも1、1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500キロバイトの長さまたはそれ以上であるポリヌクレオチドを含むことがある。大きな構築物は、約5000、10000、20000、または50000の塩基対の独立して選択される上限によって結合可能である。ヌクレオチド配列をコードするポリペプチド-セグメントの任意の数の合成は、非リボソームペプチド(NRP)をコードする配列、非リボソームペプチド合成酵素(NRPS)モジュールおよび合成変異体をコードする配列、抗体など他のモジュールタンパク質のポリペプチドセグメント、他のタンパク質ファミリーからのポリペプチドセグメント、調節配列などの非コードのDNAまたはRNA(例えば、プロモーター、転写因子、エンハンサー、siRNA、shRNA、RNAi、miRNA、マイクロRNAに由来する核小体低分子RNA、あるいは対象の任意の機能的または構造的なDNAまたはRNAユニット)を含む。以下はポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片のコードまたは非コード領域、遺伝子間DNA、連鎖解析から定義された遺伝子座(複数の遺伝子座)、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA、リボソームRNA、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、核小体低分子RNA、リボザイム、メッセンジャーRNA(mRNA)の逆転写あるいは増幅によって通常得られるmRNAのDNA表現である、相補的DNA(cDNA);合成的にあるいは増幅により生成されるDNA分子、ゲノムDNA、組み換えポリヌクレオチド、分枝鎖ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、およびプライマー。本明細書で言及される遺伝子または遺伝子断片をコードするcDNAは、対応するゲノム配列で見られる介在イントロン配列のないエクソン配列をコードする少なくとも1つの領域を含むこともある。代替的に、cDNAに対応するゲノム配列は第1にイントロン配列を欠いていることがある。
変異体ライブラリー合成
本明細書に記載される方法は、少なくとも1つのあらかじめ定められた参照核酸配列のあらかじめ定められた変異体を各々コードする核酸のライブラリーの合成を提供する。場合によっては、あらかじめ定められた参照配列はタンパク質をコードする核酸配列であり、変異体ライブラリーは、合成された核酸によってコードされたその後のタンパク質中の単一の残基の複数の様々な変異体が標準的な翻訳プロセスによって生成されるように、少なくとも1つのコドンの変異をコードする配列を含む。核酸配列中の合成された特異的な変化は、ヌクレオチド変化を、重複または平滑端のポリヌクレオチドプライマーに組み入れることにより導入可能である。代替的に、ポリヌクレオチドの集団は、長い核酸(例えば、遺伝子)とその変異体をまとめてコードすることもある。この配置では、長い核酸(例えば、遺伝子)とその変異体を形成するために、ポリヌクレオチドの集団をハイブリダイズして標準的な分子生物学技術にかけることができる。長い核酸(例えば遺伝子)とその変異体が細胞中で発現される場合、変異体タンパク質ライブラリーが生成され得る。同様に、RNA配列(例えば、miRNA、shRNA、およびmRNA)あるいはDNA配列(例えば、エンハンサー、プロモーター、UTR、およびターミネーター領域)をコードする変異体ライブラリーの合成のための方法が本明細書で提供される。いくつかの例では、配列はエクソン配列あるいはコード配列である。いくつかの例では、配列はイントロン配列を含まない。さらに、本明細書に記載される方法を用いて合成されたライブラリーから選択された変異体の下流アプリケーション(downstream applications)が本明細書で提供される。下流アプリケーションは、例えば、生化学的な親和性、酵素活性、細胞活性の変化、および病状の処置または予防のための生物学的に関連する機能を増強させた、変異体核酸あるいはタンパク質配列の同定を含む。
コンビナトリアル核酸ライブラリー
高精度な変異体核酸ライブラリーを合成する効率的な系のための方法が本明細書に記載されている。さらに、コンビネーションベースの変異体ライブラリーを合成するための方法が本明細書で提供される。本明細書で提供された方法の有利な特徴は、コンビナトリアルライブラリー中の組み立てられた核酸の産物と頻度を正確に予測することができるということであり、生化学的活動または細胞活性に関連する増強と関係したコンビナトリアル産物と同様に、否定的な結果または無効な結果に関連するコンビナトリアル産物を正確に理解した上でのコンビナトリアルライブラリーのスクリーニングを可能とする。そのような系は、否定的な結果または無効な結果に関する情報を集める効率的な手段を許可しない現代的な方法(つまり、ファージディスプレー)よりも有利である。本明細書で提供された方法の別の有利な特徴は、代表的なコンビナトリアルライブラリーが設計され試験されるとき、完全飽和ライブラリーと比較して、必要とされる材料もコストも少ない一方で、第1世代のコンビナトリアルライブラリーの産物のスクリーニングから集められた情報に基づいた精巧な斑入り基準を備えた第2および第3の世代のライブラリーの迅速な生成も可能にする。
変異体核酸ライブラリーの効率的で正確な合成のための本明細書に記載されているような方法は、均一かつ多様なライブラリーをもたらすこともある。本明細書に記載される方法を用いて生成されたライブラリーはランダムではない。本明細書に記載される方法を用いて生成されたライブラリーは、所望の頻度で各意図した変異体の正確な導入をもたらす。本明細書に記載される方法を用いて生成されたライブラリーは、提示のドロップアウト率の低下と、各ライブラリー内のポリヌクレオチドあるいは長い核酸の種での均一性の改善とによって、高い精度を与える。加えて、ポリヌクレオチド合成レベルのこうした高い精度の利点により、コドンレベルでコードされたあらかじめ定められた分散を導入する翻訳産物からのタンパク質活性の評価などの下流アプリケーションの機能レベルでの高い精度が可能となる。いくつかの例では、正確なライブラリーの生成のための本明細書に記載されるような方法によって、その後のライブラリーの改善された設計が可能となる。こうしたその後のライブラリーは、第1のライブラリーからの否定的な結果または無効な結果に関して集められた情報の結果として設計段階でもっと焦点を当てられることもある。例えば、本明細書に記載された方法を用いて合成された第1の変異体核酸ライブラリーは、特定の活性についてスクリーニングされる機能性RNAあるいはタンパク質の変異体ライブラリーを生成するために使用されてもよい。正確に定義されたランダムではないライブラリーに関連する肯定的および否定的な結果の両方の観察に基づいて、設計選択はその後、指定された活性に関連した種をさらにスクリーニングして選択するためのさらなるスクリーニング工程に使用される第2の変異体ライブラリーのために行われる。このプロセスは1、2、3、4、5、6、7、8、9、10またはそれ以上の回数繰り返され得る。ライブラリーの設計、構築、スクリーニング、および、反復のための方法は、単一の活性あるいは複数の活性(例えば、結合親和性、安定性、および発現)に関連して増強された種を同定するために行うことが可能である。
インシリコでのライブラリーの生成を用いると、配列は既知のものであり、ランダムではないこともある。いくつかの例では、ライブラリーは少なくともあるいは約10、10、10、10、10、10、10、10、10、1010、あるいは1010を超える変異体を含む。いくつかの例では、少なくともあるいは約10、10、10、10、10、10、10、10、10、あるいは1010の変異体を含むライブラリーの各々の変異体に対する配列が知られている。いくつかの例では、ライブラリーは、変異体の予測された多様性を含む。いくつかの例では、ライブラリーで表された多様性は、予測された多様性の少なくともあるいは約60%、65%、70%、75%、80%、85%、90%、95%、あるいは95%よりも高い。いくつかの例では、ライブラリーで表された多様性は予測された多様性の少なくともあるいは約70%である。いくつかの例では、ライブラリーで表された多様性は予測された多様性の少なくともあるいは約80%である。いくつかの例では、ライブラリーで表された多様性は予測された多様性の少なくともあるいは約90%である。いくつかの例では、ライブラリーで表された多様性は予測された多様性の少なくともあるいは約99%である。本明細書に記載されたように、用語「予測された多様性」とは、あらゆる可能性のある変異体を含む集団中の理論的な多様性の合計を指す。
各変異体の配列が既知である本明細書に記載されるような非常に均一で多様なライブラリーの生成により、増強または低下した活性に関連するコンビナトリアル産物と、否定的な結果または無効な結果に関連するコンビナトリアル産物についての正確な理解が得られる。活性の増強または低下に関連する産物と、否定的な結果または無効な結果に関連するそうしたコンビナトリアル産物を知ることで、その後のアッセイでライブラリーを効率的に使用できることもある。例えば、大きなスクリーニングを実行する際に、活性の増強または低下をもたらす変異体配列が知られている。その後のスクリーニングを実施する際に、否定的な結果または無効な結果をもたらした配列は除外され、活性の増強または低下をもたらす変異体配列だけがスクリーニングされるようにする。
いくつかの例では、増強または低下した活性は、細胞活性に関連付けられる。細胞活性は、限定されないが、繁殖、成長、接着、死亡、遊走、エネルギー産生、酸素利用、代謝活性、細胞シグナル伝達、遊離ラジカル損傷に対する反応、またはそれらの任意の組み合わせを含む。
第1の例示的なプロセスでは、非飽和コンビナトリアルライブラリーが生成される。非飽和コンビナトリアルライブラリーの生成は、合成工程の数を減らすことができる。図1を参照すると、核酸(110)の第1の集団は、位置1、2、3、および4で多様性を示す。核酸(120)の第2の集団は位置5、6、7、および8で多様性を示す。核酸(110)の第1の集団は、核酸(120)の第2の集団と組み合わされることで、核酸断片の16の組み合わせがもたらされる。核酸(110)の第1の集団は平滑末端ライゲーションによって核酸(120)の第2の集団と組み合わされ得る。いくつかの例では、第1の集団と第2の集団は、制限酵素認識領域を含む相補的な重複配列を有するように設計され、各集団中の核酸の切断後に、第1の集団と第2の集団は互いにアニールすることができる。
場合によっては、核酸ライブラリーは2つ以上の核酸断片を用いて合成される。核酸ライブラリーは少なくとも2つの断片、少なくとも3つの断片、少なくとも4つの断片、少なくとも5つの断片、またはそれ以上を用いて合成可能である。核酸断片の各々の長さまたは合成される核酸の平均長さは、少なくともまたは少なくとも約10、15、20、25、30、35、40、45、50、100、150、200、300、400、500、2000のヌクレオチド、またはそれ以上であり得る。核酸断片の各々の長さまたは合成される核酸の平均長さは、最大で約、2000、500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10ヌクレオチド、あるいはそれ以下である。核酸断片の各々の長さまたは合成される核酸の平均長さは、10-2000、10-500、9-400、11-300、12-200、13-150、14-100、15-50、16-45、17-40、18-35、19-25の範囲である。
ライゲーションをなどの様々な混合プロセスと試薬は当該技術分野では知られており、本明細書で提供される方法を実行するのに役立ち得る。平滑末端ライゲーションは、核酸の第2の集団からの断片に、核酸の1つの集団からの断片を結合するために使用可能である。リガーゼとしては、限定されないが、大腸菌リガーゼ、T4リガーゼ、哺乳類のリガーゼ(例えば、DNAリガーゼI、DNAリガーゼII、DNAリガーゼIII、DNAリガーゼIV)、熱安定性リガーゼ、およびファストリガーゼ(fast ligase)を含むことができる。いくつかの例では、PCR伸長オーバーラップ方法は2つの断片をアニールして連結することで、より長い核酸を形成するために使用される。そのような構成では、第1の断片は第2の断片に相補的な領域を有しており、DNAポリメラーゼと増幅試薬、例えば、dNTP、緩衝液、およびATPの存在下で、各断片はアニーリングの位置から伸びる増幅反応のための別の断片のプライマーとして役立つ。いくつかの例では、核酸の1つの集団からの断片は、制限酵素認識領域の切断後のライゲーションによって核酸の第2の集団の断片に結合される。いくつかの例では、制限酵素はオーバーハングを生成、これはその後、リガーゼによって結合される。1つの核酸断片対別の核酸断片の1:1のモル比を使用することができる。場合によっては、モル比は少なくとも1:1、少なくとも1:2、少なくとも1:3、少なくとも1:4、またはそれ以上である。交互に、その比率は少なくとも2:1、少なくとも3:1、少なくとも4:1、またはそれ以上であり得る。ライゲートされた核酸断片の総モル質量、あるいは、核酸断片の各々のモル質量は、少なくともあるいは少なくとも約1、10、20、30、40、50、100、250、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、25000、50000、75000、100000ピコモルまたはそれ以上であってもよい。
場合によっては、本明細書に記載される方法によって生成された核酸断片は、ライゲーションの前に平滑末端化される。核酸はT4 DNAポリメラーゼあるいはクレノウ断片を使用して平滑末端化され得る。代替的に、平滑末端を直接生成する酵素(例えば、Sma、Dpn I、Pvu II、Eco RV I)が使用される。いくつかの例では、DNAエンドヌクレアーゼあるいはDNAエキソヌクレアーゼは平滑末端を生成するために使用される。
第2の例示的なワークフローでは、飽和コンビナトリアルライブラリーが生成される。図2を参照すると、核酸(210)の第1の集団は、位置1、2、3、および4で多様性を示す。核酸(220)の第2の集団は位置5、6、7、および8で多様性を示す。図2で見られるように、遺伝子断片の「左側」の核酸(210)の集団は4の多様性を有する。遺伝子断片の「右側」の核酸(220)の集団は4の多様性を有する。その後、長い遺伝子断片は、所望の遺伝子の「右側」半分の多様性を有する別の断片と組み合わされて、所望の遺伝子の「左側」半分の多様性を用いて合成され、合計して4の多様性をもたらすことができる。核酸断片の各々の長さまたは合成される核酸の平均長さは、少なくともまたは少なくとも約10、15、20、25、30、35、40、45、50、100、150、200、300、400、500、2000のヌクレオチド、またはそれ以上であり得る。核酸断片の各々の長さまたは合成される核酸の平均長さは、最大で約、2000、500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10ヌクレオチド、あるいはそれ以下である。核酸断片の各々の長さまたは合成される核酸の平均長さは、10-2000、10-500、9-400、11-300、12-200、13-150、14-100、15-50、16-45、17-40、18-35、19-25の範囲である。
結果として生じる核酸は証明可能である。場合によっては、核酸が配列決定によって証明される。いくつかの例では、核酸は次世代シーケンシングなどのハイスループットシーケンシングによって証明される。配列決定ライブラリーの配列決定は、単一分子のリアルタイム(SMRT)シーケンシング、ポロニーシーケンシング、ライゲーションシーケンシング、可逆的なターミネーターシーケンシング、陽子検出シーケンシング、イオン半導体シーケンシング、ナノポアシーケンシング、電子シーケンシング、パイロシーケンシング、マクサム-ギルバートシーケンシング、連鎖停止反応(例えば、サンガー)シーケンシング、+Sシーケンシング、あるいは合成によるシーケンシングを含む任意の適切なシーケンシング技術を用いて実施可能である。
分散の度合い(degree of variance)で非飽和的または飽和的である核酸ライブラリーの合成のための方法が本明細書で提供され、該方法は非常に正確である。いくつかの例では、核酸の約70%が挿入も欠失もない。いくつかの例では、核酸の少なくとも60%、65%、70%、75%、80%、85%、90%、95%、99%、あるいは99%以上は、挿入と欠失がない。いくつかの例では、核酸の約60%、65%、70%、75%、80%、85%、90%、95%、99%、あるいは99%以上は、挿入と欠失がない。いくつかの例では、核酸の約90%以上は挿入と欠失がない。いくつかの例において、核酸の少なくとも80%にはエラーがない。いくつかの例では、核酸の少なくとも約70%、75%、80%、85%、90%、95%、あるいは99%以上には、エラーがない。
分散の度合いで非飽和的または飽和的である核酸ライブラリーの合成のための方法が本明細書で提供され、該方法は非常に正確である。いくつかの例では、本明細書に記載されるデノボ合成された核酸ライブラリー中の核酸の80%以上は、増幅後のライブラリー全体の平均表現の少なくとも約1.5X内で表される。いくつかの例では、本明細書に記載されるデノボ合成された核酸ライブラリー中の核酸の80%以上は、増幅後のライブラリー全体の平均表現の少なくとも約1.5X、2X、3X、3.5X、または4X内で表される。いくつかの例では、本明細書に記載されるデノボ合成された核酸ライブラリー中の核酸の90%以上は、増幅後のライブラリー全体の平均表現の少なくとも約1.5X内で表される。いくつかの例では、本明細書に記載されるデノボ合成された核酸ライブラリー中の核酸の90%以上は、増幅後のライブラリー全体の平均表現の少なくとも約1.5X、2X、3X、3.5X、または4X内で表される。いくつかの例では、本明細書に記載されるデノボ合成された核酸ライブラリー中の核酸の80%以上は、増幅後のライブラリー全体の平均表現の少なくとも約2X内で表される。いくつかの例では、本明細書に記載されるデノボ合成された核酸ライブラリー中の核酸の80%以上は、増幅後のライブラリー全体の平均表現の少なくとも約2X内で表される。
代表的な核酸ライブラリーの生成
変異体コドンコード領域のあらかじめ選択された分布を有する核酸ライブラリーを合成するための方法が本明細書に記載されている。さらに、こうしたライブラリーは、あらかじめ選択された分布に対して非飽和であるが、代表的な分布に対する洞察力をもたらすこともある。さらに、いったん翻訳されると、特定の位置でアミノ酸のあらかじめ選択された分布をもたらす、核酸の生成に関する方法も本明細書で提供される。あらかじめ選択された分布のランダムなサンプルを生成することによって、飽和未満の核酸ライブラリーは、あらかじめ選択された集団分布に近い代表的な分布を有するように設計されている。あらかじめ選択された集団分布に近い代表的な分布を備えた本明細書に記載されるような核酸ライブラリーはさらに、所望のあらかじめ選択された分布の各々の意図された変異体の正確な導入を含むこともある。
本明細書に記載される計算手法は、限定されないが、ランダムサンプリングを含む。第1のプロセスでは、各位置でのコドン分散のあらかじめ選択された分布について、各位置に対する累積分布値が計算される。いくつかの例では、累積分布値は約0.0~1.0の確率にマッピングされる。核酸の集団については、累積分布値は、特定の位置のコドン変異体の可能性の決定をもたらす。例えば、コドン変異体が核酸の集団で現われる各位置での回数は合計され、アミノ酸が各位置で現われる割合がその後決定され得る。その後、核酸のサンプル集団中の割合はあらかじめ選択された分布と比較される。ある集団中の核酸の数が十分な場合、あらかじめ選択された分布値に合うサンプルの分布が生成される。いくつかの例では、実施されたサンプリングは均一のランダムサンプリングを適用して、モンテカルロサンプリングの形態である。
いくつかの例では、あらかじめ選択された分布を有するように設計および合成された核酸ライブラリーは、飽和核酸ライブラリーと比較して、同一でない核酸の約1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、あるいは60%以上をコードする。いくつかの例では、あらかじめ選択された分布を有するように設計および合成された核酸ライブラリーは、飽和核酸ライブラリーと比較して、同一でない核酸の少なくとも1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、あるいは60%以上をコードする。
いくつかの例では、あらかじめ選択された分布を有するように設計および合成された核酸ライブラリーは、大きな核酸ライブラリーと比較して、同一でない核酸の約1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、あるいは60%以上をコードする。いくつかの例では、あらかじめ選択された分布を有するように設計および合成された核酸ライブラリーは、大きな核酸ライブラリーと比較して、同一でない核酸の少なくとも1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、あるいは60%以上をコードする。
いくつかの例では、より大きな変異体核酸ライブラリーからの代表的な下位集団中の設計および合成された核酸の数は、約50-100000、100-75000、250-50000、500-25000、および、1000-15000、2000-10000、ならびに、4000-8000の配列の範囲である。いくつかの例では、核酸の集団は500の配列である。いくつかの例では、核酸の集団は5000、10000、あるいは15000の配列である。いくつかの例では、核酸の集団は少なくとも50、100、150、500、1000、2000、5000、10000、20000、50000、100000、200000、400000、800000、1000000、あるいはそれ以上の異なる配列を有する。いくつかの例では、核酸の各集団は最大で50、100、500、1000、2000、5000、10000、20000、50000、100000、200000、400000、800000、あるいは1000000である。
いくつかの例では、変異体コドンコード領域のあらかじめ選択された分布に到達するためのコンビナトリアル方法による核酸ライブラリーの合成は、予測された多様性の70%から99%を表す。いくつかの例では、変異体コドンコード領域のあらかじめ選択された分布に到達するためのコンビナトリアル方法による核酸ライブラリーの合成は、予測された多様性の少なくとも70%を表す。いくつかの例では、変異体コドンコード領域のあらかじめ選択された分布に到達するためのコンビナトリアル方法による核酸ライブラリーの合成は、予測された多様性の70%から75%、70%から80%、70%から85%、70%から90%、70%から95%、70%から97%、70%から99%、75%から80%、75%から85%、75%から90%、75%から95%、75%から97%、75%から99%、80%から85%、80%から90%、80%から95%、80%から97%、80%から99%、85%から90%、85%から95%、85%から97%、85%から99%、90%から95%、90%から97%、90%から99%、95%から97%、95%から99%、あるいは97%から99%を表す。いくつかの例では、核酸の合成された代表的な集団の表された多様性は、予測された多様性の少なくともあるいは約60%、65%、70%、75%、80%、85%、90%、95%、あるいは95%以上である。いくつかの例では、核酸の合成された代表的な集団の表された多様性は、予測された多様性の99%である。
コンビナトリアル方法を使用する代表的な核酸ライブラリーの生成
変異体コドンコード領域のあらかじめ選択された分布に到達するコンビナトリアル方法による核酸ライブラリーの合成のための方法が本明細書で提供される。いくつかの例では、核酸の集団を合成するための変異体の鋳型として役立つ参照配列は分割され、第1の部分が核酸の第1の変異体集団のための参照配列となり、および、第2の部分が核酸の第2の変異体集団のための参照配列となる。
いくつかの例では、本明細書に記載されるようなランダムサンプリング方法は、より大きな変異体ライブラリーからの部分の代表的な変異体分布を生成するために使用される。完全な参照配列の第1の部分のための変異体を表す核酸の第1の代表的な集団と、完全な参照配列の第2の部分のための変異体を表す核酸の第2の代表的な集団が合成され、その後、平滑末端ライゲーションなどのライゲーションによって、あるいは、当該技術分野で知られている生化学技術によって組み合わされる。場合によっては、結果として生じる核酸ライブラリーが飽和である。場合によっては、結果として生じる核酸ライブラリーが非飽和である。
場合によっては、核酸ライブラリーは2つ以上の変異体核酸集団を用いて合成され、結合すると、所望のより長い核酸変異体ライブラリーをもたらす。核酸ライブラリーは、各々が参照核酸の異なる領域をコードする、少なくとも2、3、4、5、6、7、8、9、10、あるいは10を超える集団を用いて合成可能である。いくつかの例では、各核酸集団は、約50-100000、100-75000、250-50000、500-25000、および、1000-15000、2000-10000、ならびに、4000-8000の配列の範囲である。いくつかの例では、各核酸集団は、約500、1000、5000、10000、あるいは15000以上の配列である。いくつかの例では、各核酸集団は少なくとも50、100、150、500、1000、2000、5000、10000、20000、50000、100000、200000、400000、800000、1000000、あるいはそれ以上である。いくつかの例では、各核酸集団は最大で50、100、500、1000、2000、5000、10000、20000、50000、100000、200000、400000、800000、および、1000000である。
いくつかの例では、変異体コドンコード領域のあらかじめ選択された分布に到達するためのコンビナトリアル方法による核酸ライブラリーの合成は、予測された多様性の70%から99%を表す。いくつかの例では、変異体コドンコード領域のあらかじめ選択された分布に到達するためのコンビナトリアル方法による核酸ライブラリーの合成は、予測された多様性の少なくとも70%を表す。いくつかの例では、変異体コドンコード領域のあらかじめ選択された分布に到達するためのコンビナトリアル方法による核酸ライブラリーの合成は、予測された多様性の70%から75%、70%から80%、70%から85%、70%から90%、70%から95%、70%から97%、70%から99%、75%から80%、75%から85%、75%から90%、75%から95%、75%から97%、75%から99%、80%から85%、80%から90%、80%から95%、80%から97%、80%から99%、85%から90%、85%から95%、85%から97%、85%から99%、90%から95%、90%から97%、90%から99%、95%から97%、95%から99%、あるいは97%から99%を表す。いくつかの例では、変異体コドンコード領域のあらかじめ選択された分布に到達するためのコンビナトリアル方法による核酸ライブラリーの合成は、予測された多様性の少なくともあるいは約60%、65%、70%、75%、80%、85%、90%、95%、あるいは95%以上である。いくつかの例では、核酸の合成された代表的な集団の表された多様性は、予測された多様性の99%である。
合成とその後のPCR突然変異誘発
本明細書に記載されるコンビナトリアル方法によって生成された核酸ライブラリー(例えば、飽和または非飽和)は、PCR突然変異誘発方法に使用され得る。場合によっては、あらかじめ選択された分布を有する代表的な核酸ライブラリーは、PCR突然変異誘発方法に使用される。このワークフローでは、複数のポリヌクレオチドが合成され、各ポリヌクレオチドは、参照ポリヌクレオチド配列のあらかじめ定められた変異体であるあらかじめ定められた配列をコードする。図3A-図3Dで描かれた典型的なワークフローである図を参照すると、ポリヌクレオチドは表面上で生成される。図3Aは、121の遺伝子座を有する表面の単一のクラスターの拡大図を描く。図3Bで描かれるそれぞれの核酸は、変異体の長い核酸のライブラリー(図3C)を生成するために参照核酸配列からの増幅に使用することができるプライマーである。変異体の長い核酸のライブラリーは、変異体RNAあるいはタンパク質ライブラリー(図3D)を生成するために、その後、随意に転写および/または翻訳に晒される。この典型的な図では、ポリヌクレオチドのデノボ合成に使用される、実質的に平面の表面を有する装置が描かれている(図3A)。いくつかの例では、装置は、遺伝子座のクラスターを含み、それぞれの遺伝子座はポリヌクレオチド伸長のための部位である。いくつかの例では、単一のクラスターは、所望の変異体配列ライブラリーを生成するために必要とされるポリヌクレオチド変異体をすべて含む。代替的な配置では、プレートは、クラスターへ分離されない遺伝子座の領域を含む。
(例えば、図3で見られるような)クラスター内のポリヌクレオチドの合成と、その後の単一のクラスター内のポリヌクレオチドの増幅のための方法が本明細書で提供される。こうした構成は、クラスター化された構成のないプレート全体での同一でないポリヌクレオチドの増幅と比較して、核酸の提示の改善をもたらす。いくつかの例では、クラスター内での遺伝子座の表面で合成されたポリヌクレオチドの増幅は、重いGC含有量を備えたポリヌクレオチドを有する大きなポリヌクレオチド集団の反復的な合成によって提示に対する負の効果を克服する。いくつかの例では、本明細書に記載されるクラスターは、約50-1000、75-900、100-800、125-700、150-600、200-500、50-500、または300-400の別々の遺伝子座を含む。いくつかの例では、遺伝子座は、スポット、ウェル、マイクロウェル、チャネル、あるいはポストである。いくつかの例では、各クラスターは、同一の配列を有するポリヌクレオチドの伸長部を支持する別の特徴の少なくとも1X、2X、3X、4X、5X、6X、7X、8X、9X、10X、またはそれ以上の余剰を有する。いくつかの例では、1Xの余剰は同一の配列を用いるポリヌクレオチドを持たないことを意味する。
本明細書に記載されるデノボ合成されたポリヌクレオチドライブラリーは複数のポリヌクレオチドを含んでもよく、各々は第1の位置、位置「X」に少なくとも1つの変異体配列を有し、各変異体ポリヌクレオチドは第1の伸長産物を生成するためにPCRの第一ラウンドでプライマーとして使用される。この例において、第1のポリヌクレオチド(420)中の位置「x」は、変異体コドン配列、つまり、参照配列からの19の可能性のある変異体の1つをコードする。図4のAを参照する。第1のポリヌクレオチドの配列に重複する配列を含む第2のポリヌクレオチド(425)は、第2の伸長産物を生成するためにPCRの別のラウンドでプライマーとして使用される。さらに、外部のプライマー(415)、(430)は、長い核酸配列からの断片の増幅に使用されてもよい。結果として生じた増幅産物は長い核酸配列(435)、(440)の断片である。図4のBを参照する。その後、長い核酸配列(435)、(440)の断片はハイブリダイズされ、長い核酸(445)の変異体を形成するために伸長反応に晒される。図4のCを参照する。第1と第2の伸長産物の重複する末端は、PCRの第2のラウンドのプライマーとして役立つこともあり、それによって、変異体を含む第3の伸長産物(図4D)を生成する。収率を増加させるために、長い核酸の変異体は、DNAポリメラーゼ、増幅試薬、外部のプライマー(415)、(430)を含む反応で増幅される。いくつかの例では、第2のポリヌクレオチドは、限定されないが、変異体部位に隣接する配列を含む。代替的な配置では、第2のポリヌクレオチドと重複する領域を有する第1のポリヌクレオチドが生成される。このシナリオでは、第1の核酸は最大で19の変異体について単一のコドンでの変異を伴って合成される。第2の核酸は変異体配列を含まない。随意に、第1の集団は第1のポリヌクレオチド変異体と、異なるコドン部位の変異体をコードする追加のポリヌクレオチドとを含む。代替的に、第1のポリヌクレオチドと第2のポリヌクレオチドは平滑末端ライゲーションのために設計されてもよい。
代替的な突然変異誘発では、PCR方法が図5A-図5Fで描かれる。こうしたプロセスでは、第1と第2の鎖(505)、(510)を含む鋳型核酸分子(500)は、第1のプライマー(515)と第2のプライマー(520)(図5A)を含むPCR反応で増幅される。増幅反応はヌクレオチド試薬としてウラシルを含む。ウラシルで標識された伸長産物(525)(図5B)が生成され、随意に精製され、および、第1の伸長産物(540と545)(図5C-図5D)を生成するために第1のポリヌクレオチド(535)と複数の第2のポリヌクレオチド(530)とを使用するその後のPCR反応のための鋳型として役立つ。このプロセスでは、複数のポリヌクレオチド(530)は、変異体配列(図5Cでは、X、Y、およびZとして描かれる)をコードするポリヌクレオチドを含む。ウラシルで標識された鋳型核酸は、ウラシルに特異的な切除試薬(例えば、New England Biolabsから市販されているUSER digest)により消化される。変異体(535)と、変異体X、Y、およびZを備える様々なコドン(530)が加えられ、図5Dを生成するために限定的なPCR工程が行われる。ウラシルを含有する鋳型が消化された後、伸長産物の重複する末端はPCR反応を刺激する役目を果たし、第1の伸長産物(540と545)は第1の外部のプライマー(550)と第2の外部のプライマー(555)と組み合わされてプライマーとして作用し、それによって、図5Fの変異体部位で複数の変異体X、Y、およびZを含む核酸分子(560)のライブラリーを生成する。
長い核酸の変異体と非変異体の部分を備えた集団のデノボ合成
本明細書に記載されるコンビナトリアル方法によって生成された核酸ライブラリー(例えば、飽和または非飽和)は、長い核酸の複数の断片のデノボ合成に使用可能であり、断片の少なくとも1つは、複数のバージョンで合成され、各バージョンは異なる変異体配列である。場合によっては、あらかじめ選択された分布を有する代表的な核酸ライブラリーは、デノボ合成に使用され、断片の少なくとも1つは、複数のバージョンで合成され、各バージョンは異なる変異体配列である。この配置では、変異体長距離核酸のライブラリーを組み立てるために必要とされる断片のすべてが、デノボ合成される。合成された断片は、合成後、断片ライブラリーがハイブリダイゼーションに晒されるように、重複する配列を有することもある。ハイブリダイゼーション後に、伸長反応はいかなる相補的なギャップも埋めるために行われることがある。
代替的に、合成された断片はプライマーで増幅され、その後、平滑末端ライゲーションあるいは重複ハイブリダイゼーションのいずれかに晒されることもある。いくつかの例では、装置は、遺伝子座のクラスターを含み、それぞれの遺伝子座はポリヌクレオチド伸長のための部位である。いくつかの例では、単一のクラスターは、所望の変異体核酸配列ライブラリーを生成するために、あらかじめ決められた長い核酸のすべてのポリヌクレオチド変異体と他の断片配列を含む。クラスターは約50~500の座を含むことがある。いくつかの配置では、クラスターは、500を超える遺伝子座を含む。
第1のポリヌクレオチド集団中のそれぞれの個々のポリヌクレオチドは、クラスターの別々の個々にアドレス可能な遺伝子座上で生成されることがある。1つのポリヌクレオチド変異体は複数の個々にアドレス可能な遺伝子座によって表されることがある。第1のポリヌクレオチド集団中のそれぞれの変異体は、1、2、3、4、5、6、7、8、9、10、あるいはそれ以上の回数、表されることもある。いくつかの例では、第1のポリヌクレオチド集団中のそれぞれの変異体は3つ以下の遺伝子座で表される。いくつかの例では、第1のポリヌクレオチド集団中のそれぞれの変異体は2つの遺伝子座で表される。いくつかの例では、第1のポリヌクレオチド集団中のそれぞれの変異体は1つの遺伝子座でのみ表される。
余剰を減少させた核酸ライブラリーを生成するための方法が本明細書で提供される。いくつかの例では、変異体核酸は、所望の変異体核酸を得るために、1回を超える回数、変異体核酸を合成する必要なく、生成されることがある。いくつかの例では、本開示は、所望の変異体核酸を生成するために、1、2、3、4、5回を超える回数、6、7、8、9、10、またはそれ以上の回数、変異体核酸を合成する必要なく、変異体核酸を生成する方法を提供する。
変異体核酸は、所望の変異体核酸を得るために、1を超える別々の部位で変異体核酸を合成する必要なく、生成されることがある。本開示は、所望の変異体核酸を生成するために、1つの部位、2つの部位、3つの部位、4つの部位、5つの部位、6つの部位、7つの部位、8つの部位、9つの部位、あるいは10の部位を超える部位で変異体核酸を合成する必要なく、変異体核酸を生成する方法を提供する。いくつかの例では、核酸は、せいぜい6、5、4、3、2、あるいは1つの別々の部位で合成される。同じ核酸は、表面上の1、2、あるいは3つの別々の遺伝子座で合成されることがある。
いくつかの例では、単一の変異体核酸を表す遺伝子座の量は、下流の処理(例えば、増幅反応または細胞アッセイ)に必要な核酸材料の量に応じる。いくつかの例では、単一の変異体核酸を表す遺伝子座の量は、単一のクラスター中の利用可能な遺伝子座に応じる。
参照核酸中の複数の部位で異なる変異体核酸を含む核酸のライブラリーの生成のための方法が本明細書で提供される。そのような場合、それぞれの変異体ライブラリーは遺伝子座のクラスター内の個々にアドレス可能な遺伝子座で生成される。核酸ライブラリーによって表される変異体部位の数は、クラスター中の個々にアドレス可能な遺伝子座の数と各部位における所望の変異体の数とによって決定されることが理解されよう。いくつかの例では、それぞれのクラスターは約50~500の遺伝子座を含む。いくつかの例では、それぞれのクラスターは100~150の遺伝子座を含む。
典型的な配置では、19の変異体は、19の可能性のある変異体アミノ酸の各々をコードするコドンに対応する変異体部位で表される。別の典型的な場合では、61の変異体は、19の可能性のある変異体アミノ酸の各々をコードするトリプレットに対応する変異体部位で表される。非限定的な例において、クラスターは121の個々にアドレス可能な遺伝子座を含む。この例において、核酸集団は、6つの複製物(単一部位変異体の各々(6の複製物x1の変異体部位x19の変異体=114の遺伝子座))、3つの複製物(二重部位変異体の各々(3の複製物x2の変異体部位x19の変異体=114の遺伝子座)、または2つの複製物(三重部位変異体の各々(2の複製物x3の変異体部位x19の変異体=114の遺伝子座)を含む。いくつかの例では、核酸集団は、4、5、6、あるいは6を超える変異体部位で変異体を含む。
合成の(すなわち、デノボで合成されるか、化学的に合成される)核酸の産生のための方法と組成物が本明細書で提供される。本明細書に記載される合成された核酸のライブラリーは、1つ以上の遺伝子または遺伝子断片をコードする複数の核酸をまとめて含むこともある。いくつかの例では、核酸ライブラリーはコード配列または非コード配列を含む。いくつかの例では、核酸ライブラリーは複数のcDNA配列をコードする。いくつかの例では、核酸ライブラリーは、1つ以上の核酸を含み、1つ以上の核酸の各々は複数のエクソンの配列をコードする。本明細書に記載されるライブラリー内の各核酸は異なる配列(すなわち、同一ではない配列)をコードすることもある。いくつかの例では、本明細書に記載されるライブラリー内のそれぞれの核酸は、ライブラリー内の別の核酸の配列に相補的な少なくとも1つの部分を含む。本明細書に記載される核酸配列は、別段の定めのない限り、DNAまたはRNAを含むことがある。
合成(すなわち、デノボで合成された)遺伝子の産生のための方法と組成物が本明細書で提供される。合成遺伝子を含むライブラリーは、PCA、非PCA遺伝子アセンブリ法、または階層的遺伝子アセンブリなどの本明細書の他の場所で詳細に記載される様々な方法によって構築され、2つ以上の2本鎖核酸を組み合わせて(「ステッチング(stitching)、より大きなDNA単位(すなわち、シャーシ)を生成する。より大きな構築物のライブラリーは、少なくとも1、1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500kb長さまたはそれ以上である核酸を含むことがある。大きな構築物は、約5000、10000、20000、または50000の塩基対の独立して選択される上限によって結合されることもある。ヌクレオチド配列をコードするポリペプチド-セグメントの任意の数の合成は、非リボソームペプチド(NRP)をコードする配列、非リボソームペプチド合成酵素(NRPS)モジュールおよび合成変異体をコードする配列、抗体など他のモジュールタンパク質のポリペプチドセグメント、他のタンパク質ファミリーからのポリペプチドセグメント、調節配列などの非コードのDNAまたはRNA(例えば、プロモーター、転写因子、エンハンサー、siRNA、shRNA、RNAi、miRNA、マイクロRNAに由来する核小体低分子RNA、あるいは対象の任意の機能的または構造的なDNAまたはRNAユニット)を含み得る。以下は核酸の非限定的な例である:遺伝子または遺伝子断片のコードまたは非コード領域、遺伝子間DNA、連鎖解析から定義された遺伝子座(複数の遺伝子座)、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA、リボソームRNA、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、核小体低分子RNA、リボザイム、メッセンジャーRNA(mRNA)の逆転写あるいは増幅によって通常得られるmRNAのDNA表現である、cDNA;合成的にあるいは増幅により生成されるDNA分子、ゲノムDNA、組み換えポリヌクレオチド、分枝鎖ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、およびプライマー。cDNAの文脈において、遺伝子または遺伝子断片との用語は、介在するイントロン配列のないエクソン配列をコードする少なくとも1つの領域を含むDNA核酸配列を指す。
様々な実施形態において、本明細書に記載される方法および組成物は、遺伝子のライブラリーに関する。遺伝子ライブラリーは、複数のサブセグメントを含み得る。1つ以上のサブセグメントでは、ライブラリーの遺伝子はともに共有結合され得る。1つ以上のサブセグメントでは、ライブラリーの遺伝子は、1つ以上の代謝最終産物で第1の代謝経路の構成要素をコードする。1つ以上のサブセグメントでは、ライブラリーの遺伝子は、1つ以上の標的代謝性最終産物の製造プロセスに基づいて選択され得る。1つ以上の代謝最終産物はバイオ燃料を含むこともある。1つ以上のサブセグメントでは、ライブラリーの遺伝子は、2つ以上の代謝最終産物で第2の代謝経路の構成要素をコードする。第1と第2の代謝経路の1つ以上の最終産物は、1つ以上の共有される最終産物を含み得る。場合によっては、第1の代謝経路は第2の代謝経路内で操作される最終産物を含む。
生物の変異体核酸ライブラリー
本明細書に記載される方法によって生成された変異体核酸ライブラリーは、生物の少なくとも1つの遺伝子をコードすることがある。場合によっては、核酸ライブラリーは生物の単一の遺伝子、経路、あるいは全ゲノムをコードする。いくつかの例では、変異体核酸ライブラリーは、生物の遺伝子(例えば、1000の塩基対)、一部(例えば、3-10の遺伝子)、経路(例えば、10-100の遺伝子)、あるいはシャシー(例えば、100-1000の遺伝子)の少なくとも1つをコードする。モデル生物の限定しない例示的なリストが表1で提供される。
コドンのバリエーション
本明細書に記載される変異体核酸ライブラリーは複数の核酸を含んでもよく、それぞれの核酸は、参照核酸配列と比較して、変異体コドン配列をコードする。いくつかの例では、第1の核酸集団のそれぞれの核酸は単一の変異体部位に変異体を含む。いくつかの例では、第1の核酸集団は、同じ変異体部位に1つを超える変異体を含むように、単一の変異体部位に複数の変異体を含む。第1の核酸集団は、同じ変異体部位に複数のコドン変異体を集団的にコードする核酸を含むことがある。第1の核酸集団は、同じ位置に最大で19以上のコドンを集団的にコードする核酸を含むことがある。第1の核酸集団は、同じ位置に最大で60の変異体トリプレットを集団的にコードする核酸を含むことがあり、あるいは、第1の核酸集団は、同じ位置で最大で61のコドンの異なるトリプレットを集団的にコードする核酸を含むことがある。それぞれの変異体は翻訳中に異なるアミノ酸をもたらすコドンをコードすることがある。表2は、異なる部位について可能性のあるそれぞれのコドン(と代表的なアミノ酸)のリストを提供する。
参照核酸配列と比較して、変異体コドン配列をコードする核酸を含む変異体核酸ライブラリーが本明細書で提供され、変異体コドン配列はコドンの割り当てに基づいて選択される。例示的なコドンの割り当てが表3で見られ、ここでは、変異体コドン配列は最初に左から右に選択される。いくつかの例では、コドンの割り当ては生物中のコドンの頻度に基づく。例示的な生物としては、限定されないが、動物、植物、真菌、原生生物、古細菌、あるいは細菌が挙げられる。例えば、コドンの割り当ては大腸菌またはヒトに基づく。
参照核酸配列と比較して、変異体コドン配列をコードする核酸を含む変異体核酸ライブラリーが本明細書で提供され、ここで、コドンの割り当てに基づいた変異体コドン配列は、様々な因子により決定される。いくつかの例では、変異体コドン配列はコドン配列の複雑さあるいは多様性に基づいて選択される。例えば、3つの異なる核酸塩基を含むコドン配列は、2つの異なる核酸塩基を含むコドン配列あるいは同じ核酸塩基を含むコドン配列の代わりに選択される。いくつかの例では、コドン配列は下流アプリケーションに基づいて選択される。下流アプリケーションは、限定されないが、タンパク質翻訳後に発現レベルに対する効果を最小限に抑えること、あるいは、次世代シーケンシングによって変異体コドン配列の検出を改善することを含む。次世代シーケンシングによって変異体コドン配列の検出を改善することは、高いエラー率のホモポリマーを回避することを含むことがある。いくつかの例では、制限酵素部位などの配列の破壊を引き起こす部位を生じさせない限り、コドン配列が選択される。
本明細書に記載されるようなコドンの割り当てに基づく変異体部位のためのコドン配列は無作為化されることがある。いくつかの例では、コドン配列は無作為化されない。例えば、1つの突然変異が1つのペプチド当たり選択される単一の変異体ライブラリーについては、コドン配列は無作為化されない。いくつかの例では、複数の変異体ライブラリーは、無作為化されるコドン配列を含む。
核酸集団は、複数の位置で最大で20のコドン変異をまとめてコードする様々な核酸を含むことがある。このような場合、集団中のそれぞれの核酸は、同じ核酸中の1つを超える位置でコドンの変異を含む。いくつかの例では、集団中の核酸はそれぞれ、単一の核酸中の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれ以上のコドンにおいてコドンの変異を含む。いくつかの例では、それぞれの変異体の長い核酸は、単一の長い核酸中の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれ以上のコドンにおいてコドンの変異を含む。いくつかの例では、変異体核酸集団は、単一の核酸中の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれ以上のコドンにおいてコドンの変異を含む。いくつかの例では、変異体核酸集団は、単一の長い核酸中の少なくとも約10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、またはそれ以上のコドンにおいてコドンの変異を含む。
本明細書では、第2の核酸集団が複数の個々にアドレス可能な遺伝子座を含む第2のクラスター上で生成されるプロセスが提供される。第2の核酸集団は、各コドン位置について一定である(つまり、各位置で同じアミノ酸をコードする)、複数の第2の核酸を含むことがある。第2の核酸は第1の核酸の少なくとも一部と重複することがある。いくつかの例では、第2の核酸は、第1の核酸上で表される変異体部位を含まない。代替的に、第2の核酸集団は、1つ以上のコドン位置について少なくとも1つの変異体を含む複数の第2の核酸を含むことがある。
複数のコドン位置に変異体を含む核酸の単一の集団が生成される核酸のライブラリーを合成するための方法が本明細書で提供される。第1の核酸集団は複数の個々にアドレス可能な遺伝子座を含む第1のクラスター上で生成されることがある。そのような場合、第1の核酸集団は異なるコドン位置に変異体を含む。いくつかの例では、様々な部位は連続的である(つまり、連続するアミノ酸をコードする)。例えば、第1の核酸集団は、1つの位置において最大で19の変異体をコードする、2つの連続するコドン位置の変異体を含む。いくつかの例では、第1の核酸集団は、1つの位置において約1~約19の変異体をコードする、2つの連続するコドン位置の変異体を含む。いくつかの例では、約38の核酸が合成される。第1の核酸集団は、同じまたは追加の変異体部位で最大で19のコドン変異体をまとめてコードする様々な核酸を含んでもよい。第1の核酸集団は、位置xで最大で19の変異体を、位置yで最大で19の変異体を、および位置zで最大で19の変異体を含む、複数の第1の核酸を含んでもよい。このような配置では、最大で19のアミノ酸変異体が様々な変異体部位の各々でコードされるように、変異体はそれぞれ異なるアミノ酸をコードする。追加の例では、第2の核酸集団は複数の個々にアドレス可能な遺伝子座を含む第2のクラスター上で生成される。第2の核酸集団は、各コドン位置について一定である(つまり、各位置で同じアミノ酸をコードする)、複数の第2の核酸を含むことがある。第2の核酸は第1の核酸の少なくとも一部と重複することがある。第2の核酸は、第1の核酸上で表された変異体部位を含まないことがある。
本明細書に記載されるプロセスによって生成された変異体核酸ライブラリーは、変異体タンパク質ライブラリーの生成をもたらす。第1の典型的な配置では、鋳型核酸は、転写および翻訳時に、単一の円によって示される多くのコドン位置を有する参照アミノ酸配列(図6のA)をもたらす配列をコードする。鋳型の核酸変異体は本明細書に記載された方法を用いて生成可能である。いくつかの例では、単一の変異体は核酸中に存在し、単一のアミノ酸配列をもたらす(図6のB)。いくつかの例では、1つを超える変異体が核酸中に存在し、変異体は1つ以上のコドンによって分離され、変異体残基の間に間隔をおいたタンパク質をもたらす(図6のC)。いくつかの例では、1つを超える変異体が核酸中に存在し、変異体は逐次的であり、かつ互いに対して隣接するか、連続的であり、残基の間隔をおいた変異体の一続きをもたらす(図6のD)。いくつかの例では、変異体の2つの一続きが核酸中に存在し、変異体のそれぞれの一続きは逐次的な、隣接する、または連続的な変異体を含む(図6のE)。
核酸変異体のライブラリーを生成する方法が本明細書で提供され、それぞれの変異体は単一位置のコドン変異体を含む。1つの例では、鋳型核酸は多くのコドン位置を有し、典型的なアミノ酸残基はそれぞれの1文字のコードタンパク質コドンを用いて円によって示されている(図7のA)。図7のBは、変異体核酸のライブラリーによってコードされたアミノ酸変異体のライブラリーを描いており、各変異体は、異なる一つの部位に位置する、「X」によって示される単一位置の変異体を含む。第1の位置の変異体は、アラニンと交換するための任意のコドン、トリプトファンを交換するために変異体核酸のライブラリーによってコードされた任意のコドンを有する第2の変異体、イソロイシンを交換するために任意のコドンを有する第3の変異体、リジンを交換するために任意のコドンを有する第4の変異体、アルギニンを交換するために任意のコドンを有する第5の変異体、グルタミン酸を交換するために任意のコドンを有する第6の変異体、およびグルタミンを交換するために任意のコドンを有する第7の変異体を有する。すべての、あるいは、すべてよりも少ないコドン変異体が変異体核酸ライブラリーによってコードされ、結果として生じるアミノ酸配列変異体の対応する集団は、タンパク質発現(つまり、DNA転写の標準的な細胞的事象と、その後の翻訳と処理の事象)後に生成される。
いくつかの配置では、ライブラリーは単一位置の変異体の複数の部位で生成される。図8のAで描かれるように、野生型の鋳型が提供される。図8のBは、単一位置のコドン変異体の2つの部位を有する結果として生じたアミノ酸配列を描いており、異なるアミノ酸をコードする各コドン変異体は異なる模様の円によって示されている。
複数部位の単一位置の変異体の一続きを有するライブラリーを生成する方法が本明細書で提供される。核酸のそれぞれの一続きは1、2、3、4、5、またはそれ以上の変異体を有することがある。核酸のそれぞれの一続きは少なくとも1つの変異体を有することがある。核酸のそれぞれの一続きは少なくとも2つの変異体を有することがある。核酸のそれぞれの一続きは少なくとも3つの変異体を有することがある。例えば、5つの核酸の一続きは1つの変異体を有することがある。5つの核酸の一続きは2つの変異体を有することがある。5つの核酸の一続きは3つの変異体を有することがある。5つの核酸の一続きは4つの変異体を有することがある。例えば、4つの核酸の一続きは1つの変異体を有することがある。4つの核酸の一続きは2つの変異体を有することがある。4つの核酸の一続きは3つの変異体を有することがある。4つの核酸の一続きは4つの変異体を有することがある。
いくつかの例では、単一位置の変異体はすべて、同じアミノ酸、例えば、ヒスチジンをコードしてもよい。図9のAに示されるように、参照アミノ酸配列が提供される。この配置において、核酸の一続きは、単一位置の変異体の複数の部位をコードし、発現時には、ヒスチジンをコードするすべての単一位置の変異体を有するアミノ酸配列を生じさせる(図9のB)。いくつかの実施形態では、本明細書に記載される方法によって合成された変異体ライブラリーは、結果として生じたアミノ酸配列において4つを超えるヒスチジン残基をコードしない。
いくつかの例では、本明細書に記載される方法によって生成された核酸の変異体ライブラリーは、変異の別の一続きを有するアミノ酸配列の発現をもたらす。鋳型アミノ酸配列は図10のAに示される。核酸の一続きは、2つの一続きに1つの変異体コドンしか含まないことがあり、発現時には、結果として、図10のBに示されるアミノ酸配列をもたらす。1つの一続きの異なる位置にあるアミノ酸の変異を示すために、変異体は、異なる模様の円によって図10のBで示されている。
本明細書には、1、2、3、またはそれ以上のコドン変異体を有する核酸ライブラリーを合成するための方法および装置が提供され、ここで、各部位に対する変異体は選択的に制御される。単一部位の変異体に対する2つのアミノ酸の比率は、約1:100、1:50、1:10、1:5、1:3、1:2、1:1であり得る。単一部位の変異体に対する3つのアミノ酸の比率は、約1:1:100、1:1:50、1:1:20、1:1:10、1:1:5、1:1:3、1:1:2、1:1:1、1:10:10、1:5:5、1:3:3、または1:2:2であり得る。図11のAは、野生型の核酸配列によってコードされた野生型の参照アミノ酸配列を示す。図11のBは、アミノ酸変異体のライブラリーを示し、ここで、各変異体は配列の一続き(模様のある円によって示されている)を含み、各位置は、結果として生じた変異体タンパク質ライブラリーにおいて特定の比率のアミノ酸を有することもある。結果として生じた変異体タンパク質ライブラリーは、本明細書に記載される方法によって生成された変異体核酸ライブラリーによってコードされる。この例証では、5つの位置が変えられる:第1の位置(1100)は50/50のK/R比率を有し;第2の位置(1110)は50/25/25のV/L/S比率を有し、第3の位置(1120)は50/25/25のY/R/D比率を有し、第4の位置(1130)は20のアミノ酸すべてに対して等しい比率を有し、および第5の位置(1140)はG/Pに対して75/25の比率を有する。本明細書に記載される比率は単なる例である。
いくつかの例では、合成された変異体ライブラリーが生成され、これは、タンパク質のアミノ酸配列に最終的に翻訳される核酸配列をコードする。典型的なアミノ酸配列は、小さなペプチドの他に大きなペプチドの少なくとも一部もコードする配列、例えば、抗体配列を含む。いくつかの例では、合成されたオリゴ核酸は各々、抗体配列の一部において変異体コドンをコードする。変異体により合成された核酸の一部がコードする典型的な抗体配列は、抗原結合領域またはその可変領域、あるいはそれらの断片を含む。本明細書に記載される核酸が一部をコードする抗体断片の例としては、限定されないが、Fab、Fab’、F(ab’)2、およびFvの断片、二重特異性抗体、線状抗体、単鎖抗体分子、および抗体断片から形成された多重特異性抗体を含む。本明細書に記載されるオリゴ核酸が一部をコードする抗体領域の例としては、限定されないが、Fc領域、Fab領域、Fab領域の可変領域、Fab領域の定常領域、重鎖または軽鎖の可変ドメイン(VまたはV)、あるいはVまたはVの特異的な相補性決定領域(CDR)が挙げられる。本明細書に開示される方法によって生成された変異体ライブラリーは、本明細書に記載される抗体領域の1つ以上の変異をもたらし得る。1つの典型的なプロセスでは、変異体ライブラリーは、複数のCDRをコードする核酸のために生成される。図12を参照する。CDR1(1210)、CDR2(1220)、およびCDR3(1230)の領域を有する抗体をコードする鋳型核酸は、本明細書に記載される方法によって修飾され、各CDR領域は変異のための複数の部位を含む。重鎖または軽鎖の単一の可変ドメインにおける3つのCDR(1215、1225、および1235)の各々に対する変異が生成される。星によって示される各部位は、鋳型核酸配列とは異なるコドン配列と交換可能である、単一の位置、複数の連続する位置の一続き、またはその両方を含んでもよい。変異体ライブラリーの多様性は、本明細書に提供される方法を使用して、最大で~1010の多様性またはたはそれ以上の多様性で劇的に増大することもある。
いくつかの例では、変異体ライブラリーは、重鎖あるいは軽鎖(VまたはV)の可変ドメインの単一あるいは複数の変異体を含む。いくつかの例では、変異体ライブラリーは、V領域の単一あるいは複数の変異体を含む。例示的なV領域は、限定されないが、IGHV1、IGHV2、IGHV3、IGHV4、IGHV5、IGHV6、およびIGHV7を含む。いくつかの例では、変異体ライブラリーは、V領域の単一あるいは複数の変異体を含む。例示的なV領域は、限定されないが、IGKV1、IGKV2、IGKV3、IGKV4、IGKV5、IGLV1、IGLV2、およびIGLV3を含む。
発現カセットにおける変異
いくつかの例において、発現構築物の一部をコードする合成された変異体ライブラリーが生成される。発現構築物の典型的な部分は、プロモーター、オープンリーディングフレーム、および終端領域を含む。いくつかの例では、発現構築物は、1、2、3またはそれ以上の発現カセットをコードする。核酸ライブラリーが生成され、これは、図14に示されるように、発現構築物カセットの部分を構成する単一の部位または複数の部位の別々の領域にあるコドン変異をコードする。2つの構築物発現カセットを生成するために、第1のプロモーター(1410)、第1のオープンリーディングフレーム(1420)、第1のターミネーター(1430)、第2のプロモーター(1440)、第2のオープンリーディングフレーム(1450)、または第2のターミネーター配列(1460)の変異体配列の少なくとも一部をコードする変異体核酸が合成された。増幅のラウンド後に、前の例で記載されるように、1,024の発現構築物のライブラリーが生成された。図14は1つの例の配置を提供する。いくつかの例では、非翻訳制御領域(UTR)またはエンハンサー領域などの、追加の制御配列(regulator sequences)も、本明細書で言及される発現カセットに含まれる。発現カセットは、本明細書に記載される方法によって変異体配列が生成される1、2、3、4、5、6、7、8、9、10またはそれ以上の構成要素を含んでもよい。いくつかの例では、発現構築物は、マルチシストロン性(multicistronic)ベクター中に1つを超える遺伝子を含む。一例では、合成されたDNA核酸は、ウイルスベクター(例えば、レンチウイルス)へ挿入され、その後、細胞への形質導入のためにパッケージ化されるか、または細胞へ導入のために非ウイルスベクターへと挿入され、その後、スクリーニングおよび分析される。
本明細書に開示される核酸を挿入するための発現ベクターは、真核ベクター(eukaryotic)(例えば、細菌性および真菌性)と原核ベクター(prokaryotic)(例えば、哺乳動物、植物、および昆虫の発現ベクター)を含む。典型的な発現ベクターは、限定されないが、哺乳動物の発現ベクター:pSF-CMV-NEO-NH2-PPT-3XFLAG、pSF-CMV-NEO-COOH-3XFLAG、pSF-CMV-PURO-NH2-GST-TEV、pSF-OXB20-COOH-TEV-FLAG(R)-6His(SEQ ID NO:32として開示される「6His」)、pCEP4 pDEST27、pSF-CMV-Ub-KrYFP、pSF-CMV-FMDV-daGFP、pEF1a-mCherry-N1 Vector、pEF1a-tdTomato Vector、pSF-CMV-FMDV-Hygro、pSF-CMV-PGK-Puro、pMCP-tag(m)、および、pSF-CMV-PURO-NH2-CMYC;細菌性の発現ベクター:pSF-OXB20-BetaGal、pSF-OXB20-Fluc、pSF-OXB20、およびpSF-Tac;植物の発現ベクター:pRI 101-AN DNAおよびpCambia2301;および酵母発現ベクター:pTYB21およびpKLAC2、および昆虫のベクター:pAc5.1/V5-His AおよびpDEST8を含む。典型的な細胞は、限定されないが、原核細胞および真核細胞を含む。典型的な真核細胞は、限定されないが、動物、植物、および真菌の細胞を含む。典型的な動物細胞は、限定されないが、昆虫、魚、および哺乳動物の細胞を含む。典型的な哺乳動物細胞は、マウス、ヒト、および霊長類の細胞を含む。本明細書に記載される方法によって合成された核酸は、細胞へと移され、これは、限定されないが、トランスフェクション、形質導入、およびエレクトロポレーションを含む、当該技術分野において既知の様々な方法によって行われる。試験される典型的な細胞機能は、限定されないが、細胞増殖における変化、遊走/接着、代謝活性、および細胞シグナル伝達活性を含む。
高並列核酸合成
本明細書には、革新的な合成プラットフォームを作るために、シリコン上のナノウェル内でポリヌクレオチド合成から遺伝子アセンブリまでの末端間のプロセスの小型化、並列化、および垂直統合を利用するプラットフォームアプローチが提供される。本明細書に記載される装置は、96ウェルのプレートと同じフットプリントとともに、従来の合成方法と比較して、最大で1,000倍以上スループットを増加させることができるシリコン合成プラットフォームを提供し、1回の高並列化されたラン(run)で、最大でおよそ1,000,000以上のポリヌクレオチド、または10,000以上の遺伝子を産生する。
次世代配列決定の出現により、高解像度のゲノムデータは、正常な生態および病因の両方において様々な遺伝子の生物学的役割を深く探究する研究の重要な因子となっている。この研究の中心となるのは、分子生物学のセントラルドグマと「順次情報の残基ごとの移動」の概念である。DNAにおいてコードされたゲノム情報は、メッセージへと転写され、これはその後、与えられた生物学的経路内の活性産物であるタンパク質へと翻訳される。
研究の別の刺激的な領域は、高特異的な細胞標的に焦点を置いた治療用分子の発見、開発、および製造に関するものである。高多様性のDNA配列ライブラリーは、標的とされた治療薬のための開発パイプラインの中心にある。治療標的に対して高い親和性を有するタンパク質の高い発現のために理想的には最適化された遺伝子になる、設計、構造、および試験用のタンパク質工学サイクルにおいてタンパク質を発現するために、遺伝子突然変異体が使用される。一例として、受容体の結合ポケットを考察されたい。結合ポケット内のすべての残基のすべての配列の並べ替えを同時に試験する能力によって、徹底的な診査が可能になり、成功の可能性が増大する。研究者が受容体内の特定部位であらゆる可能な突然変異を発生させる試みを行う飽和突然変異誘発は、この開発課題に対する1つの手段を表す。高価であり、時間も手間もかかるが、これによって、各変異体を各位置へと導入することができる。対照的に、少数の選択された位置またはDNAの短い伸長部が広範囲に修飾され得るコンビナトリアル突然変異誘発は、偏った提示(biased representation)で変異体の不完全なレパートリーを発生させる。
薬物開発のパイプラインを促進するために、試験に利用可能な正しい位置において意図した頻度で利用可能な望ましい変異体を有するライブラリー、言い換えれば、高精度ライブラリー(precision library)は、コストの削減に加えて、スクリーニングの所要時間の短縮も可能にする。本明細書には、望ましい頻度で各々の意図した変異体の正確な導入をもたらす核酸合成変異体ライブラリーを合成する方法が提供される。エンドユーザーにとって、これは、配列空間を徹底的にサンプリングするだけでなく、効率的な方法でこれらの仮説を問うことができる能力に翻訳され、コストおよびスクリーニング時間を削減する。ゲノム全体の編集は、重要な経路、各変異体および配列の並べ替えが最適な機能性に関して試験され得るライブラリーを解明することができ、全経路を再構築するために何千もの遺伝子を使用することができ、創薬のための生物系を再設計するためにゲノムを使用することができる。
第1の実施例では、薬物自体は、本明細書に記載される方法を使用して最適化され得る。例えば、抗体の指定された機能を改善するために、抗体の一部をコードする変異体核酸ライブラリーが設計および合成される。その後、抗体に対する変異体核酸ライブラリーが、本明細書に記載されるプロセス(例えば、PCR突然変異誘発に続くベクターへの挿入)によって生成され得る。その後、抗体は、産生細胞株(production cell line)において発現され、活性の増強についてスクリーニングされる。スクリーニングの例は、抗原に対する結合親和性、安定性、またはエフェクター機能(例えば、ADCC、補体、またはアポトーシス)の調節を検査することを含む。抗体を最適化する典型的な領域は、限定されないが、Fc領域、Fab領域、Fab領域の可変領域、Fab領域の定常領域、重鎖または軽鎖の可変ドメイン(VまたはV)、およびVまたはVの特異的な相補性決定領域(CDR)を含む。
代替的に、最適化するための分子は、活性化剤または競合的阻害剤として使用される受容体結合エピトープである。核酸の変異体ライブラリーの合成に続いて、核酸の変異体ライブラリーは、ベクター配列へと挿入され、その後、細胞において発現され得る。受容体抗原は、細胞(例えば、昆虫細胞、哺乳動物細胞、または細菌細胞)において発現され、その後、精製され得るか、または配列の変異からの機能的な結果を検査するために細胞(例えば、哺乳動物細胞)において発現され得る。機能的な結果は、限定されないが、タンパク質発現、結合親和性および安定性の変化を含む。細胞の機能的な結果は、限定されないが、繁殖、成長、接着、死亡、遊走、エネルギー産生、酸素利用、代謝活性、細胞シグナル伝達、老化、遊離基損傷に対する反応、またはそれらの任意の組み合わせの変化を含む。いくつかの実施形態では、最適化のために選択されるタンパク質のタイプは、酵素、輸送タンパク質、Gタンパク質共役型受容体、電位型イオンチャネル、転写因子、ポリメラーゼ、アダプタータンパク質(酵素活性のないタンパク質、2つの他のタンパク質を一緒に集める働き)、および細胞骨格タンパク質である。酵素の典型的なタイプは、限定されないが、シグナル伝達酵素(タンパク質キナーゼ、タンパク質ホスファターゼ、ホスホジエステラーゼ、ヒストンデアセチラーゼ、およびGTPアーゼなど)を含む。
本明細書には、全経路または全ゲノムに関与する分子のための変異体を含む変異体核酸ライブラリーが提供される。典型的な経路は、限定されないが、代謝、細胞死、細胞周期進行、免疫細胞活性化、炎症反応、血管新生、リンパ球新生、低酸素ストレス応答、酸化ストレス応答、または細胞接着/遊走の経路を含む。細胞死の経路における典型的なタンパク質は、限定されないが、Fas、Cadd、カスパーゼ(Caspase)3、カスパーゼ6、カスパーゼ8、カスパーゼ9、カスパーゼ10、IAP、TNFR1、TNF、TNFR2、NF-kB、TRAF、ASK、BAD、およびAktを含む。細胞周期の経路における典型的なタンパク質は、限定されないが、NFkB、E2F、Rb、p53、p21、サイクリンA、サイクリンB、サイクリンD、サイクリンE、およびcdc 25を含む。細胞遊走の経路における典型的なタンパク質は、限定されないが、Ras、Raf、PLC、コフィリン、MEK、ERK、MLP、LIMK、ROCK、RhoA、Src、Rac、Myosin II、ARP2/3、MAPK、PIP2、インテグリン、タリン、キンドリン(kindlin)、ミグフィリン(migfilin)およびフィラミンを含む。
本明細書に記載される方法によって合成された核酸ライブラリーは、様々な細胞タイプで発現され得る。典型的な細胞タイプは、原核細胞(例えば、細菌細胞および真菌細胞)および真核細胞(例えば、植物細胞および動物細胞)を含む。典型的な動物は、限定されないが、マウス、ウサギ、霊長類、魚、および昆虫を含む。典型的な植物は、限定されないが、単子葉植物および双子葉植物を含む。典型的な植物は、限定されないが、微細藻類、ケルプ、シアノバクテリア、および、緑藻類、褐藻類、ならびに紅藻類、小麦、タバコ、およびトウモロコシ、米、綿、野菜、ならびに果実も含む。
本明細書に記載される方法によって合成された核酸ライブラリーは、疾患状態に関連付けられる様々な細胞において発現され得る。疾患状態に関連付けられる細胞は、被験体からの細胞株、組織サンプル、初代細胞、被験体から増殖された培養細胞、またはモデル系における細胞を含む。典型的なモデル系は、限定されないが、疾患状態の植物および動物のモデルを含む。
本明細書に記載される方法によって合成された核酸ライブラリーは、様々な細胞タイプで発現され得、細胞活性における変化が評価される。典型的な細胞活性は、限定されないが、増殖、周期進行、細胞死、接着、遊走、繁殖、細胞シグナル伝達、エネルギー産生、酸素利用、代謝活性、および老化、遊離ラジカル損傷に対する反応、またはそれらの任意の組み合わせを含む。
疾患状態の予防、低減、または処置に関連付けられる変異体分子を特定するために、本明細書に記載される変異体核酸ライブラリーは、疾患状態に関連付けられる細胞、または疾患状態が誘発され得る細胞で発現される。いくつかの例では、細胞において疾患状態を誘発するために薬剤が使用される。疾患状態の誘発のための典型的なツールは、限定されないが、Cre/Lox組換え系、LPS炎症誘発、および低血糖症を誘発するストレプトゾトシンを含む。疾患状態に関連付けられる細胞は、モデル系からの細胞または培養細胞の他に、特定の病状を有する被験体からの細胞であり得る。典型的な病状は、細菌性、真菌性、ウイルス性、自己免疫性、または、増殖性の障害(例えば、癌)を含む。いくつかの例では、変異体核酸ライブラリーは、モデル系、細胞株、または被験体由来の初代細胞において発現され、少なくとも1つの細胞活性における変化についてスクリーニングされる。典型的な細胞活性は、限定されないが、増殖、周期進行、細胞死、接着、遊走、繁殖、細胞シグナル伝達、エネルギー産生、酸素利用、代謝活性、および老化、遊離ラジカル損傷に対する反応、またはそれらの任意の組み合わせを含む。
基質
本明細書には、複数のクラスターを含む基質が提供され、ここでクラスターはそれぞれ、ポリヌクレオチドの結合と合成を支持する複数の遺伝子座を含む。本明細書で使用されるような用語「遺伝子座」は、表面から伸長するために単一のあらかじめ定められた配列をコードするポリヌクレオチドに支持を与える構造上の離散的領域を指す。いくつかの例では、遺伝子座は、二次元表面、例えば、実質的に平らな表面上にある。いくつかの例では、遺伝子座は、表面上の離散的な隆起したまたは沈降した部位、例えば、ウェル、マイクロウェル、チャネル、またはポストを指す。いくつかの例では、遺伝子座の表面は、ポリヌクレオチド合成のための少なくとも1つのヌクレオチド、または、好ましくは、ポリヌクレオチドの集団の合成のための同一のヌクレオチドの集団に結合するために活発に機能化される物質を含む。いくつかの例では、ポリヌクレオチドとは、同じ核酸配列をコードするポリヌクレオチドの集団を指す。いくつかの例では、装置の表面は、基質の1つまたは複数の表面を包含する。
提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対する平均エラー率は、1000中で1未満、1250中で1未満、1500中で1未満、2000中で1未満、3000中で1未満であるか、またはそれよりも頻度は低い。いくつかの例では、提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対する平均エラー率は、1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1250、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000未満であるか、またはそれよりも低い。いくつかの例では、提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対する平均エラー率は、1/1000未満である。
いくつかの例では、提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対する総エラー率は、あらかじめ定められた配列と比較して、1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1250、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000未満であるか、またはそれよりも低い。いくつかの例では、提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対する総エラー率は、1/500、1/600、1/700、1/800、1/900、または1/1000未満である。いくつかの例では、本明細書で提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対する総エラー率は、あらかじめ定められた配列と比較して、1/500未満、またはそれよりも低い。
いくつかの例では、エラー補正酵素は、使用することができる提供された方法およびシステムを使用してライブラリー内で合成されたポリヌクレオチドに使用され得る。いくつかの例では、エラー補正を伴うポリヌクレオチドに対する総エラー率は、あらかじめ定められた配列と比較して、1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000未満、またはそれ以下であり得る。いくつかの例では、提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対するエラー補正を伴う総エラー率は、1/500、1/600、1/700、1/800、1/900、または1/1000未満であり得る。いくつかの例では、提供されるシステムおよび方法を使用してライブラリー内で合成されたポリヌクレオチドに対するエラー補正を伴う総エラー率は、1/1000未満であり得る。
エラー率は、遺伝子変異体のライブラリーの産生のための遺伝子合成の値を制限し得る。1/300のエラー率では、1500の塩基対遺伝子におけるクローンの約0.7%が正しくなる。ポリヌクレオチド合成からのエラーのほとんどが、結果としてフレームシフト突然変異をもたらすため、そのようなライブラリー中のクローンの99%以上が、完全長タンパク質を生成しない。エラー率を75%低下させることによって、正しいクローンの画分は40倍増加する。本開示の方法および組成物は、超並列および時間効率の良い方法で可能になる合成の質の改善とエラー補正方法の適用性の両方のおかげで、一般に観察される遺伝子合成方法よりも低いエラー率での大きな核酸ならびに遺伝子ライブラリーの迅速なデノボ合成を可能にする。したがって、ライブラリーは、塩基の挿入、欠失、置換で合成され得るか、または、ライブラリー全体にわたって、1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/1250、1/1500、1/2000、1/2500、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10000、1/12000、1/15000、1/20000、1/25000、1/30000、1/40000、1/50000、1/60000、1/70000、1/80000、1/90000、1/100000、1/125000、1/150000、1/200000、1/300000、1/400000、1/500000、1/600000、1/700000、1/800000、1/900000、1/1000000未満、またはそれ以下の合計のエラー率、あるいはライブラリーの80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上にわたる合計のエラー率で合成され得る。本開示の方法および組成物はさらに、あらかじめ決められた/あらかじめ選択された配列と比較して、エラーのない配列に関連するライブラリーの少なくともサブセットにおいて、ポリヌクレオチドまたは遺伝子の少なくとも30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上に関連付けられる低いエラー率での大規模な合成核酸および遺伝子のライブラリーに関する。いくつかの例では、ライブラリー内の単離した量でのポリヌクレオチドまたは遺伝子の少なくとも30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上は、同じ配列を有している。いくつかの例では、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、またはそれ以上の類似性または同一性に関連する、いかなるポリヌクレオチドまたは遺伝子の少なくとも30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上は、同じ配列を有している。いくつかの例では、ポリヌクレオチドまたは遺伝子上の指定された遺伝子座に関連するエラー率は、最適化される。したがって、大規模なライブラリーの一部としての1つ以上のポリヌクレオチドまたは遺伝子の複数の選択された遺伝子座の所定の遺伝子座はそれぞれ、1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/1250、1/1500、1/2000、1/2500、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10000、1/12000、1/15000、1/20000、1/25000、1/30000、1/40000、1/50000、1/60000、1/70000、1/80000、1/90000、1/100000、1/125000、1/150000、1/200000、1/300000、1/400000、1/500000、1/600000、1/700000、1/800000、1/900000、1/1000000未満、またはそれより低いエラー率を有し得る。様々な例では、そのようなエラーを最適化した遺伝子座は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、30000、50000、75000、100000、500000、1000000、2000000、3000000、またはそれ以上の遺伝子座を含み得る。該エラーを最適化した遺伝子座は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、30000、75000、100000、500000、1000000、2000000、3000000、またはそれ以上のポリヌクレオチドまたは遺伝子に分布され得る。
エラー率は、エラー補正を用いてまたはそれなしで達成され得る。エラー率は、ライブラリー全体にわたって、またはライブラリーの80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%、またはそれ以上にわたって達成され得る。
本明細書には、共通の支持体上のアドレス可能な位置で異なるあらかじめ決められた配列を有する複数のポリヌクレオチドの合成を支持する表面を含み得る構造が提供される。いくつかの例では、装置は、2,000;5,000;10,000;20,000;30,000;50,000;75,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000を超える、またはそれ以上の同一でないポリヌクレオチドの合成のための支持を提供する。いくつかの例では、装置は、別の配列をコードする、2,000;5,000;10,000;20,000;30,000;50,000;75,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000を超える、またはそれ以上のポリヌクレオチドの合成のための支持を提供する。いくつかの例では、ポリヌクレオチドの少なくとも一部は、同一の配列を有しているか、または同一の配列で合成されるように構成されている。
約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、または2000塩基長さであるポリヌクレオチドの製造および成長のための方法および装置が本明細書で提供される。いくつかの例では、形成されるポリヌクレオチドの長さは、約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、または225塩基長さである。ポリヌクレオチドは少なくとも5、10、20、30、40、50、60、70、80、90、または100塩基長さであり得る。ポリヌクレオチドは、10~225塩基長さ、12~100塩基長さ、20~150塩基長さ、20~130塩基長さ、または30~100塩基長さであり得る。
いくつかの例では、ポリヌクレオチドは、基質の別々の遺伝子座で合成され、ここで、遺伝子座はそれぞれ、ポリヌクレオチドの集団の合成を支持する。いくつかの例では、遺伝子座はそれぞれ、別の遺伝子座上で成長したポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の合成を支持する。いくつかの例では、装置の遺伝子座は複数のクラスター内に位置する。いくつかの例では、装置は、少なくとも10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000またはそれ以上のクラスターを含む。いくつかの例では、装置は、2,000;5,000;10,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,100,000;1,200,000;1,300,000;1,400,000;1,500,000;1,600,000;1,700,000;1,800,000;1,900,000;2,000,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;または10,000,000を超える、あるいはそれ以上の別々の遺伝子座を含む。いくつかの例では、装置は、約10,000の別々の遺伝子座を含む。単一のクラスター内の遺伝子座の量は、異なる例では変化する。いくつかの例では、クラスターはそれぞれ、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、5001000以上の遺伝子座を含む。いくつかの例では、クラスターはそれぞれ、約50-500の遺伝子座を含む。いくつかの例では、クラスターはそれぞれ、約100-200の遺伝子座を含む。いくつかの例では、クラスターはそれぞれ、約100-150の遺伝子座を含む。いくつかの例では、クラスターはそれぞれ、約109、121、130または137の遺伝子座を含む。いくつかの例では、クラスターはそれぞれ、約19、20、61、64またはそれ以上の遺伝子座を含む。
装置上で合成された別々のポリヌクレオチドの数は、基質で利用可能な別の遺伝子座の数に依拠し得る。いくつかの例では、装置のクラスター内の遺伝子座の密度は、1mm当たり少なくともまたは約1の遺伝子座、1mm当たり10の遺伝子座、1mm当たり25の遺伝子座、1mm当たり50遺伝子座、1mm当たり65の遺伝子座、1mm当たり75の遺伝子座、1mm当たり100の遺伝子座、1mm当たり130の遺伝子座、1mm当たり150の遺伝子座、1mm当たり175の遺伝子座、1mm当たり200の遺伝子座、1mm当たり300の遺伝子座、1mm当たり400の遺伝子座、1mm当たり500の遺伝子座、1mm当たり1,000の遺伝子座、またはそれ以上である。いくつかの例では、装置は、1mmから約500mm当たり約10の遺伝子座、1mmから約400mm当たり約25の遺伝子座、1mmから約500mm当たり約50の遺伝子座、1mmから約500mm当たり約100の遺伝子座、1mmから約500mm当たり約150の遺伝子座、1mmから約250mm当たり約10の遺伝子座、1mmから約250mm当たり約50の遺伝子座、1mmから約200mm当たり約10の遺伝子座、1mmから約200mm当たり約50の遺伝子座を含む。いくつかの例では、クラスター内の2つの隣接した遺伝子座の中心からの距離は、約10μmから約500μm、約10μmから約200μm、または約10μmから約100μmである。いくつかの例では、隣接した遺伝子座の2つの中心からの距離は、約10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μmまたは100μmより長い。いくつかの例では、2つの隣接した遺伝子座の中心からの距離は、約200μm、150μm、100μm、80μm、70μm、60μm、50μm、40μm、30μm、20μmまたは10μm未満である。いくつかの例では、各遺伝子座は、約0.5μm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μmまたは100μmの幅を有する。いくつかの例では、各遺伝子座は、約0.5μmから100μm、約0.5μmから50μm、約10μmから75μm、または約0.5μmから50μmの幅を有する。
いくつかの例では、装置内のクラスターの密度は、100mm当たり少なくともまたは約1のクラスター、10mm当たり1のクラスター、5mm当たり1のクラスター、4mm当たり1のクラスター、3mm当たり1のクラスター、2mm当たり1のクラスター、1mm当たり1のクラスター、1mm当たり2のクラスター、1mm当たり3のクラスター、1mm当たり4のクラスター、1mm当たり5のクラスター、1mm当たり10のクラスター、1mm当たり50のクラスター、またはそれ以上である。いくつかの例では、装置は、10mm当たり約1のクラスターから1mm当たり約10のクラスターを含む。いくつかの例では、2つの隣接したクラスターの中心からの距離は、約50μm、100μm、200μm、500μm、1000μm、2000μm、または5000μm未満である。いくつかの例では、2つの隣接したクラスターの中心からの距離は、約50μmから約100μm、約50μmから約200μm、約50μmから約300μm、約50μmから約500μm、および約100μmから約2000μmである。いくつかの例では、2つの隣接したクラスターのセンターの距離は、約0.05mmから約50mm、約0.05mmから約10mm、約0.05mmから約5mm、約0.05mmから約4mm、約0.05mmから約3mm、約0.05mmから約2mm、約0.1mmから約10mm、約0.2mmから約10mm、約0.3mmから約10mm、約0.4mmから約10mm、約0.5mmから約10mm、約0.5mmから約5mm、または約0.5mmから約2mmである。いくつかの例では、各クラスターは、約0.5~2mm、約0.5~1mm、または約1~2mmの1次元に沿った、直径あるいは幅を有する。いくつかの例では、各クラスターは、約0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9または2mm、1次元に沿った直径あるいは幅を有する。いくつかの例では、約0.5、0.6、0.7、0.8、0.9、1、1.1、1.15、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9または2の1次元に沿った内部の径または幅を有する。
装置はおよそ標準の96ウェルプレートのサイズ、例えば、約100mmおよび200mm×約50mmおよび150mmであってもよい。いくつかの例では、装置は、約1000mm、500mm、450mm、400mm、300mm、250nm、200mm、150mm、100mmまたは50mmより小さい直径を有する。いくつかの例では、装置の直径は、約25mmから1000mm、約25mmから約800mm、約25mmから約600mm、約25mmから約500mm、約25mmから約400mm、約25mmから約300mm、または約25mmから約200mmである。装置のサイズの非限定的な例は、約300mm、200mm、150mm、130mm、100mm、76mm、51mmおよび25mmを含む。いくつかの例では、装置は、少なくとも約100mm;200mm;500mm;1,000mm;2,000mm;5,000mm;10,000mm;12,000mm;15,000mm;20,000mm;30,000mm;40,000mm;50,000mmまたはそれ以上の平面の表面積を有している。いくつかの例では、装置の厚さは、約50mmから約2000mm、約50mmから約1000mm、約100mmから約1000mm、約200mmから約1000mm、または約250mmから約1000mmである。装置の厚さの非限定的な例は、275mm、375mm、525mm、625mm、675mm、725mm、775mmおよび925mmを含む。いくつかの例では、装置の厚さは、直径によって変わり、基質の組成に依拠する。例えば、シリコン以外の物質を含む装置は、同じ直径のシリコン装置とは異なる厚さを有している。装置の厚さは、使用される物質の機械強度によって判定され、取り扱いの間に割れることなく、それ自体の重量を支えるのに十分に厚くなければならない。いくつかの例では、構造は、本明細書に記載される複数の装置を含む。
表面物質
表面を含む装置が本明細書で提供され、ここで、該表面は、あらかじめ決められた位置で、および結果として生じる低いエラー率、低いドロップアウト率、高い収率、ならびに高いオリゴ表現でのポリヌクレオチド合成を支持するために改変される。いくつかの実施形態において、本明細書で提供されるポリヌクレオチド合成のための装置の表面は、デノボポリヌクレオチド合成反応を支持するために改変できる様々な物質から作られる。場合によっては、装置は十分に導電性であり、例えば、装置の全てまたは一部にわたって均一な電場を形成することができる。本明細書に記載される装置は可撓性材料を含んでもよい。例示的な可撓性材料は、限定されないが、修飾ナイロン、非修飾ナイロン、ニトロセルロース、およびポリプロピレンなどを含む。本明細書に記載される装置は剛性材料を含んでもよい。例示的な剛性材料は、限定されないが、ガラス、石英ガラス(fuse silica)、シリコン、二酸化ケイ素、窒化ケイ素、プラスチック(例えば、ポリテトラフルオロエチレン、ポリプロピレン、ポリスチレン、ポリカーボネート、およびそれらの混合物など)、ならびに金属(例えば、金、白金など)を含む。本明細書で開示される装置は、シリコン、ポリスチレン、アガロース、デキストラン、セルロース系ポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)、ガラス、またはそれらの任意の組み合わせを含む材料から作られてもよい。場合によっては、本明細書で開示される装置は、本明細書に列挙された材料または当該技術分野において知られている他の適切な材料の組み合わせで製造される。
本明細書に記載される例示的な材料の引っ張り強度のリストは以下の通りである:ナイロン(70MPa)、ニトロセルロース(1.5MPa)、ポリプロピレン(40MPa)、シリコン(268MPa)、ポリスチレン(40MPa)、アガロース(1-10MPa)、ポリアクリルアミド(1-10MPa)、ポリジメチルシロキサン(PDMS)(3.9-10.8MPa)。本明細書に記載される固体の支持体は、1~300、1~40、1~10、1~5、または3~11MPaの引っ張り強度を有することができる。本明細書に記載された固体の支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、270、またはそれ以上のMPaの引っ張り強度を有することができる。いくつかの例では、本明細書に記載される装置は、テープまたはフレキシブルシートなどの連続的なループまたはリールに格納可能な可撓性材料の形態を取るポリヌクレオチド合成のための固体の支持体を含む。
ヤング率は、荷重下での弾性(復元可能)変形に対する材料の耐性を測定する。本明細書に記載される例示的な材料の剛性のヤング率のリストは以下の通りである:ナイロン(3GPa)、ニトロセルロース(1.5GPa)、ポリプロピレン(2GPa)、シリコン(150GPa)、ポリスチレン(3GPa)、アガロース(1-10GPa)、ポリアクリルアミド(1-10GPa)、ポリジメチルシロキサン(PDMS)(1-10GPa)。本明細書に記載される固体の支持体は、1~500、1~40、1~10、1~5、または3~11GPaのヤング率を有することができる。本明細書に記載される固体の支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、400、500GPa、あるいはそれ以上のヤング率を有することができる。軟性と剛性の関係は互いに逆であることから、可撓性材料は低ヤング率を有し、荷重下でその形状を大きく変化させる。いくつかの例では、本明細書に記載される固体の支持体は、少なくともナイロンの柔軟性を備えた表面を有する。
場合によっては、本明細書で開示される装置は、二酸化ケイ素の基部および酸化ケイ素の表層を含む。代替的に、装置は酸化ケイ素の基部を有することもある。ここで提供される装置の表面はテクスチャード加工されることもあり、ポリヌクレオチド合成のための全体的な表面積の増加をもたらす。本明細書で開示される装置は、少なくとも5%、10%、25%、50%、80%、90%、95%、または99%のシリコンを含んでもよい。本明細書で開示される装置は、シリコン・オン・インシュレーター(SOI)ウェーハから作られてもよい。
表面のアーキテクチャ
隆起したおよび/または沈降した特徴を含む装置が本明細書で提供される。そのような特徴を有することの1つの利点は、ポリヌクレオチド合成を支持する表面積の増加である。いくつかの例では、隆起したおよび/または陥没した特徴を有する装置は、三次元基質と呼ばれる。いくつかの例では、三次元装置は1つ以上のチャネルを含む。いくつかの例では、1つ以上の遺伝子座はチャネルを含む。いくつかの例では、チャネルは、材料堆積装置などの堆積装置によって試薬の堆積に利用可能である。いくつかの例では、試薬および/または流体は、1つ以上のチャネルと流体連通するより大きなウェルに集まる。例えば、装置は、クラスターを有する複数の遺伝子座に対応する複数のチャネルを含み、複数のチャネルは、該クラスターの1つのウェルと流体連通する。いくつかの方法において、ポリヌクレオチドのライブラリーは、クラスターの複数の遺伝子座において合成される。
いくつかの例では、その構造は、表面上のポリヌクレオチド合成に関する流れの制御および物質移動経路の制御を可能にするように構成される。いくつかの例では、装置の構成は、ポリヌクレオチド合成中の物質移動経路、化学暴露時間、および/または洗浄効果の制御ならびに均一な分布を可能にする。いくつかの例では、装置の構成は、例えば、成長しているポリヌクレオチドによって排除された容積が、ポリヌクレオチドの成長に利用可能なまたは適切な最初に利用可能な容積の50、45、40、35、30、25、20、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1%、またはそれ以下を占めないようにポリヌクレオチドの成長に十分な容積を提供することによって、掃攻率の増大を可能にする。いくつかの例では、三次元構造は、化学暴露の急速な交換を可能にするために流体の流れの管理を可能にする。
本明細書には、1fM、5fM、10fM、25fM、50fM、75fM、100fM、200fM、300fM、400fM、500fM、600fM、700fM、800fM、900fM、1pM、5pM、10pM、25pM、50pM、75pM、100pM、200pM、300pM、400pM、500pM、600pM、700pM、800pM、900pM、またはそれ以上の量のDNAを合成する方法が提供される。いくつかの例では、ポリヌクレオチドライブラリーは、遺伝子の約1%、2%、3%、4%、5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%の長さに及ぶことがある。遺伝子は、最大約1%、2%、3%、4%、5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、または100%まで変化し得る。
同一でないポリヌクレオチドはまとめて、遺伝子の少なくとも1%、2%、3%、4%、5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、または100%に対する配列をコードし得る。いくつかの例では、ポリヌクレオチドは、遺伝子の50%、60%、70%、80%、85%、90%、95%、またはそれ以上の配列をコードし得る。いくつかの例では、ポリヌクレオチドは、遺伝子の80%、85%、90%、95%、またはそれ以上の配列をコードし得る。
いくつかの例では、物理構造によって隔離が達成される。いくつかの例では、ポリヌクレオチド合成のための能動領域および受動領域を発生させる表面の差次的な官能基化によって、隔離が達成される。差次的な官能基化も、装置表面の疎水性を交互に替えることによって達成され、それにより、堆積した試薬のビーズ化または湿潤を引き起こす水接触角効果をもたらす。より大きな構造を利用することで、飛散(splashing)や、隣接するスポットの試薬での別々のポリヌクレオチド合成位置の相互汚染を減らすことができる。いくつかの例では、ポリヌクレオチドシンセサイザーなどの装置は、別々のポリヌクレオチド合成位置に試薬を堆積させるために使用される。三次元の特徴を有する基質は、低いエラー率(例えば、約1:500、1:1000、1:1500、1:2,000、1:3,000、1:5,000、または1:10,000未満)で多くのポリヌクレオチド(例えば、約10,000を超える)の合成を可能にする方法で構成される。いくつかの例では、装置は、1mm当たり約1、5、10、20、30、40、50、60、70、80、100、110、120、130、140、150、160、170、180、190、200、300、400または500、あるいはそれを超える特徴の密度を有する特徴を含む。
装置のウェルは、基質の他のウェルと同じまたは異なる幅、高さ、および/または体積を有してもよい。装置のチャネルは、基質の他のチャネルと同じまたは異なる幅、高さ、および/または体積を有してもよい。いくつかの例では、クラスターの幅は、約0.05mmから約50mm、約0.05mmから約10mm、約0.05mmから約5mm、約0.05mmから約4mm、約0.05mmから約3mm、約0.05mmから約2mm、約0.05mmから約1mm、約0.05mmから約0.5mm、約0.05mmから約0.1mm、約0.1mmから約10mm、約0.2mmから約10mm、約0.3mmから約10mm、約0.4mmから約10mm、約0.5mmから約10mm、約0.5 mmから約5mm、または約0.5 mmから約2mmである。いくつかの例では、クラスターを含むウェルの幅は、約0.05mmから約50mm、約0.05mmから約10mm、約0.05mmから約5mm、約0.05mmから約4mm、約0.05mmから約3mm、約0.05mmから約2mm、約0.05mmから約1mm、約0.05mmから約0.5mm、約0.05mmから約0.1mm、約0.1mmから約10mm、約0.2mmから約10mm、約0.3mmから約10mm、約0.4mmから約10mm、約0.5mmから約10mm、約0.5mmから約5mm、または約0.5mmから約2mmである。いくつかの例では、クラスターの幅は、5mm、4mm、3mm、2mm、1mm、0.5mm、0.1mm、0.09mm、0.08mm、0.07mm、0.06mmまたは0.05mmより小さい。いくつかの例では、クラスターの幅は約1.0から約1.3mmである。いくつかの例では、クラスターの幅は約1.150mmである。いくつかの例では、ウェルの幅は、5mm、4mm、3mm、2mm、1mm、0.5mm、0.1mm、0.09mm、0.08mm、0.07mm、0.06mmまたは0.05mmより小さい。いくつかの例では、ウェルの幅は約1.0および1.3mmである。いくつかの例では、ウェルの幅は約1.150mmである。いくつかの例では、クラスターの幅は約0.08mmである。いくつかの例では、ウェルの幅は約0.08mmである。クラスターの幅は、二次元または三次元の基質内のクラスターを指すことがある。
いくつかの例では、ウェルの高さは、約20μmから約1000μm、約50μmから約1000μm、約100μmから約1000μm、約200μmから約1000μm、約300μmから約1000μm、約400μmから約1000μm、または約500μmから約1000μmである。いくつかの例では、ウェルの高さは、約1000μm未満、約900μm未満、約800μm未満、約700μm未満、または約600μm未満である。
いくつかの例では、装置は、クラスター内の複数の遺伝子座に対応する複数のチャネルを含み、ここで、チャネルの高さまたは深さは、約5μmから約500μm、約5μmから約400μm、約5μmから約300μm、約5μmから約200μm、約5μmから約100μm、約5μmから約50μm、または約10μmから約50μmである。いくつかの例では、チャネルの高さは、100μm未満、80μm未満、60μm未満、40μm未満または20μm未満である。
いくつかの例では、チャネル、遺伝子座(例えば、実質的に平面の基板における)またはチャネルおよび遺伝子座の両方の直径(例えば、遺伝子座がチャネルに対応する三次元構造装置における)は、約1μmから約1000μm、約1μmから約500μm、約1μmから約200μm、約1μmから約100μm、約5μmから約100μm、または約10μmから約100μm、例えば、約90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μmあるいは10μmである。いくつかの例では、チャネル、遺伝子座、またはチャネルと遺伝子座の両方の直径は、約100μm、90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、または10μmより小さい。いくつかの例では、2つの隣接チャネル、遺伝子座、またはチャネルと遺伝子座の中心からの距離は、約1μmから約500μm、約1μmから約200μm、約1μmから約100μm、約5μmから約200μm、約5μmから約100μm、約5μmから約50μm、または約5μmから約30μm、例えば、約20μmである。
表面改質
様々な例では、装置表面あるいは装置表面の選択された部位または領域の1つ以上の化学的性質および/または物理的性質を変更するための加法または減法による表面の化学的および/または物理的な変更のために、表面改質が利用される。例えば、表面改質は、限定されないが、(1)表面の湿潤性を変更すること、(2)表面を官能化すること、つまり、表面官能基を提供するか、修飾するか、または置換すること、(3)表面を脱官能基化すること、つまり、表面官能基を除去すること、(4)そうでなければ、例えばエッチングによって、表面の化学組成を変更すること、(5)表面粗さを増大または低減すること、(6)表面上にコーティング、例えば、表面の湿潤性とは異なる湿潤性を示すコーティングを提供すること、および/または(7)表面上に粒子を堆積させることを含む。
いくつかの例では、表面上の化学層(接着促進剤と呼ばれる)の追加は、基質の表面上の遺伝子座の構造化したパターン化を容易にする。接着促進の適用のための例示的な表面は、限定されないが、ガラス、シリコン、二酸化ケイ素、および窒化ケイ素を含む。いくつかの例では、接着促進剤は、高い表面エネルギーを有する化学物質である。いくつかの例では、基質の表面上に第2の化学層が堆積される。いくつかの例では、第2の化学層は、低い表面エネルギーを有する。いくつかの例では、表面上にコーティングされた化学層の表面エネルギーは、表面上の液滴の局在化を支持する。選択されるパターン化の配置によって、遺伝子座の接近および/または遺伝子座での流体接触の領域は変更可能である。
いくつかの例では、例えば、ポリヌクレオチド合成のために、ポリヌクレオチドまたは他の部分が堆積する装置表面または分解された遺伝子座は、滑らかであるか、実質的に平面であり(例えば、二次元)、あるいは隆起したまたは陥没した特徴(例えば、三次元の特徴)などの不規則性を有している。いくつかの例では、装置表面は、化合物の1つ以上の異なる層で改質される。対象の層のそのような改質は、限定されないが、金属、金属酸化物、ポリマー、小さな有機分子などの無機層および有機層を含む。非限定的なポリマー層は、ペプチド、タンパク質、核酸またはそれらの模倣物(例えば、ペプチド核酸など)、多糖類、リン脂質、ポリウレタン、ポリエステル、ポリカーボネート、ポリ尿素、ポリアミド、ポリエチレンアミン、ポリアリーレンスルフィド、ポリシロキサン、ポリイミド、ポリアセテート、および本明細書に記載されるか、またはそうでなければ当該技術分野で既知の他の適切な化合物を含む。いくつかの例では、ポリマーはヘテロポリマーである。いくつかの例では、ポリマーはホモポリマーである。いくつかの例では、ポリマーは官能性部分を含むか、または結合される。
いくつかの例では、装置の分解された遺伝子座は、表面エネルギーを増大および/または低減させる1つ以上の部分で官能基化される。いくつかの例では、ある部分は化学的に不活性である。いくつかの例では、ある部分は、望ましい化学反応、例えば、ポリヌクレオチド合成反応における1つ以上のプロセスを支持するように構成される。表面の表面エネルギー、すなわち、疎水性は、表面上へ結合するヌクレオチドの親和性を決定するための因子である。いくつかの例では、装置の官能基化に対する方法は、(a)二酸化ケイ素を含む表面を有する装置を提供する工程;および、(b)本明細書に記載される、またはそうでなければ当該技術分野で既知の適切なシラン化剤、例えば、有機官能性アルコキシシラン分子を使用して、表面をシラン処理する工程を含む。
いくつかの例では、該有機官能性アルコキシシラン分子は、ジメチルクロロ-オクトデシル-シラン、メチルジクロロ-オクトデシル-シラン、トリクロロ-オクトデシル-シラン、トリメチル-オクトデシル-シラン、トリエチル-オクトデシル-シラン、またはそれらの任意の組み合わせを含む。いくつかの例では、装置の表面は、ポリエチレン/ポリプロピレン(ガンマ線照射またはクロム酸酸化、およびヒドロキシアルキル表面への還元によって官能基化された)、高度に架橋されたポリスチレン-ジビニルベンゼン(クロロメチル化によって誘導体化され、ベンジルアミン官能面にアミノ化された)、ナイロン(末端のアミノヘキシル基は直接反応性である)で官能基化されるか、または還元されたポリテトラフルオロエチレンでエッチングされる。他の方法および官能化剤は、米国特許第5,474,796号に記載され、これは参照によってその全体が本明細書に組み込まれる。
いくつかの例では、装置の表面は、典型的に装置の表面上に存在する反応性の親水性部分を介して、装置の表面にシランを結合するのに有効な反応条件下で、シランの混合物を含有している誘導体化組成物との接触によって官能基化される。シラン処理は、一般に、自己組織化を介して有機官能性アルコキシシラン分子で表面を覆う。
当該技術分野において現在知られているように、例えば、表面エネルギーを低減または増大させるために、様々なシロキサンを官能基化する試薬がさらに使用され得る。有機官能性アルコキシシランは、それらの有機官能に従って分類され得る。
本明細書には、ヌクレオシドに結合することができる薬剤のパターン化を含み得る装置が提供される。いくつかの例では、装置は活性薬剤でコーティングされてもよい。いくつかの例では、装置は、受動剤(passive agent)でコーティングされてもよい。本明細書に記載されるコーティング材料に含まれる例示的な活性薬剤は、限定されないが、N-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミド(HAPS)、11-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシラン、(3-アミノプロピル)トリメトキシシラン、(3-アミノプロピル)トリエトキシシラン、3-グリシドキシプロピルトリメトキシシラン(GOPS)、3-ヨード-プロピルトリメトキシシラン、ブチル-アルデヒド-トリメトキシシラン、二量体二次アミノアルキルシロキサン、(3-アミノプロピル)-ジエトキシ-メチルシラン、(3-アミノプロピル)-ジメチル-エトキシシラン、および、(3-アミノプロピル)-トリメトキシシラン、(3-グリシドキシプロピル)-ジメチル-エトキシシラン、グリシドキシ-トリメトキシシラン、(3-メルカプトプロピル)-トリメトキシシラン、3-4エポキシシクロヘキシル-エチルトリメトキシシラン、ならびに、(3-メルカプトプロピル)-メチル-ジメトキシシラン、アリルトリクロロクロロシラン、7-オクタ-1-エニルトリクロロクロロシラン、あるいはビス(3-トリメトキシシリルプロピルアミン)を含む。
本明細書に記載されるコーティング材料に含まれる典型的な受動剤は、限定されないが、ペルフロオロオクチルトリクロロシラン;トリデカフルオロ-1,1,2,2-テトラヒドロオクチル)トリクロロシラン;1H,1H,2H,2H-フルオロオクチルトリエトキシシラン(FOS);トリクロロ(1H,1H,2H,2H -ペルフロオロオクチル)シラン;tert-ブチル-[5-フルオロ-4-(4,4,5,5-テトラメチル-1,3,2-ジオキサボロラン-2-イル)インドール-1-イル]-ジメチル-シラン;CYTOP(商標);フロリナート(商標);ペルフロオロオクチルトリクロロシラン(PFOTCS);ペルフロオロオクチルジメチルクロロシラン(PFODCS);ペルフロオロデシルトリエトキシシラン(PFDTES);ペンタフルオロフェニル-ジメチルプロピルクロロ-シラン(PFPTES);ペルフロオロオクチルトリエトキシシラン;ペルフロオロオクチルトリメトキシシラン;オクチルクロロシラン;ジメチルクロロ-オクトデシル-シラン;メチルジクロロ-オクトデシル-シラン;トリクロロ-オクトデシル-シラン;トリメチル-オクトデシル-シラン;トリエチル-オクトデシル-シラン;または、オクタデシルトリクロロシランを含む。
いくつかの例では、官能基化剤は、オクタデシルトリクロロシランなどの炭化水素シランを含む。いくつかの例では、官能基化剤は、11-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシラン、(3-アミノプロピル)トリメトキシシラン、(3-アミノプロピル)トリエトキシシラン、グリシジルオキシプロピル/トリメトキシシランおよびN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドを含む。
ポリヌクレオチド合成
ポリヌクレオチド合成のための本開示の方法は、ホスホラミダイト化学を含むプロセスを含み得る。いくつかの例では、ポリヌクレオチド合成は、塩基をホスホラミダイトと結合することを含む。ポリヌクレオチド合成は、結合条件下でホスホラミダイトの堆積によって塩基を結合することを含んでもよく、ここで、同じ塩基が、随意に、1回を超えて、すなわち、二重の結合でホスホラミダイトとともに堆積される。ポリヌクレオチド合成は、未反応の部位のキャッピングを含んでもよい。いくつかの例では、キャッピングは随意である。ポリヌクレオチド合成はまた、酸化または酸化工程を含んでもよい。ポリヌクレオチド合成は、非ブロック化、脱トリチル化、および硫化を含んでもよい。いくつかの例では、ポリヌクレオチド合成は、酸化または硫化のいずれかを含む。いくつかの例では、ポリヌクレオチド合成反応中の1つまたは各々の工程間で、装置は、例えば、テトラゾールまたはアセトニトリルを使用して洗浄される。ホスホラミダイト合成方法における任意の1工程に対する時間枠は、約2分、1分、50秒、40秒、30秒、20秒および10秒より短くてもよい。
ホスホラミダイト方法を使用するポリヌクレオチド合成は、亜リン酸塩トリエステル結合の形成のために成長しているポリヌクレオチド鎖へのホスホラミダイトの基礎的要素(例えば、ヌクレオシドホスホラミダイト)のその後の追加を含んでもよい。ホスホラミダイトポリヌクレオチド合成は、3’から5’の方向に進む。ホスホラミダイトポリヌクレオチド合成は、1つの合成サイクル当たり、成長しているポリヌクレオチド鎖への1つのヌクレオチドの制御された追加を可能にする。いくつかの例では、各合成サイクルは結合工程を含む。ホスホラミダイト結合は、活性化されたヌクレオシドホスホラミダイトと、例えばリンカーを介して基質に結合されたヌクレオシドとの間の亜リン酸塩トリエステル結合の形成を含む。いくつかの例では、ヌクレオシドホスホラミダイトは、起動された装置に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、アクチベーター(activator)と共に装置に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、基質に結合されたヌクレオシドよりも1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍、またはそれ以上の過剰量で、装置に提供される。いくつかの例では、ヌクレオシドホスホラミダイトの追加は、無水環境において、例えば、無水アセトニトリルにおいて実行される。ヌクレオシドホスホラミダイトの追加に続いて、装置は随意に洗浄される。いくつかの例では、結合工程は、随意に、基質へのヌクレオシドホスホラミダイトの添加間の洗浄工程とともに、さらに1回以上繰り返される。いくつかの例では、本明細書で使用されるポリヌクレオチド合成方法は、1、2、3、またはそれ以上の連続する結合工程を含む。多くの場合において、結合前に、装置に結合されたヌクレオシドは、保護基の除去によって脱保護され、ここで、該保護基は重合を防ぐように機能する。一般的な保護基は、4,4’-ジメトキシトリチル(DMT)である。
結合の後、ホスホラミダイトポリヌクレオチド合成方法は、随意にキャッピング工程を含む。キャッピング工程では、成長しているポリヌクレオチドは、キャッピング剤で処置される。キャッピング工程は、さらなる鎖伸長からの結合後に未反応の基質に結合した5’-OH基をブロックするのに有用であり、内部塩基欠失(internal base deletions)を伴うポリヌクレオチドの形成を防ぐ。さらに、1H-テトラゾールで活性化されたホスホラミダイトは、わずかにグアノシンのO6位置と反応する可能性がある。理論に縛られることなく、I2/水で酸化すると、この副産物は、恐らくO6-N7遊走を介して、脱プリン化を受けることもある。脱プリン部位は、結局、ポリヌクレオチドの最終的な脱保護の間に切断され、したがって、完全長の産物の収率を低下させる。O6修飾は、I2/水での酸化前にキャッピング剤を用いた処置によって除去され得る。いくつかの例では、ポリヌクレオチド合成中にキャッピング工程を含めることで、キャッピングなしでの合成と比較して、エラー率が低下する。一例として、キャッピング工程は、無水酢酸と1-メチルイミダゾールとの混合物で、基質に結合したポリヌクレオチドを処置することを含む。キャッピング工程に続いて、装置は随意に洗浄される。
いくつかの例では、ヌクレオシドホスホラミダイトの添加後に、および随意にキャッピング工程および1以上の洗浄工程後に、装置に結合した成長しているポリヌクレオチドは酸化される。酸化工程は、亜リン酸塩トリエステルが、自然発生のリン酸ジエステルのヌクレオシド間の結合の保護された前駆体である、四配位リン酸塩トリエステルへと酸化される。いくつかの例では、成長しているポリヌクレオチドの酸化は、随意に弱塩基(例えば、ピリジン、ルチジン、コリジン)の存在下で、ヨウ素および水での処置によって達成される。酸化は、例えば、tert-ブチルヒドロペルオキシドまたは(1S)-(+)-(10-カンファースルホニル)-オキサジリジン(CSO)を使用して、無水条件下で実行され得る。いくつかの方法では、キャッピング工程は、酸化に続いて実行される。持続し得る酸化からの残留水が続く結合を阻害することができるため、第2のキャッピング工程は装置の乾燥を可能にする。酸化後に、装置と成長しているポリヌクレオチドは、随意に洗浄される。いくつかの例では、酸化の工程は、ポリヌクレオチドホスホロチオエートを得る硫化工程に置き換えられ、ここで、任意のキャッピング工程は硫化後に実行され得る。限定されないが、3-(ジメチルアミノメチリデン)アミノ)-3H-1,2,4-ジチアゾール-3-チオン、DDTT、Beaucage試薬としても知られている3H-1,2-ベンゾジチオール-3-オン1,1-ジオキシド、およびN,N,N’N’テトラエチルチウラムジスルフィド(TETD)を含む、多くの試薬が、効率的な硫黄移動を行うことができる。
ヌクレオシド取り込みのその後のサイクルが結合を介して生じるようにするために、装置に結合した成長しているポリヌクレオチドの保護された5’末端は除去され、その結果、一次ヒドロキシル基が次のヌクレオシドホスホラミダイトと反応する。いくつかの例では、保護基はDMTであり、ジクロロメタン中でのトリクロロ酢酸で非ブロック化が生じる。長時間にわたる、または推奨された酸の溶液よりも強力な脱トリチル化を行うことで、固体の支持体に結合したポリヌクレオチドの脱プリン化の増大につながり、ゆえに、望ましい完全長の産物の収率を低下させることがある。本明細書に記載される開示の方法および組成物は、望ましくない脱プリン化反応を制限する制御された非ブロック化条件を提供する。いくつかの例では、装置に結合したポリヌクレオチドは、非ブロック化後に洗浄される。いくつかの例では、非ブロック化後の効率的な洗浄は、低いエラー率を有する合成されたポリヌクレオチドに寄与する。
ポリヌクレオチドの合成のための方法は、典型的には以下の工程の一連の繰り返し(iterating sequence)を含む:活性化された表面、リンカー、または以前に脱保護された単量体のいずれかと結合するために、保護された単量体の活発に官能化された表面(例えば、遺伝子座)への適用;後に適用される保護された単量体と反応するように、適用された単量体の脱保護;および結合のための別の保護された単量体の適用。1以上の中間工程は、酸化または硫化を含む。いくつかの例では、1以上の洗浄工程は、工程の1つまたはすべてに先行するかまたはそれらに続く。
ホスホラミダイトベースのポリヌクレオチド合成のための方法は、一連の化学的な工程を含む。いくつかの例では、合成方法の1以上の工程は、試薬のサイクリングを含み、ここで、方法の1以上の工程は、工程に有用な試薬の装置への適用を含む。例えば、試薬は、一連の液体堆積および真空乾燥の工程によって循環させられる。ウェル、マイクロウェル、チャネルなどの三次元の特徴を含む基質のために、試薬は、随意にウェルおよび/またはチャネルを介して装置の1つ以上の領域に通される。
本明細書に記載される方法およびシステムは、ポリヌクレオチドの合成のためのポリヌクレオチド合成装置に関する。合成は平行して行われ得る。例えば、少なくともまたはおよそ少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、10000、50000、75000、100000、またはそれ以上のポリヌクレオチドが平行して合成可能である。平行して合成され得るポリヌクレオチドの総数は、2-100000、3-50000、4-10000、5-1000、6-900、7-850、8-800、9-750、10-700、11-650、12-600、13-550、14-500、15-450、16-400、17-350、18-300、19-250、20-200、21-150、22-100、23-50、24-45、25-40、30-35であり得る。当業者は、平行して合成されたポリヌクレオチドの総数が、これらの値のいずれかによって制約される任意の範囲内(例えば、25-100)に含まれ得ることを認識する。平行して合成されたポリヌクレオチドの総数は、範囲のエンドポイントとして機能する値のいずれかによって定義された任意の範囲内に含まれ得る。装置内で合成されたポリヌクレオチドの総モル質量またはポリヌクレオチドの各々のモル質量は、少なくともまたは少なくとも約10、20、30、40、50、100、250、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、25000、50000、75000、100000ピコモル、またはそれ以上であり得る。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、少なくともまたは少なくとも約10、15、20、25、30、35、40、45、50、100、150、200、300、400、500のヌクレオチド、またはそれ以上であり得る。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、長くてもまたは長くても約500、400、300、200、150、100、50、45、35、30、25、20、19、18、17、16、15、14、13、12、11、10のヌクレオチド、またはそれ以下であり得る。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、10-500、9-400、11-300、12-200、13-150、14-100、15-50、16-45、17-40、18-35、19-25の間であり得る。当業者は、装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長が、これらの値のいずれかによって制約される任意の範囲内(例えば、100-300)に含まれ得ることを認識する。装置内のポリヌクレオチドの各々の長さまたはポリヌクレオチドの平均長は、範囲のエンドポイントとして機能する値のいずれかによって定義された任意の範囲内に含まれ得る。
本明細書で提供される表面上でのポリヌクレオチド合成の方法は、高速の合成を可能にする。一例として、1時間につき少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45 50、55、60、70、80、90、100、125、150、175、200のヌクレオチド、またはそれ以上が合成される。ヌクレオチドは、アデニン、グアニン、チミン、シトシン、ウリジンの構築ブロック、またはそれらのアナログ/修飾されたバージョンを含む。いくつかの例において、ポリヌクレオチドのライブラリーは基質上で平行して合成される。例えば、約または少なくとも約100;1,000;10,000;30,000;75,000;100,000;1,000,000;2,000,000;3,000,000;4,000,000;または5,000,000の分解された遺伝子座を含む装置は少なくとも同じ数の別個のポリヌクレオチドの合成を支持することができ、ここで、別個の配列をコードするポリヌクレオチドは分解された遺伝子座で合成される。いくつかの例において、ポリヌクレオチドのライブラリーは、約3か月、2か月、1か月、3週、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日、24時間未満、またはそれ以下で、本明細書に記載される低いエラー率で装置上で合成される。いくつかの例において、本明細書に記載される基質および方法を用いて低いエラー率で合成されるポリヌクレオチドライブラリーから組み立てられる大きな核酸は、約3か月、2か月、1か月、3週、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日、24時間未満、またはそれ以下で調製される。
いくつかの例において、本明細書に記載される方法は、複数のコドン部位にて異なる変異体核酸を含む、核酸のライブラリーの生成をもたらす。いくつかの例において、核酸は、変異体コドン部位の1つの部位、2つの部位、3つの部位、4つの部位、5つの部位、6つの部位、7つの部位、8つの部位、9つの部位、10の部位、11の部位、12の部位、13の部位、14の部位、15の部位、16の部位、17の部位、18の部位、19の部位、20の部位、30の部位、40の部位、50の部位、またはそれ以上の部位を有し得る。
いくつかの例において、変異体コドン部位の1以上の部位は隣接することがある。変異体コドン部位の1以上の部位は隣接しないこともあり、1、2、3、4、5、6、7、8、9、10、またはそれ以上のコドンによって分離されることもある。
いくつかの例において、核酸は変異体コドン部位の複数の部位を含むことがあり、ここで、すべての変異体コドン部位は互いに隣接しており、変異体コドン部位の伸長部を形成する。いくつかの例において、核酸は変異体コドン部位の複数の部位を含んでもよく、ここで、変異体コドン部位は互いに隣接していない。いくつかの例において、核酸は変異体コドン部位の複数の部位を含んでもよく、ここで、いくつかの変異体コドン部位は互いに隣接しており、変異体コドン部位の伸長部を形成し、および、変異体コドン部位の一部は互いに隣接していない。
図面を参照すると、図15は、より短いポリヌクレオチドからの核酸(例えば遺伝子)の合成のための例示的なプロセスのワークフローを示す。ワークフローは通常、以下の段階に分けられる:(1)一本鎖ポリヌクレオチド酸ライブラリーのデノボ合成、(2)より大きな断片を形成するためのポリヌクレオチドの結合、(3)エラー補正、(4)品質管理、および(5)輸送。デノボ合成に先立って、意図した核酸配列、または核酸配列の群が、あらかじめ選択される。例えば、遺伝子の群が生成のためにあらかじめ選択される。
いったん生成のためにより大きな核酸が選択されると、ポリヌクレオチドのあらかじめ決められたライブラリーがデノボ合成のために設計される。高密度のポリヌクレオチドアレイを生成するための様々な適切な方法が知られている。ワークフローの例において、装置の表層(1501)が提供される。この例において、表面の化学的性質(chemistry)は、ポリヌクレオチド合成プロセスを改善するために変えられる。低い表面エネルギーの領域が液体を弾くために生成され、一方で高い表面エネルギーの領域が液体を引き付けるために生成される。表面自体は、平坦な表面の形であるか、あるいは、表面積を増大させる突起またはマイクロウェルなどの形状の変形を含み得る。ワークフローの例において、全体において参照により本明細書に組み込まれる国際特許出願公開WO/2015/021080に開示されるように、選択された高い表面エネルギー分子は、DNAの化学的性質を支持する二元機能に役立つ。
ポリヌクレオチドアレイのインサイチュの調製は、固体の支持体上で生成され、平行して複数のオリゴマーを伸長させるために単一のヌクレオチド伸長プロセスを利用する。材料堆積装置などの堆積装置は、段階的な様式で試薬を放出するように設計され、その結果、複数のポリヌクレオチドが平行して、一度に1つの残基を伸長させて、あらかじめ決められた核酸配列を持つオリゴマーを生成する(1502)。いくつかの例において、ポリヌクレオチドはこの段階で表面から切断される。切断は、例えばアンモニアまたはメチルアミンによる気相切断(gas cleavage)を含む。
生成されたポリヌクレオチドライブラリーは反応チャンバに配される。この例示的なワークフローにおいて、反応チャンバ(「ナノリアクター」とも呼ばれる)は、シリコンでコーティングされたウェルであり、それは、PCR試薬を含み、ポリヌクレオチドライブラリー上へと降ろされる(1503)。ポリヌクレオチドの密閉(1504)の前または後に、試薬を加えて、基質からポリヌクレオチドを放出させる。例示的なワークフローにおいて、ポリヌクレオチドは、ナノリアクターの密閉後に放出される(1505)。いったん放出されると、一本鎖ポリヌクレオチドの断片を、DNAの完全長範囲の配列に広がるためにハイブリダイズする。各合成されたポリヌクレオチドは、集団中の少なくとも1つの他のポリヌクレオチドと重なる小さな部分を持つように設計されるため、部分的なハイブリダイゼーション(1505)が可能となる。
ハイブリダイゼーション後、PCA反応が始まる。ポリメラーゼサイクル中、ポリヌクレオチドは相補的断片にアニーリングされ、ギャップがポリメラーゼによって埋められる。各サイクルは、どのポリヌクレオチドが互いに見つけるかにランダムに依存して、様々な断片の長さを増加させる。断片間の相補性は、二本鎖DNAの完全な大きな全長の形成を可能にする(1506)。
PCAが完了した後、ナノリアクターは装置から分離され(1507)、PCRのためのプライマーを持つ装置との相互作用のために位置付けられる(1508)。密閉後、ナノリアクターはPCRにさらされ(1509)、より大きな核酸が増幅される。PCR(1510)の後、ナノチャンバが開放され(1511)、エラー補正試薬が加えられ(1512)、該チャンバが密封され(1513)、エラー補正反応が生じて、二本鎖PCR増幅生成物からの相補性が乏しいミスマッチ塩基対および/または鎖を取り除く(1514)。ナノリアクターが開放されて分離される(1515)。エラーを補正した生成物は次に、PCRおよび分子バーコーディングなどの付加的な処理工程にさらされ、その後、輸送(1523)のために包装される(1522)。
いくつかの例において、品質管理手段が取られる。エラー補正の後、品質管理工程は、例えば、エラーを補正した生成物の増幅のための配列決定プライマーを有するウェーハとの相互作用(1516)、エラーを補正した増幅生成物を含むチャンバにウェーハを密封すること(1517)、および、さらなる回数の増幅を行うこと(1518)を含む。ナノリアクターは開放され(1519)、生成物はプールされ(1520)、配列決定される(1521)。許容可能な品質管理の決定が行われた後、包装された生成物(1522)は輸送(1523)を承認される。
いくつかの例において、図15のようなワークフローによって生成されるポリヌクレオチドは、本明細書に開示される重複プライマーを使用した突然変異誘発にさらされる。いくつかの例において、プライマーのライブラリーは、固体の支持体上でインサイチュの調製によって生成され、平行して複数のオリゴマーを伸長させるための単一のヌクレオチド伸長プロセスを利用する。材料堆積装置などの堆積装置は、段階的な様式で試薬を放出するように設計され、その結果、複数のポリヌクレオチドが平行して、一度に1つの残基を伸長させて、あらかじめ決められた配列を持つオリゴマーを生成する(1502)。
コンピュータシステム
本明細書に記載のシステムのいずれも、コンピュータに操作可能に連結され得、コンピュータを介して局所的にまたは遠隔で自動操作され得る。様々な例において、本開示の方法およびシステムはさらに、コンピュータシステム上のソフトウェアプログラム、およびその使用を含み得る。従って、材料堆積装置の動作、分配行為、および減圧の作動を編成および同期するなどの分配/減圧/再充填の機能の同期のためのコンピュータ制御は、本開示の範囲内にある。コンピュータシステムは、ユーザーに指定された塩基配列と材料堆積装置の位置との間に干渉するようにプログラムされ、基質の指定された領域に正確な試薬を送達する。
図16で例証されるコンピュータシステム(1600)は、媒体(1611)および/または固定された媒体(1612)を持つサーバー(1609)に随意に接続可能なネットワークポート(1605)からの命令を読み出すことが可能である、論理的な装置として理解され得る。図16に示されるようなシステムは、CPU(1601)、ディスクドライブ(1603)、キーボード(1615)および/またはマウス(1616)などの随意の入力装置、ならびに随意のモニター(1607)を含み得る。データ通信は、局所位置または遠隔位置のサーバーへの示された通信媒体を介して達成され得る。通信媒体は、データを送信および/または受信する任意の手段を含み得る。例えば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続であり得る。そのような接続は、ワールド・ワイド・ウェブ上での通信を提供することができる。本開示に関するデータは、図16に例証されるように、当事者(1622)による受信および/またレビューのために、そのようなネットワークあるいは接続によって伝達され得る。
図17は、本開示の例と関連して使用可能なコンピュータシステム(1700)の第1の例のアーキテクチャを例証するブロック図である。図17に表されるように、コンピュータシステムの例は、命令を処理するためのプロセッサ(1702)を含み得る。プロセッサの非限定的な例は、以下を含む:Intel Xeon(商標)プロセッサ、AMD Opteron(商標)プロセッサ、Samsung 32-bit RISC ARM 1176JZ(F)-S v1.0(商標)プロセッサ、ARM Cortex-A8 Samsung S5PC100(商標)プロセッサ、ARM Cortex-A8 Apple A4(商標)プロセッサ、Marvell PXA 930(商標)プロセッサ、または機能的に同等なプロセッサ。実行の複数のスレッドが並列処理に使用可能である。いくつかの例において、複数のプロセッサ、または複数のコアを持つプロセッサはまた、単一のコンピュータシステム中であろうと、クラスターの中であろうと、あるいは、複数のコンピュータ、携帯電話、および/または個人用携帯情報端末装置を含むネットワーク上のシステムにわたって分布されていようと、使用可能である。
図17に例証されるように、高速キャッシュ(1704)は、プロセッサ(1702)に接続されるか、またはその中に組み込まれることで、プロセッサ(1702)により近年使用されてきたまたは頻繁に使用されている命令またはデータのための高速メモリを提供することができる。プロセッサ(1702)は、プロセッサバス(1708)によってノースブリッジ(1706)に接続される。ノースブリッジ(1706)は、メモリーバス(1712)によってランダムアクセスメモリ(RAM)(1710)に接続され、プロセッサ(1702)によってRAM(1710)へのアクセスを管理する。ノースブリッジ(1706)はまた、チップセットバス(1716)によってサウスブリッジ(1714)に接続される。サウスブリッジ(1714)は、順に、周辺バス(1718)に接続される。周辺バスは、例えば、PCI、PCI-X、PCI Express、または他の周辺バスであり得る。ノースブリッジおよびサウスブリッジは、しばしば、プロセッサチップセットと呼ばれ、プロセッサ、RAM、および周辺バス(1718)上の周辺コンポーネントの間のデータ転送を管理する。いくつかの代替的なアーキテクチャにおいて、ノースブリッジの機能は、別個のノースブリッジチップを使用する代わりにプロセッサに組み込まれ得る。いくつかの例においては、システム(1700)は、周辺バス(1718)に取り付けられるアクセラレータカード(1722)を含み得る。アクセラレータは、フィールドプログラマブルゲートアレイ(FPGA)または特定の処理を促進するための他のハードウェアを含んでもよい。例えば、アクセラレータは、適応データの再構成のために、または拡張された設定処理に使用される代数式を評価するために使用され得る。
ソフトウェアおよびデータは外部記憶装置(1724)に記憶され、プロセッサによる使用のためにRAM(1710)および/またはキャッシュ(1704)へとロードされ得る。システム(1700)は、システムリソースを管理するためのオペレーティングシステムを含み;オペレーティングシステムの非限定的な例は、以下を含む:Linux(登録商標)、Windows(商標)、MACOS(商標)、BlackBerry OS(商標)、iOS(商標)、および他の機能的に同等なオペレーティングシステム、ならびに、本開示の例に従ってデータの記憶と最適化を管理するためのオペレーティングシステム上で実行するアプリケーションソフトウェア。この例において、システム(1700)はまた、ネットワーク接続ストレージ(NAS)などの外部記憶装置、および分散並列処理に使用され得る他のコンピュータシステムにネットワークインターフェースを提供するために、周辺バスに接続されるネットワークインターフェースカード(NIC)(1720)ならびに(1721)を含む。
図18は、複数のコンピュータシステム(1802a)および(1802b)、複数の携帯電話および個人用携帯情報端末(1802c)、ならびにネットワークアタッチトストレージ(NAS)(1804a)および(1804b)を備えるネットワーク(1800)を示す略図である。例において、システム(1802a)、(1802b)、および(1802c)は、データ記憶を管理し、ネットワークアタッチトストレージ(NAS)(1804a)および(1804b)に記憶されたデータへのデータアクセスを最適化することができる。数学モデルがこのデータのために使用され、コンピュータシステム(1802a)および(1802b)、ならびに携帯電話と個人用携帯情報端末システム(1802c)にわたる分散並列処理を使用して評価され得る。コンピュータシステム(1802a)および(1802b)、ならびに携帯電話と個人用携帯情報端末システム(1802c)はまた、ネットワークアタッチトストレージ(NAS)(1804a)および(1804b)に記憶されたデータの適応データ再構築のために並列処理を提供することができる。図18は一例を例証するにすぎず、様々な他のコンピュータのアーキテクチャおよびシステムが、本開示の様々な例とあわせて使用され得る。例えば、ブレードサーバーは並列処理を提供するために使用され得る。プロセッサブレードは、並列処理を提供するためにバックプレーンを介して接続可能である。ストレージも、バックプレーンに接続され得るか、または別のネットワークインターフェースを介してネットワークアタッチトストレージ(NAS)として接続可能である。いくつかの例において、プロセッサは、別個のメモリ空間を維持し、ネットワークインターフェース、バックプレーン、または他のプロセッサによる並列処理のための他のコネクターを介してデータを伝達することができる。他の例において、プロセッサの一部または全てが、共有仮想アドレスメモリ空間を使用することができる。
図19は、例に従って共有仮想アドレスメモリ空間を使用したマルチプロセッサコンピュータシステム(1900)のブロック図である。該システムは、共有メモリサブシステム(1904)にアクセスすることができる複数のプロセッサ(1902a)-(1902f)を含む。該システムは、複数のプログラム可能なハードウェアメモリアルゴリズムプロセッサ(MAP)(1906a)-(1906f)を共有メモリサブシステム(1904)に組み込む。MAP(1906a)-(1906f)はそれぞれ、メモリ(1908a)-(1908f)および1つ以上のフィールドプログラマブルゲートアレイ(FPGA)(1910a)-(1910f)を含むことができる。MAPは、設定可能な機能ユニットを提供し、特定のアルゴリズムまたはアルゴリズムの一部が、それぞれのプロセッサとの密に協働した処理のためにFPGA(1910a)-(1910f)に提供され得る。例えば、MAPは、データモデルに関する代数式を評価し、かつ例における適応性のあるデータの再構築を行うために使用され得る。この例において、このような目的のために、プロセッサの全てが世界規模で各MAPにアクセスすることができる。1つの構成において、各MAPは、関連するメモリ(1908a)-(1908f)にアクセスするためにダイレクトメモリアクセス(DMA)を使用することができ、それにより、各マイクロプロセッサ(1902a)-(1902f)とは別個にかつ非同期的にタスクを実行することが可能となる。この構成において、MAPは、アルゴリズムのパイプライン処理(pipelining)および並列実行のために他のMAPに直接結果を供給することができる。
上記のコンピュータのアーキテクチャおよびシステムは単なる例に過ぎず、様々な他のコンピュータ、携帯電話、ならびに、個人用携帯情報端末のアーキテクチャとシステムが、一般的なプロセッサ、コプロセッサ、FPGA、および他のプログラム可能論理回路の任意の組み合わせを使用するシステム、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、ならびに他の処理要素と論理素子を含む例と共に使用可能である。いくつかの例において、コンピュータシステムの全てまたは一部は、ソフトウェアまたはハードウェアに実装され得る。様々なデータ記憶媒体が、ランダムアクセスメモリ、ハードドライブ、フラッシュメモリ、テープドライブ、ディスクアレイ、ネットワークアタッチトストレージ(NAS)、および他のローカルまたは分散データ記憶装置およびシステムを含む例と共に使用され得る。
例において、コンピュータシステムは、上記のまたは他のコンピュータのアーキテクチャおよびシステムのいずれかで実行されるソフトウェアモジュールを使用して実施可能である。他の例において、システムの機能は、ファームウェア、図19で言及されるようなフィールドプログラマブルゲートアレイ(FPGA)などのプログラム可能論理回路、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、または他の処理要素および論理素子において部分的または完全に実装され得る。例えば、セットプロセッサおよびオプティマイザは、図17に例証されるアクセラレータカード(1722)などのハードウェアアクセラレータカードを介するハードウェアアクセラレーションを用いて実施され得る。
以下の実施例は、本明細書に開示される実施形態の原理および実践をより明白に当業者に例証するために記載され、任意の請求された実施形態の範囲を制限するものとして解釈されるものではない。他に明示されない限り、全ての部分およびパーセンテージは重量基準である。
以下の実施例は、本開示の様々な実施形態を示すために提供されるものであり、本開示をいかなる様式でも制限することを意図するものではない。本明細書に記載される方法とともに、本実施例は、好ましい実施形態を示すとともに典型的なものであり、本開示の範囲を限定するものとして意図されない。請求項の範囲によって定義される本開示の精神内に包含される本明細書での変更およびその他の使用が当業者に想到されるだろう。
実施例1:装置表面の官能化
ポリヌクレオチドのライブラリーの結合および合成を支持するために装置を官能化した。装置表面をまず、20分間、90%のHSOおよび10%のHを含むピラニア溶液を使用して湿式洗浄した。装置を、DI水を含むいくつかのビーカー中ですすぎ、DI水のグーズネック形状の蛇口の下で5分間保持して、Nで乾燥させた。その後、装置をNHOH(1:100;3mL:300mL)に5分間浸し、ハンドガン(handgun)を使用してDI水ですすぎ、DI水を含む3つの連続するビーカーの中でそれぞれ1分間浸し、次に、ハンドガンを使用してDI水で再びすすいだ。その後、装置表面をOにさらすことにより装置をプラズマ洗浄した。SAMCO PC-300機器を使用して、下流モードで1分間、250ワットでOをプラズマエッチングした。
以下のパラメータでYES-1224P蒸着オーブンシステムを使用して、清潔になった装置表面をN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドを含む溶液で活発に官能化した:0.5から1トル、60分、70℃、135℃の気化器。Brewer Science 200X スピンコータを使用して、装置表面をレジストコーティングした(resist coated)。SPR(商標)3612フォトレジストを、40秒間2500rpmで装置上でスピンコーティングした。装置を、Brewerホットプレート上で90℃で30分間あらかじめ焼いた。Karl Suss MA6 マスクアライナー機器を使用して、装置をフォトリソグラフィーにさらした。装置を2.2秒間さらして、MSF 26Aの中で1分間展開させた(developed)。残りの展開剤(developer)をハンドガンですすぎ、装置を5分間水に浸した。装置をオーブン内で100℃で30分間焼き、その後、Nikon L200を使用してリソグラフィーの欠損について目視検査を行った。清浄工程を使用し、SAMCO PC-300機器を用いて残りのレジストを取り除き、1分間250ワットでOプラズマエッチングした。
装置表面を、10μLの軽油と混合した100μLのペルフルオロオクチルトリクロロシラン溶液で受動的に官能化した。装置をチャンバに配し、10分間ポンプでくみ出し、その後、バルブを閉じてポンプを止め、10分間放置した。チャンバを通気した。最大パワー(Crestシステム上で9)での超音波処理によって70℃で500mLのNMPで5分間、2回の浸漬を行うことにより、装置をレジスト剥離した。その後、最大パワーでの超音波処理により室温で500mLのイソプロパノール中に5分間、装置を浸した。装置を、300mLの200プルーフエタノール(200 proof ethanol)に漬けて、Nで送風乾燥した。官能化した表面を活性化させて、ポリヌクレオチド合成のための支持体として機能させた。
実施例2:50量体の配列の合成
二次元オリゴヌクレオチド合成装置をフローセルに組み入れ、フローセル(Applied Biosystems (ABI394 DNA Synthesizer))に接続させた。N-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミド(Gelest)で二次元オリゴヌクレオチド合成装置を均一に官能化し、これを使用して、本明細書に記載されるポリヌクレオチド合成方法を用いて50bpの例示的なポリヌクレオチド(「50量体のポリヌクレオチド」)を合成した。
50量体の配列は、SEQ ID NO.:20に記載される通りである。5’AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGACTTCGGCAT##TTTTTTTTTT3’(SEQ ID NO.: 20)、ここで、#は、チミジン-スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP-2244)を表わし、これは、脱保護中に表面からのポリヌクレオチドの放出を可能にする切断可能なリンカーである。
表4のプロトコルおよびABIシンセサイザーに従って標準的なDNA合成化学(結合、キャッピング、酸化、および非ブロック化)を使用して、合成を行った。
ホスホラミダイト/活性化因子の組み合わせを、フローセルを介したバルク試薬の送達と同様に送達した。環境が試薬によってずっと「湿った」ままであるため、乾燥工程を行わなかった。
フローリストリクターをABI 394シンセサイザーから取り除き、より速い流れを可能した。フローリストリクターなしで、アミダイト(ACN中で0.1M)、アクチベーター(ACN中で0.25Mのベンゾイルチオテトラゾール(「BTT」;GlenResearchの30-3070-xx))、およびOx(20%のピリジン、10%の水、および70%のTHF中の0.02MのI2)の流量は、およそ~100uL/秒、アセトニトリル(「ACN」)ならびにキャッピング試薬(CapAとCapBの1:1の混合物、ここで、CapAはTHF/ピリジン中の無水酢酸であり、CapBはTHF中の16%の1-メチルイミダゾール(methylimidizole))についてはおよそ~200uL/秒、および、Deblock(トルエン中の3%のジクロロ酢酸)についてはおよそ~300uL/秒(フローリストリクターを伴う全ての試薬についての~50uL/秒と比較して)であった。酸化剤(Oxidizer)を完全に押し出す時間を観察し、化学フロー時間のタイミングを適宜調整し、余分なACN洗浄を様々な化学物質間に導入した。ポリヌクレオチド合成の後、75psiで、ガス状のアンモニア中でチップを夜通し脱保護した。表面に水を5滴加えて、ポリヌクレオチドを再生した。その後、再生したポリヌクレオチドを、BioAnalyzerの小さなRNAチップで分析した(データは示されていない)。
実施例3:100量体の配列の合成
50量体の配列の合成について実施例2に記載されるのと同じプロセスを、2つの異なるシリコンチップ上で100量体のポリヌクレオチド(「100量体のポリヌクレオチド」;5’CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3’、ここで、#はチミジン-スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP-2244)を表わす;SEQ ID NO:21)の合成に使用し、一方のシリコンチップをN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドで均一に官能化し、他方のシリコンチップを11-アセトキシウンデシルトリエトキシシランとn-デシルトリエトキシシランの5/95の混合物で官能化し、ならびに、表面から抽出されたポリヌクレオチドを、BioAnalyzer機器上で分析した(データは示されていない)。
以下の熱サイクルプログラムを使用して、50uLのPCR混合物(25uLのNEB Q5 mastermix、2.5uLの10uMフォワードプライマー、2.5uLの10uMリバースプライマー、表面から抽出した1uLのポリヌクレオチド、および最大50uLの水)中で、フォワードプライマー(5’ATGCGGGGTTCTCATCATC3’;SEQ ID NO.:22)およびリバースプライマー(5’CGGGATCCTTATCGTCATCG3’;SEQ ID NO.:23)を使用して、2つのチップからの10のサンプル全てをさらに増幅した:
98°C、30秒
98°C、10秒;63°C、10秒;72°C、10秒;12サイクルを繰り返す
72°C、2分。
PCR生成物もまた、BioAnalyzer上で実行して(データは示されず)、100量体の位置での急なピークを示した。次に、PCR増幅サンプルをクローン化し、サンガーシーケンシングを行った(Sanger sequence)。表5は、チップ1のスポット1-5から得たサンプル、およびチップ2のスポット6-10から得たサンプルについて、サンガーシーケンシングから生じる結果を要約する。
故に、高品質および高均一性の合成されたポリヌクレオチドを、異なる表面の化学的性質を持つ2つのチップ上で繰り返した。全体として、配列決定された100量体の262のうち233に対応する89%が、エラーのない完全な配列であった。最後に、表6は、スポット1-10のポリヌクレオチドサンプルから得た配列についてのエラー特徴を要約する。
実施例4:単一の部位、単一の位置の突然変異誘発による核酸ライブラリーの生成
一連のPCR反応に使用されるポリヌクレオチドプライマーをデノボ合成し、鋳型核酸の核酸変異体のライブラリーを生成した(図2A-4Dを参照)。4つのタイプのプライマーを図4Aにおいて生成した:外側の5’プライマー(415)、外側の3’プライマー(430)、内側の5’プライマー(425)、および内側の3’プライマー(420)。表4で全体的に概説されるようなポリヌクレオチド合成方法を使用して、内側の5’プライマー/第1のポリヌクレオチド(420)および内側の3’プライマー/第2のポリヌクレオチド(425)を生成した。内側の5’プライマー/第1のポリヌクレオチド(420)は、あらかじめ決められた配列の最大19のプライマーのセットを表し、セット中の各プライマーは、配列の1つの部位での1つのコドンにおいて他とは異なる。
少なくとも2つのクラスターを有する装置上でポリヌクレオチド合成を行い、各クラスターは121の個々にアドレス可能な遺伝子座を有する。
内側の5’プライマー(425)および内側の3’プライマー(420)を別個のクラスター中で合成した。内側の5’プライマー(425)を121回複製し、単一のクラスター内の121の遺伝子座で伸長する。内側の3’プライマー(420)について、変異体配列のうち19のプライマーは、6つの異なる遺伝子座でそれぞれ伸長し、その結果、114の異なる遺伝子座で114のポリヌクレオチドの伸長が生じる。
合成されたポリヌクレオチドを、装置の表面から切断し、プラスチックバイアルに移した。図4Bで例証されるように、長い核酸配列(435)、(440)の断片を使用して第1のPCR反応を行い、鋳型核酸を増幅させた。図4C-4Dに例証されるように、鋳型としてプライマーの組み合わせと第1のPCR反応の生成物とを使用して、第2のPCR反応を行った。図20の追跡に示されるように、第2のPCR生成物の分析をBioAnalyzer上で行った。
実施例5:1つの位置の変異体の96の異なるセットを含む核酸ライブラリーの生成
図4Aで全体的に示されかつ実施例2で検討されるように、デノボポリヌクレオチド合成を使用して4つのセットのプライマーを生成した。内側の5’プライマー(420)について、プライマーの96の異なるセットを生成し、各セットのプライマーは、鋳型核酸の1つの部位内に位置する異なる1つのコドンを標的とする。各セットのプライマーについて、19の異なる変異体を生成し、各変異体は、1つの部位において異なるアミノ酸をコードするコドンを含む。図4A-4Dに全体的に示されかつ実施例2に記載されるように、生成されたプライマーを使用して2回のPCRを行った。100%の増幅成功率を算出するために使用されたエレクトロフェログラムにおいて、増幅産物の96のセットを視覚化した(図21)。
実施例6:1つの位置の変異体の500の異なるセットを含む、核酸ライブラリーの生成
図4Aで全体的に示され、実施例2で検討されるように、デノボポリヌクレオチド合成を使用して4つのセットのプライマーを生成した。内側の5’プライマー(420)について、500の異なるセットのプライマーを生成し、各セットのプライマーは、鋳型核酸の1つの部位内に位置する異なる1つのコドンを標的とする。各セットのプライマーについて、19の異なる変異体を生成し、各変異体は、1つの部位にて異なるアミノ酸をコードするコドンを含む。図4Aに全体的に示されかつ実施例2に記載されるように、生成されたプライマーを使用して2回のPCRを行った。エレクトロフォレトグラムは、異なる一つの部位に19の変異体を持つ核酸の集団を有する、PCR生成物の500のセットの各々を表示する(データは示されていない)。ライブラリーの包括的な配列決定の分析は、あらかじめ選択されたコドンの突然変異にわたって99%よりも高い成功率を示した(配列追跡と分析データは示されていない)。
実施例7:1つの位置に対する単一部位の突然変異誘発プライマー
コドン変異設計の一例を、Yellow Fluorescent Proteinについて表7で提供する。この場合、50量体の配列からの1つのコドンは、19回変異する。様々な核酸配列を太字で示す。野生型プライマー配列は、ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCAT(SEQ ID NO.: 1)である。この場合、野生型コドンは、SEQ ID NO:1における下線によって示されるバリンをコードする。それ故、以下の19の変異体は、バリンをコードするコドンを除外する。代替的な実施例において、トリプレットが全て考慮される場合、その後、60の変異体は全て、野生型コドンに対する代替的配列を含んで生成される。
実施例8:1つの部位、二重の位置の核酸変異体
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で行った。装置上の1つのクラスターを生成し、該クラスターは、1つの部位にある2つの連続するコドンの位置に対して核酸のあらかじめ決められた合成変異体を含有し、各位置はアミノ酸をコードするコドンである。この配置において、1つの位置当たり19の変異体を、各核酸の3つの複製を伴って2つの位置に対して生成し、合成された114の核酸が結果として得られた。
実施例9:複数の部位、二重の位置の核酸変異体
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で行った。装置上の1つのクラスターを生成し、該クラスターは、2つの非連続コドンの位置に対して核酸のあらかじめ決められた合成変異体を含有し、各位置はアミノ酸をコードするコドンである。この配置において、1つの位置当たり19の変異体を2つの位置に対して生成した。
実施例10:一続きの三重の位置の核酸変異体
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で行った。装置上の1つのクラスターを生成し、該クラスターは、3つの連続するコドン位置に対して参照核酸のあらかじめ定められた合成変異体を含有していた。3つの連続するコドン位置の配置において、1つの位置当たり19の変異体を、各核酸の2つの複製を伴って3つの位置に対して生成し、合成された114の核酸が結果として得られた。
実施例11:複数の部位、三重の位置の核酸変異体
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で行った。装置上の1つのクラスターを生成し、該クラスターは、少なくとも3つの非連続コドン位置に対して基準の核酸のあらかじめ定められた合成変異体を含有している。あらかじめ定められた領域内で、3つのヒスチジン残基をコードするコドンの位置が変化した。
実施例12:複数の部位、複数の位置の核酸変異体
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で行った。装置上の1つのクラスターを生成し、該クラスターは、一続き以上の1以上のコドン位置についての参照核酸のあらかじめ定められた合成変異体を含有していた。5つの位置がライブラリーにおいて変化した。第1の位置は、発現されたタンパク質において結果として生ずる50/50 K/Rの比率についてコドンをコードし;第2の位置は、発現されたタンパク質において結果として生ずる50/25/25 V/L/Sの比率についてコドンをコードし、第3の位置は、発現されたタンパク質において結果として生ずる50/25/25 Y/R/Dの比率についてコドンをコードし、第4の位置は、発現されたタンパク質における結果として生ずる全てのアミノ酸に対する等しい比率についてコドンをコードし、および第5の位置は、発現されたタンパク質において結果として生ずる75/25 G/Pの比率についてコドンをコードした。
実施例13:サンプリングによる核酸ライブラリーの生成
あらかじめ選択された分布を有する核酸の集団を生成するために、計算技術を使用した。例示的なあらかじめ選択された分布が下記の表8で提供され、数字が各位置での各アミノ酸の所望の割合を表す。累積分布値が初めに計算され、表9で見られるように0.0から1.0までの値をもたらした。Excelなどのプログラムでは、一様乱数ジェネレーターを使用して、サンプリング集団として使用される500の核酸について、10のアミノ酸位置の各々に対して0から1の間の値を作成した。例えば、位置1の場合、「0.95」の均一なランダム値は「S」バケットを属するため、アミノ酸「S」を表示する。この技術は「ルーレット盤」選択と呼ばれる。各設計されたオリゴヌクレオチドに対して10の離散分布から10の乱数を生成され;このプロセスを500回繰り返して、500の核酸のサンプル集団を生成した。その後、生成されたサンプル集団を検証するために、各アミノ酸がその位置で出現する頻度の集団にわたる合計を決定し、割合として表される。例えば、500の核酸のサンプル中の位置1でアミノ酸Cが現われる割合を計算した。値は集団中の近似分布を表す。集団中の十分な数の核酸を使用すると、サンプル分布はあらかじめ選択された分布に近かった。
実施例14:濾過されたサンプリングによる核酸ライブラリーの生成
実施例13に記載される方法を使用して、望ましくない組み合わせを除去し、かつ集団からそれらを濾過するために、集団のリサンプリングを実施した。例えば、任意の位置で4つの「H」(ヒスチジン)アミノ酸を有する組み合わせは、生物学的用途に適さないと考えられた。したがって、この例では、500番目のオリゴヌクレオチドが「HHHCCHHCHH(SEQ ID NO:55)」として生成される場合、その組み合わせは8つのHを有するために望ましくなかった。その結果、他のランダムに生成された組み合わせを、実施例13に記載される方法に従ってその場所で生成した。あらかじめ選択された分布を生成するために、任意の数の基準を使用した。例えば、任意の位置における各オリゴヌクレオチド中に少なくとも1つの「A」(アラニン)アミノ酸を含むように、集団を生成した。さらに、生成された組み合わせが互いに隣接している2つの「M」(メチオニン)アミノ酸を持たないように、集団を生成した。したがって、あらかじめ選択された分布および特定の基準が満たされるまで、ランダムサンプリングを実施した。
実施例15:均一な分布を有するコンビナトリアルライブラリー
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で行った。実施例4-6および8-12のように、変異体が各位置であらかじめ選択され、かつあらかじめ選択された分布を有する1つの部位または複数の部位でコドン変異をコードする核酸集団を生成した。
組み合わせの方法によって均一の変異体分布ライブラリーを生成するために、変異体ライブラリーの参照配列を2つの部分に分割した。本明細書で使用されるように均一の変異体分布は、各変異体がほぼ等しい量で合成されることを意味することを意図する。分割した一方の側は5’側と呼ばれ、分割した他方の側は3’側と呼ばれた。配列を、アニールされた時に所望の核酸ライブラリーが合成されるように、参照配列の各側について設計し合成した。表10と同様のバリエーションを有する均一のライブラリーの場合、5’側の多様性は2548(14×14x13)である。3’側で、多様性は546(3×13x14)である。5’側および3’側をアニールによって合成し、合計1,391,208(2548×546)の多様性が結果として生じた。変異体を次世代シーケンシングによって分析した(データは表示されていない)。
Figure 0007335165000014
実施例16:不均一な分布を有するコンビナトリアルライブラリー
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で行った。実施例4-6および8-12のように、変異体が各位置であらかじめ選択され、かつあらかじめ選択された分布を有する1つの部位または複数の部位でコドン変異をコードする核酸集団を生成した。
不均一な変異体分布を備えたライブラリーもまた、表11で見られるものと同様のあらかじめ選択された分布で生成した。参照配列を再び半分に分割し、各部分に対して変異体を生成した。分割された一方の側は5’側と呼ばれ、分割された他方の側は3’側と呼ばれた。5’変異体および3’変異体の期待確率を、その変異体の置換の理論的頻度を掛けることによって計算した。例えば、配列NRSの5’変異体については、期待確率は、0.0677%(9.9%x7.6%x9.0%)であった。5’変異体および3’変異体については、変異体のいくつかは同じ確率を有しており、それをグループ分けした(つまり、同じ確率の「ビン」において)。したがって、同じビン内の変異体はすべて、発生する理論的な頻度は同じである。1,391,208の合計の理論的な変異体については、162の異なる確率、したがって、162の異なる確率ビンがあった。
その後、次世代シーケンシング(NGS)を実施して、どの程度理論的な多様性が生成された変異体に表われているかを判定した。配列決定を10^6のリードで実施したため、実際の多様性の30%だけが観察された。したがって、所望の頻度で表される実際の多様性の合計を判定した。
同じ頻度を有する変異体の数を表す162の異なる確率ビンを、NGSデータを分析するために使用した。162の異なる確率ビンについて、NGSからのリードを、図22で見られるような発生(点線)のそれらの期待確率によってグループ化した。その後、観察頻度(実線)を、期待確率と比較した。162のビンの各々について、そのビン中の変異体の数で割られた変異体の合計数によって、観察頻度を判定した。各ビンについてこの値を計算し、図23で見られるような平均数として表す。図22で見られるように、これらの値を観察頻度としてグラフで表し、期待確率と比較した。
図22のような変異体の観察頻度(実線)と変異体の期待確率(点線)との比較は、観察された多様性が所望の頻度で表されたかどうかを示す。図22で見られるように、観察された多様性は期待確率とよく一致し、理論的な多様性の99%より多くが表された。
加えて、高頻度の組み合わせを、あらかじめ定められた低頻度の組み合わせと同様に観察した。多様性の39の塩基対領域にまたがるNGSリードの89.9%が適切なサイズであり、完全な126の塩基対の構築物の70%以上が挿入および欠失を含まないと推定した。図24を参照して、単一ピークによって示されるように、完全長の断片の高い割合を生成した。
実施例17:8位置のそれぞれに144の単一コドン変異体および9072の重複コドン変異体を含むコンビナトリアルライブラリー
実施例2に記載されるものと同様の条件下でデノボポリヌクレオチド合成を実施した。実施例4-6および8-12と同様に核酸集団を生成した。核酸集団は144の単一コドン変異体および9072の重複コドン変異体(9216の多様性)を含み、変異体を8位置であらかじめ選択した。
その後、次世代シーケンシング(NGS)を実施して、観察された組み合わせの変異体の分布を決定した。10^5のリードを超える適用範囲で配列決定を実施した。図25で見られるように、均一な分布を有するNGSによって観察された変異体の99%以上を検出した。観察された変異体の90%以上が挿入および欠失を含まず、5%未満のオフターゲット配列を検出した。野生型の配列の1%未満を観察した。
実施例18:アレイベースの方法を使用した代表的な変異体ライブラリーの生成
実施例1-3と同様のアレイベースの方法を使用して変異体ライブラリーをデノボ合成した。その後、アレイベースの方法を使用して生成された変異体ライブラリーを、PCRベースの方法を使用して生成された変異体ライブラリーと比較した。
変異体ライブラリー構築後、2つのライブラリーからのコロニーをサンプリングし配列決定した。データを表12に示す。失敗した配列決定の数(「失敗した配列決定の数」)を、配列決定ができなかったコロニーの数として判定した。割合の多様性(多様性(%))を、予想される理論上可能性のある突然変異体の数に対する配列決定後に得られた突然変異体の数の比率から判定した。割合の正確さ(「正確さ(%))を、配列決定に使用された突然変異体の数に対する正確なDNA配列を有する突然変異体の数の比率によって判定した。表12から、アレイベースの方法を使用して生成された変異体ライブラリーは、より高い「正確さ」を示し、多様性および品質の改善と相関する。
2つのライブラリーもまた、サンプリングによってタンパク質レベルで比較した。アレイベースの方法を使用して生成された変異体ライブラリーは、より代表的な変異体集団を有し、PCRベースの方法を使用して生成された変異体ライブラリーよりも理論的に予想される生成された突然変異体の数が増加した。
実施例19:コドン割り当てスキーム
コドン割り当てを使用してポリヌクレオチドライブラリーを設計した。各部位で設計されるコドン配列を決定するために、コドン割り当てを使用した。
表13に列挙されるような野生型の(WT)アミノ酸配列およびWT DNA配列を有するヒト腫瘍タンパク質p53(TP53)について、コドン変異を生成した。コドン変異を生成する時、設計される変異コドン配列は上記表3のコドン割り当てに基づいた。具体的には、WTアミノ酸から変異アミノ酸を生成する時、変異アミノ酸をコードする変異コドン配列を表3に列挙されたコドン配列から左から右に最初に選択した。
表13を参照して、ペプチドの位置2でのWTアミノ酸は「F」(太字)である。位置2で変異を生成するために、WT配列の変異体を設計し、他の19のアミノ酸のいずれかに「F」を変更した。その後、表3のコドン割り当てを使用して、その位置で変異アミノ酸を生成するためにどの変異体コドン配列を設計するかを判定した。「F」が「A」に変更される変異体を生成するために、表3の最初に選択された変異コドン配列は、「A」をコードする「GCA」、「GCC」、または「GCG」の代わりに、「GCT」であった。表14は、位置2における「F」の可能性のある変異体アミノ酸すべて、およびどの変異体コドン配列が変異アミノ酸を生成するために指定されたかを列挙する。
実施例20:複数の変異体部位を持つCDRにおける一続き
核酸ライブラリーを実施例4-6および8-12のように生成し、変異体が各位置においてあらかじめ選択される1つの部位または複数の部位でのコドン変異をコードする。変異体の領域は、CDRの少なくとも一部をコードする。例えば、図12を参照。合成された核酸を装置表面から放出し、プライマーとして使用することで核酸ライブラリーを生成し、これは、細胞中で発現されて変異タンパク質ライブラリーを生成する。変異抗体を、エピトープに対する結合親和性の増大について評価する。
実施例21:変異体抗体ライブラリーの生成
上記の実施例のように、核酸ライブラリーを生成する。図12からの代表的なCDRをコードする核酸について、変異ライブラリーを生成した。代表的なCDRは修飾され、CDR領域が図13で見られるような変異のための複数の位置を含む。図13に示されるように、コドン変異体の異なる数および変異体の位置を選択する。図13において、作成され得る変異体ライブラリーの多様性は1,152である。次世代シーケンシングによる分析は、正しい画分および正しい位置での意図した変異体の存在を示す。
実施例22:多様なペプチドを発現するためのモジュラープラスミド構成要素
図14に表されるように、核酸ライブラリーを実施例4-6および8-12のように生成し、発現構築物カセットの一部を構築する別個の領域の各々に対して、1つの部位または複数の部位にてコドン変異をコードする。2つの構築物発現カセットを生成するために、第1のプロモーター(1410)、第1のオープンリーディングフレーム(1420)、第1のターミネーター(1430)、第2のプロモーター(1440)、第2のオープンリーディングフレーム(1450)、または第2のターミネーター配列(1460)の変異体配列の少なくとも一部をコードする変異体核酸を合成した。増幅を繰り返した後、先の実施例に記載したように、1,024の発現構築物のライブラリーを生成する。
実施例23:複数の部位、1つの位置の変異体
核酸ライブラリーを実施例4-6および8-12のように生成し、核酸の少なくとも一部をコードする領域において1つの部位または複数の部位でコドン変異をコードする。核酸変異体のライブラリーを生成し、ライブラリーは複数の部位、1つの位置の変異体からなる。例えば、図8Bを参照。
実施例24:変異体ライブラリーの合成
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で実施する。少なくとも約30,000の非同一のポリヌクレオチドをデノボ合成し、ここで、非同一のポリヌクレオチドの各々は、アミノ酸配列の異なるコドン変異をコードする。合成された少なくとも30,000の非同一のポリヌクレオチドを、少なくとも約30,000の非同一のポリヌクレオチドの各々に対してあらかじめ決められた配列と比較して、1:000の塩基中に1未満の総エラー率を有する。ライブラリーを長い核酸のPCR突然変異誘発に使用し、少なくとも約30,000の非同一の変異体ポリヌクレオチドを形成する。
実施例25:クラスタベースの変異体ライブラリー合成
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で実施する。装置上の1つのクラスターを生成し、該クラスターは、2つのコドン位置に対して参照核酸のあらかじめ定められた合成変異体を含有していた。2つの連続するコドン位置の配置において、1つの位置当たり19の変異体を、各核酸の2つの複製を伴って2つの位置に対して生成し、結果として合成された38の核酸が得られた。各変異体配列は、40塩基長さである。同じクラスターにおいて、追加の非変異体核酸および変異体核酸が、遺伝子のコード配列の38の変異体をまとめてコードする追加の非変異体核酸配列を生成する。核酸の各々は、別の核酸に対して相補性である少なくとも1つの領域を有する。ガス状のアンモニア切断によってクラスターにおける核酸を放出する。水を含むピンはクラスターに接触し、核酸を拾い上げて、核酸を小さなバイアルへと移動させる。バイアルはさらに、ポリメラーゼサイクリングアセンブリ(PCA)反応のためのDNAポリメラーゼ試薬を含む。核酸をアニールし、伸長反応によりギャップを埋め、および、結果として生じる二本鎖DNA分子を形成し、変異体核酸ライブラリーを形成する。変異体核酸ライブラリーを随意に制限酵素にさらし、その後、発現ベクターに連結する。
実施例26:タンパク結合親和性の変化に対する変異体核酸ライブラリーのスクリーニング
実施例13-16に記載されるように、複数の発現ベクターを生成する。この実施例において、発現ベクターは、HISタグ付けされた細菌発現ベクターである。ベクターライブラリーを細菌細胞に電気穿孔し、その後、HISタグ付けされた変異体タンパク質の発現および精製のためにクローンを選択する。変異体タンパク質を、標的分子への結合親和性の変化についてスクリーニングする。
金属親和性クロマトグラフィー(IMAC)などを使用する方法により親和性を調べ、その方法では、金属イオン被覆樹脂(例えば、IDAアガロース又はNTAアガロース)を使用して、HISタグ付けされたタンパク質を単離させる。ヒスチジン残基のストリング(string)が、特定の緩衝条件下でニッケル、コバルト、および銅を含む様々なタイプの固定された金属イオンに結合するため、発現されたHisタグ付けされたタンパク質を精製かつ検出することができる。一例の結合/洗浄の緩衝液は、10-25mMのイミダゾールを含む、pH7.2のトリス緩衝液食塩水(TBS)から成る。IMACカラムからの捕捉されたHISタグ付けされたタンパク質の溶出および回収を、高濃度のイミダゾール(少なくとも200mM)(溶出剤)、低pH(例えば、0.1Mのグリシン-HCl、pH2.5)、または過剰な強固なキレート化剤(例えば、EDTA)により達成する。
代替的に、抗-Hisタグ抗体は、Hisタグ付けされたタンパク質を単離させるためのプルダウンアッセイ、またはHisタグ付けされたタンパク質を検出するためのイムノブロッティングアッセイなどの、Hisタグ付けされたタンパク質に関するアッセイ方法で使用される商業上利用可能なものである。
実施例27:細胞の接着および遊走のレギュレーターに対する活性の変化についての変異体核酸ライブラリーのスクリーニング
実施例13-16に記載されるように生成された変異体核酸ライブラリーを、GFPタグ付けされた哺乳動物の発現ベクターに挿入する。ライブラリーから単離されたクローンを、哺乳動物細胞へと一時的にトランスフェクトする。代替的に、タンパク質を発現し、発現構築物を含む細胞から単離し、その後、タンパク質をさらなる測定のために細胞へ送達する。免疫蛍光アッセイを実施して、GFPタグ付けされた変異体発現産物の細胞局在化の変化を評価する。FACSアッセイを実施して、GFPタグ付けされた変異体タンパク質発現産物の非変異体のバージョンと相互に作用する、膜貫通型タンパク質の立体構造における変化を評価する。創傷治癒アッセイを実施して、GFPタグ付けされた変異体タンパク質を発現する細胞が、細胞培養皿上の引っ掻き傷によって作られた空間に侵入する能力の変化を評価する。GFPタグ付けされたタンパク質を発現する細胞を同定し、蛍光ソースおよびカメラを使用して追跡する。
実施例28:ウイルスの進行を阻害するペプチドについての変異体核酸ライブラリーのスクリーニング
実施例13-16に記載されるように生成された変異体核酸ライブラリーを、FLAGタグ付けた哺乳動物の発現ベクターに挿入し、該変異体核酸ライブラリーはペプチド配列をコードする。哺乳動物の初代細胞を、ウイルス性障害に苦しむ被験体から得る。代替的に、健康な被験体から得た初代細胞をウイルスに感染させる。細胞を一連のマイクロウェル皿の上に播種する。変異体ライブラリーから単離されたクローンを、細胞へと一時的にトランスフェクトする。代替的に、タンパク質を発現し、発現建築物を含む細胞から単離し、その後、タンパク質をさらなる測定のために細胞へ送達する。細胞生存アッセイを行って、変異体ペプチドに関連した生存の増強について感染細胞を評価する。典型的なウイルスは、限定されないが、鳥インフルエンザ、ジカウイルス、ハンタウィルス、C型肝炎、および天然痘を含む。
1つの例示的アッセイは、ニュートラルレッド染料(細胞に加えた時、原形質膜中に拡散し、ニュートラルレッドの軽度のカチオン特性により酸性のリソソームコンパートメントに蓄積する)を使用する、ニュートラルレッド細胞毒性アッセイである。ウイルスに誘発された細胞変性により、膜の断片化、およびリソソームATP駆動性のプロトンの転位置活性の損失が引き起こされる。細胞内のニュートラルレッドの結果として生ずる減少を、マルチウェルプレートのフォーマットにおいて分光測定で評価することができる。変異体ペプチドを発現する細胞を、信号利得カラーアッセイ(gain-of-signal color assay)における細胞内のニュートラルレッドの増加によってスコア化する。ウイルスに誘発された細胞変性を阻害するペプチドについて細胞を評価する。
実施例29:細胞の代謝活性を増大または減少させる変異体タンパク質に対するスクリーニング
細胞の代謝活性の変化を結果としてもたらす発現産物を識別するために、実施例13-16に記載されるように複数の発現ベクターを生成する。この実施例において、発現ベクターを、一連のマイクロウェル皿上に播種された細胞に移す(例えば、トランスフェクションまたは形質導入を介して)。その後、細胞を、代謝活性の1以上の変化に対してスクリーニングする。代替的に、タンパク質を発現し、発現構築物を含む細胞から単離し、その後、代謝活性を測定するためにタンパク質を細胞へ送達する。随意に、代謝活性を測定するための細胞を毒素で処理し、その後、1以上の代謝活性の変化に対してスクリーニングを行う。投与される典型的な毒素は、限定されないが、ボツリヌス毒素(免疫学上のタイプ:A、B、C1、C2、D、E、F、およびGを含む)、ブドウ球菌エンテロトキシンB、エルシニアペスティス、C型肝炎、マスタード剤(Mustard agent)、重金属、シアニド、内毒素、バシラスアンスラシス、ジカウイルス、鳥インフルエンザ、除草剤、農薬、水銀、有機リン酸エステル、ならびにリシンを含む。
基礎的なエネルギー必要量は、好気的トリカルボン酸(TCA)を含む酸化的リン酸化、またはKrebサイクル、あるいは嫌気的解糖のいずれかによる代謝基質(例えば、グルコース)の酸化から得られる。解糖が主なエネルギー源である場合、細胞が酸性の代謝産物(例えば、乳酸塩およびCO)を分泌する速度をモニタリングすることによって、細胞の代謝活性を推定することができる。好気的代謝の場合、細胞外の酸素の消費および酸化遊離基の産生は、細胞のエネルギー必要量を反映する。細胞内の酸化還元電位を、NADHおよびNADの自動蛍光測定によって測定することができる。細胞により放出されるエネルギー量(例えば、熱量)は、標準の設定下で消費される酸素の量(例えば4.8kcal/lのO)から予測できる代謝中に生成および/または消費される物質に対する分析値から得られる。熱産生と酸素利用との間の結合を、毒素により妨害することができる。直接のマイクロカロリメトリーは、熱により単離されたサンプルの温度上昇を測定する。ゆえに、酸素消費量の測定と組み合わせる時、カロリメトリーを使用して、毒素の脱共役活性を検出することができる。
代謝活性の様々なマーカーの変化を測定するための様々な方法および装置が、当該技術分野で知られている。例えば、そのような方法、装置、およびマーカーは米国特許第7,704,745において論じられており、その全体が、参照によって本明細書に組み込まれる。簡潔に、以下の特徴の何れかの測定が、各細胞集団について記録される:グルコース、乳酸塩、CO、NADHとNADの比率、熱、O消費、及び遊離基産生。スクリーニングされる細胞は、肝実質細胞、マクロファージ、または神経芽腫細胞を含んでもよい。スクリーニングされる細胞は、細胞株、被験体からの初代細胞、またはモデル系(例えば、マウスモデル)からの細胞であってもよい。
単細胞、またはマルチウェルのチャンバ内にある細胞の集団の酸素消費速度の測定のために、様々な技術が利用可能である。例えば、細胞を含むチャンバは、温度、電流、または蛍光の変化を記録するためのセンサ、ならびに、蛍光をモニタリングするために各チャンバに結合される光学系(例えば、ファイバー結合光学系)を備え得る。この実施例において、各チャンバは、照明ソースがチャンバ内部の分子を刺激するための窓を有する。ファイバー結合光学系は、細胞内のNADH/NAD比率および電圧を測定するための自己蛍光、ならびに、膜電位差および細胞内カルシウムを判定するためのカルシウムに敏感な染料を検出することができる。加えて、COおよび/またはOに敏感な蛍光染料シグナルの変化を検出する。
実施例30:癌細胞の選択的な標的化に対する変異体核酸ライブラリーのスクリーニング
実施例13-16に記載されるように生成された変異体核酸ライブラリーを、FLAGタグ付けた哺乳動物の発現ベクターに挿入し、該変異体核酸ライブラリーはペプチド配列をコードする。変異体ライブラリーから単離されたクローンを、癌細胞および非癌細胞へと別個に、一時的にトランスフェクトする。細胞生存および細胞死のアッセイを癌細胞と非癌細胞の両方に対して行い、その各々が、変異体核酸によりコードされる変異体ペプチドを発現する。変異体ペプチドに関連する選択的な癌細胞の死滅について細胞を評価する。癌細胞は随意に、癌と診断された被験体からの癌細胞株または原発性癌細胞である。癌と診断された被験体からの原発性癌細胞の場合、スクリーニングアッセイにおいて同定された変異体ペプチドを被験体への投与のために随意に選択する。代替的に、タンパク質を発現し、タンパク質発現構築物を含む細胞から単離し、その後、タンパク質をさらなる測定のために癌細胞および非癌細胞へ送達する。
実施例31:コンビナトリアルライブラリーの生成
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で実施する。核酸集団を実施例4-6および8-12のように生成し、変異体が各位置においてあらかじめ選択される1つの部位でまたは複数の部位でコドンの変異をコードする。第1の集団の核酸を第2の集団からの核酸と組み合わせることによって、コンビナトリアルライブラリーを生成する。図1に示されるように、4つの核酸の集団(110)を4つの核酸の別の集団(120)と組み合わせて、16の組み合わせを産出する。
核酸を平滑末端ライゲーションによってアニールする。1つの核酸の50ngのDNAを、他の核酸の50ngのDNAと1.5mlのバイアル中で混合させる。次に、1μLのT4 DNAリガーゼ(New England BioLabs)を、20μLのライゲーション緩衝液および20μLのヌクレアーゼを含まない水と共に加える。その後、反応混合物をインキュベートする。インキュベートした後、ライゲーション産物を配列決定によって分析する。
実施例32:サンプリングによるコンビナトリアルライブラリーの生成
デノボポリヌクレオチド合成を、実施例2に記載されるものと同様の条件下で実施する。核酸集団を実施例4-6および8-12のように生成し、変異体が各位置においてあらかじめ選択される1つの部位または複数の部位でコドンの変異をコードする。
図26Aを参照して、実施例13-16に記載されるものと同様の方法によって、不均一な変異体分布を備えたライブラリーをあらかじめ選択された分布で生成した。画像の各パターン部分は、各位置(A1、A2、A3、B1、B2、およびB3)で異なるあらかじめ選択された分布を有する4つの様々なアミノ酸のうち1つを表す。黒丸は、各位置内のランダムな選択を表わす。図26Bを参照して、Aのための5つのランダムに生成されたサンプルおよびBのための5つのランダムに生成されたサンプルを独立して生成する。その後、図で26C見られるように、Aでの5つのランダムに生成されたサンプルおよびBでの5つのランダムに生成されたサンプルを、例えば、平滑末端ライゲーションによって、ともにアニールする。これは25の組み合わせ(n^2=5^2)を結果としてもたらす。図26Dを参照して、統計比較は、結果として生じる分布があらかじめ選択された分布と一致することを示す。
実施例33:コンビナトリアル抗体ライブラリーの生成
上記の実施例のように、核酸ライブラリーを生成する。変異体ライブラリーを、図27Aで見られるような一つのCDR領域、図27Bで見られるような2つのCDR領域、または図で27C見られるような複数のCDR領域をコードする核酸のために生成する。
変異体抗体ライブラリーもまた、図28Aに見られるような単一または複数の重鎖スキャフォールドおよび軽鎖スキャフォールド中の変異体、あるいは図28Bで見られるような単一または複数のフレームワーク中の変異体を含むように生成する。
本発明の好ましい実施形態が本明細書で示されかつ記載されてきたが、こうした実施形態がほんの一例として提供されているに過ぎないということは当業者にとって明白である。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用され得ることを理解されたい。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。

Claims (6)

  1. 変異体核酸ライブラリーを合成する方法であって、
    前記方法は、
    (a)複数のポリヌクレオチドをコードするあらかじめ定められた配列を提供する工程であって、前記複数のポリヌクレオチドはあらかじめ選択された不均一なコドン分布を有する、工程と、
    (b)前記複数のポリヌクレオチドのランダムなサンプルを合成する工程であって、前記複数のポリヌクレオチドは、各位置で不均一なコドン分布を有する複数のアミノ酸を含むタンパク質ライブラリーをコードし、ここで、予測された多様性の少なくとも70%が表される、工程と、
    (c)前記複数のポリヌクレオチドに基づいて翻訳されたタンパク質について細胞活性をアッセイする工程と、
    (d)工程(c)のアッセイからの結果を収集する工程であって、収集する工程は、否定的な結果または無効の結果を伴うあらかじめ定められた配列の結果を収集することを含む、工程と、
    を含む、方法。
  2. 工程(d)は、前記否定的な結果または無効の結果を伴うあらかじめ定められた配列の少なくとも80%の結果を収集することを含む、請求項1に記載の方法。
  3. 前記複数のポリヌクレオチド配列の少なくとも80%は、前記変異体核酸ライブラリーの前記ポリヌクレオチド配列の各々について平均頻度の2倍以内の量で前記変異体核酸ライブラリー中に存在する、請求項1に記載の方法。
  4. 前記細胞活性は、繁殖、成長、接着、死亡、遊走、エネルギー産生、酸素利用、代謝活性、細胞シグナル伝達、遊離ラジカル損傷に対する反応、またはそれらの任意の組み合わせを含む、請求項1に記載の方法。
  5. 前記変異体核酸ライブラリーは、変異体遺伝子あるいはその断片の配列をコードする、請求項1に記載の方法。
  6. 前記変異体核酸ライブラリーは、抗体、酵素、あるいはペプチドの少なくとも一部をコードする、請求項1に記載の方法。
JP2019549581A 2017-03-15 2018-03-14 デノボ合成されたコンビナトリアル核酸ライブラリー Active JP7335165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023011285A JP2023087685A (ja) 2017-03-15 2023-01-27 デノボ合成されたコンビナトリアル核酸ライブラリー

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762471723P 2017-03-15 2017-03-15
US62/471,723 2017-03-15
US201762578326P 2017-10-27 2017-10-27
US62/578,326 2017-10-27
PCT/US2018/022487 WO2018170164A1 (en) 2017-03-15 2018-03-14 De novo synthesized combinatorial nucleic acid libraries

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023011285A Division JP2023087685A (ja) 2017-03-15 2023-01-27 デノボ合成されたコンビナトリアル核酸ライブラリー

Publications (3)

Publication Number Publication Date
JP2020511135A JP2020511135A (ja) 2020-04-16
JP2020511135A5 JP2020511135A5 (ja) 2021-04-22
JP7335165B2 true JP7335165B2 (ja) 2023-08-29

Family

ID=63523968

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019549581A Active JP7335165B2 (ja) 2017-03-15 2018-03-14 デノボ合成されたコンビナトリアル核酸ライブラリー
JP2023011285A Pending JP2023087685A (ja) 2017-03-15 2023-01-27 デノボ合成されたコンビナトリアル核酸ライブラリー

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023011285A Pending JP2023087685A (ja) 2017-03-15 2023-01-27 デノボ合成されたコンビナトリアル核酸ライブラリー

Country Status (11)

Country Link
US (1) US20180282721A1 (ja)
EP (1) EP3596258A4 (ja)
JP (2) JP7335165B2 (ja)
KR (2) KR20230163591A (ja)
CN (2) CN117888207A (ja)
AU (1) AU2018234624B2 (ja)
CA (1) CA3056386A1 (ja)
GB (1) GB2575576A (ja)
IL (1) IL269288A (ja)
SG (1) SG11201908489XA (ja)
WO (1) WO2018170164A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3030682B1 (en) 2013-08-05 2020-06-03 Twist Bioscience Corporation De novo synthesized gene libraries
WO2016126882A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016172377A1 (en) 2015-04-21 2016-10-27 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
CN108368482A (zh) 2015-09-18 2018-08-03 特韦斯特生物科学公司 寡核酸变体文库及其合成
KR20180058772A (ko) 2015-09-22 2018-06-01 트위스트 바이오사이언스 코포레이션 핵산 합성을 위한 가요성 기판
US9895673B2 (en) 2015-12-01 2018-02-20 Twist Bioscience Corporation Functionalized surfaces and preparation thereof
EP3500672A4 (en) 2016-08-22 2020-05-20 Twist Bioscience Corporation NOVO SYNTHESIZED NUCLEIC ACID BANKS
US10417457B2 (en) 2016-09-21 2019-09-17 Twist Bioscience Corporation Nucleic acid based data storage
GB2573069A (en) 2016-12-16 2019-10-23 Twist Bioscience Corp Variant libraries of the immunological synapse and synthesis thereof
WO2018156792A1 (en) 2017-02-22 2018-08-30 Twist Bioscience Corporation Nucleic acid based data storage
EP3595674A4 (en) 2017-03-15 2020-12-16 Twist Bioscience Corporation BANKS OF VARIANTS OF IMMUNOLOGICAL SYNAPSE AND THEIR SYNTHESIS
KR102628876B1 (ko) 2017-06-12 2024-01-23 트위스트 바이오사이언스 코포레이션 심리스 핵산 어셈블리를 위한 방법
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
SG11202002194UA (en) 2017-09-11 2020-04-29 Twist Bioscience Corp Gpcr binding proteins and synthesis thereof
JP7066840B2 (ja) 2017-10-20 2022-05-13 ツイスト バイオサイエンス コーポレーション ポリヌクレオチド合成のための加熱されたナノウェル
CN112041438A (zh) 2018-01-04 2020-12-04 特韦斯特生物科学公司 基于dna的数字信息存储
SG11202011467RA (en) 2018-05-18 2020-12-30 Twist Bioscience Corp Polynucleotides, reagents, and methods for nucleic acid hybridization
AU2020227802A1 (en) 2019-02-26 2021-10-14 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
KR20210143766A (ko) * 2019-02-26 2021-11-29 트위스트 바이오사이언스 코포레이션 Glp1 수용체에 대한 변이체 핵산 라이브러리
CN114729342A (zh) 2019-06-21 2022-07-08 特韦斯特生物科学公司 基于条形码的核酸序列装配
US20210102195A1 (en) * 2019-09-23 2021-04-08 Twist Bioscience Corporation Variant nucleic acid libraries for single domain antibodies
EP4204431A1 (en) * 2020-08-28 2023-07-05 Twist Bioscience Corporation Devices and methods for synthesis
WO2022086866A1 (en) 2020-10-19 2022-04-28 Twist Bioscience Corporation Methods of synthesizing oligonucleotides using tethered nucleotides

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130827A1 (en) 2001-08-10 2003-07-10 Joerg Bentzien Protein design automation for protein libraries
US20080287320A1 (en) 2006-10-04 2008-11-20 Codon Devices Libraries and their design and assembly

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090075378A1 (en) * 2007-02-20 2009-03-19 Anaptysbio, Inc. Somatic hypermutation systems
US20110082055A1 (en) * 2009-09-18 2011-04-07 Codexis, Inc. Reduced codon mutagenesis
DK2890836T3 (da) * 2012-08-31 2019-09-16 Scripps Research Inst Fremgangsmåder i forbindelse med modulatorer af eukaryotiske celler
EP3030682B1 (en) * 2013-08-05 2020-06-03 Twist Bioscience Corporation De novo synthesized gene libraries
CN108368482A (zh) * 2015-09-18 2018-08-03 特韦斯特生物科学公司 寡核酸变体文库及其合成

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130827A1 (en) 2001-08-10 2003-07-10 Joerg Bentzien Protein design automation for protein libraries
US20080287320A1 (en) 2006-10-04 2008-11-20 Codon Devices Libraries and their design and assembly

Also Published As

Publication number Publication date
CN110914486A (zh) 2020-03-24
CN110914486B (zh) 2024-01-30
CN117888207A (zh) 2024-04-16
AU2018234624A1 (en) 2019-10-17
GB201914881D0 (en) 2019-11-27
WO2018170164A1 (en) 2018-09-20
KR102607157B1 (ko) 2023-11-27
EP3596258A4 (en) 2020-12-30
GB2575576A (en) 2020-01-15
IL269288A (en) 2019-11-28
KR20190129081A (ko) 2019-11-19
JP2023087685A (ja) 2023-06-23
EP3596258A1 (en) 2020-01-22
US20180282721A1 (en) 2018-10-04
SG11201908489XA (en) 2019-10-30
JP2020511135A (ja) 2020-04-16
AU2018234624B2 (en) 2023-11-16
KR20230163591A (ko) 2023-11-30
CA3056386A1 (en) 2018-09-20

Similar Documents

Publication Publication Date Title
JP7335165B2 (ja) デノボ合成されたコンビナトリアル核酸ライブラリー
US11807956B2 (en) Oligonucleic acid variant libraries and synthesis thereof
US20210102198A1 (en) Variant libraries of the immunological synapse and synapse and synthesis thereof
EP3541973B1 (en) Polynucleotide libraries having controlled stoichiometry and synthesis thereof
JP7169975B2 (ja) 免疫シナプスの変異体ライブラリーおよびその合成
US20240158955A1 (en) Oligonucleic acid variant libraries and synthesis thereof
WO2023154533A2 (en) Combinatorial dna assembly for multispecific antibodies

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210310

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220616

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230127

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20230127

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20230206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230529

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230817

R150 Certificate of patent or registration of utility model

Ref document number: 7335165

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150