JP2019083025A - 酵素バリアントの自動スクリーニング - Google Patents

酵素バリアントの自動スクリーニング Download PDF

Info

Publication number
JP2019083025A
JP2019083025A JP2018237169A JP2018237169A JP2019083025A JP 2019083025 A JP2019083025 A JP 2019083025A JP 2018237169 A JP2018237169 A JP 2018237169A JP 2018237169 A JP2018237169 A JP 2018237169A JP 2019083025 A JP2019083025 A JP 2019083025A
Authority
JP
Japan
Prior art keywords
substrate
variants
protein
enzyme
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2018237169A
Other languages
English (en)
Inventor
ザン シユン
Xiyun Zhang
ザン シユン
ジャビニアール サルミエント ラッセル
Javiniar Sarmiento Russell
ジャビニアール サルミエント ラッセル
スコット バスカルヴィル ドナルド
Scott Baskerville Donald
スコット バスカルヴィル ドナルド
ダブリュー. ユイスマン ジャイト
W Huisman Gjait
ダブリュー. ユイスマン ジャイト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of JP2019083025A publication Critical patent/JP2019083025A/ja
Priority to JP2021089944A priority Critical patent/JP2021131901A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C99/00Subject matter not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • G16C20/64Screening of libraries

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Analytical Chemistry (AREA)
  • Ecology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

【課題】酵素バリアントの自動スクリーニングの提供。【解決手段】ドッキングから生成したポーズを評価して、それらが所望の生体分子との相互作用に関して「活性」であるかどうかを決定する。ドッカーは、ドッキングを評価するために使用するユーザーがいくつかのポーズ(n)を指定することを可能にする。規定された基準を満たす好ましい相互作用エネルギーを有するポーズのみが選択されて、活性または不活性ポーズとして分類される。【選択図】図2

Description

(関連出願の引用)
本願は、米国特許法§119(e)に基づき、米国仮特許出願第61/883,838
号(2013年9月27日出願、名称「AUTOMATED SCREENING OF
ENZYME VARIANTS」)の利益を主張し、上記出願は、あらゆる目的のた
めにその全体が参照により本明細書に引用される。
タンパク質設計は、サーチ可能な配列空間を構成する可能な分子の組合せの急増以外の
理由がなくてもそれだけで困難なタスクであることが長い間知られている。タンパク質の
配列空間は、広大であり、当技術分野で現在公知の方法を使用して網羅的に探索すること
は不可能である。これらの方法は、有用なポリペプチドを識別するために要求される時間
およびコストによって制限されることが多い。問題の一部は、シーケンシング、スクリー
ニング、およびアッセイされなければならない多数のポリペプチドバリアントから生じる
。指向進化方法は、有利な性質を有する候補生体分子に絞り込むことにおいて効率を増大
させる。今日では、タンパク質の指向進化は、反復して実施されることが多い、様々なハ
イスループットスクリーニングおよび組換えフォーマットが大部分を占める。
配列活性空間を探索するための様々な計算手法も提案されている。相対的に言って、こ
れらの手法は、その黎明期にあり、かなりの進歩が依然として必要とされている。したが
って、候補生体分子をスクリーニング、シーケンシング、およびアッセイする効率を改善
する新しい方法が非常に望ましい。
要旨 本開示は、分子生物学、分子進化、バイオインフォマティクス、およびデジタル
システムの分野に関する。これらの方法を実施するための、デジタルシステムなどのシス
テムおよびシステムソフトウェアも提供される。本開示の方法は、工業的および治療的使
用のためのタンパク質の最適化において有用性を有する。本方法およびシステムは、特定
の基質の触媒反応に関して所望の活性および選択性を有する酵素を設計および開発するた
めに特に有用である。
本開示のある特定の態様は、有益な性質を有するタンパク質を仮想スクリーニングし、
かつ/または指向進化プログラムをガイドするための方法に関する。本開示は、複雑な生
体分子ライブラリーまたはこのようなライブラリーのセットから所望の性質を有する(ま
たはそのような性質に向けた指向進化に最も適した)生体分子を識別するための方法を提
示する。本開示の一部の実施形態は、特定の基質に対する触媒反応に関して所望の活性お
よび選択性について酵素を仮想スクリーニングするための方法を提供する。一部の実施形
態は、所望の性質を有するタンパク質および酵素を設計および開発するために、スクリー
ニングと指向進化とを組み合わせている。本方法を実施するシステムおよびコンピュータ
ープログラム製品も提供される。
本開示の一部の実施形態は、基質との活性について複数の異なる酵素バリアントをスク
リーニングするための方法を提供する。一部の実施形態では、本方法は、1つまたは複数
のプロセッサーおよびシステムメモリーを含むコンピューターシステムを使用して実施さ
れる。本方法は、(a)各酵素バリアントごとに、コンピューターシステムによって、基
質の計算上の表示を、酵素バリアントの活性部位の計算上の表示にドッキングするステッ
プであって、ドッキングは、(i)活性部位における基質の複数のポーズを生成し、(i
i)活性部位における基質のエネルギー的に好ましいポーズを識別する、ステップと、(
b)各エネルギー的に好ましいポーズごとに、ポーズが活性であるかどうかを決定するス
テップであって、活性ポーズは、活性部位で触媒作用を受けるという基質に関する1つま
たは複数の制約を満たす、ステップと、(c)1つまたは複数の活性ポーズを有すると決
定された酵素バリアントの少なくとも1つを選択するステップとを含む。
一部の実施形態では、制約は、位置、距離、角度、およびねじれの制約の1つまたは複
数を含む。一部の実施形態では、制約は、基質上の特定の部分と、活性部位における特定
の残基または残基部分との間の距離を含む。一部の実施形態では、制約は、リガンド上の
特定の部分と、活性部位における理想的に配置された天然リガンドとの間の距離を含む。
一部の実施形態では、基質の計算上の表示は、酵素活性に関する反応座標に沿って種を
表示する。種は、基質、基質の反応中間体、または基質の遷移状態から選択される。一部
の実施形態では、スクリーニングされたバリアントは、複数の基質を転換することができ
る酵素のパネルから選択され、パネルのメンバーは、参照配列と比べて少なくとも1つの
変異を有する。一部の実施形態では、少なくとも1つの変異は、単一残基の変異である。
一部の実施形態では、少なくとも1つの変異は、酵素の活性部位におけるものである。一
部の実施形態では、複数のバリアントとして、ケトンの還元、アミノ基転移反応、酸化、
ニトリルの加水分解、イミンの還元、エノンの還元、アシル加水分解、およびハロヒドリ
ンの脱ハロゲン化から選択される化学反応を触媒することができる1つまたは複数の酵素
が挙げられる。一部の実施形態では、酵素は、ケトンレダクターゼ、トランスアミナーゼ
、シトクロムP450、バイヤー−ビリガーモノオキシゲナーゼ、モノアミンオキシダー
ゼ、ニトリラーゼ、イミンレダクターゼ、エノンレダクターゼ、アシラーゼ、およびハロ
ヒドリンデハロゲナーゼから選択される。しかしながら、任意の適当な酵素が本発明の方
法において有用であるため、本発明がいずれかの特定の酵素または酵素のクラスに限定さ
れることは意図されない。一部の実施形態では、バリアントは、1または複数のラウンド
のin vitroおよび/またはin silicoの指向進化によって生成されたラ
イブラリーのメンバーである。
一部の実施形態では、本方法は、少なくとも約10種の異なるバリアントをスクリーニ
ングする。他の実施形態では、本方法は、少なくとも約1000種の異なるバリアントを
スクリーニングする。
一部の実施形態では、活性部位の計算上の表示は、複数のバリアントに関する3次元ホ
モロジーモデルから提供される。一部の実施形態では、タンパク質バリアントに関する3
次元ホモロジーモデルを生成するための方法が提供される。一部の実施形態では、本方法
は、複数の基質をスクリーニングするために適用される。
一部の実施形態は、天然基質が野生型酵素によって触媒された化学変換を受けるときの
天然基質、天然基質の反応中間体、または天然基質の遷移状態の1つまたは複数のポーズ
を識別することによって、触媒された化学変換を受けるという基質に関する制約を識別す
るための方法を提供する。
一部の実施形態は、複数の酵素バリアントに1つまたは複数の酵素の制約のセットを適
用するための方法であって、1つまたは複数の酵素の制約は、天然基質が野生型酵素の存
在下で触媒された化学変換を受けるときの野生型酵素の制約に類似している、方法を提供
する。
一部の実施形態では、基質の複数のポーズは、高温での分子動力学、ランダムなローテ
ーション、グリッドベースのアニーリングのシミュレートによる改良、および最終的なグ
リッドベースのまたは完全な力場の最小化(full force field min
imization)の1つまたは複数を含むドッキングオペレーションにより得られる
。一部の実施形態では、リガンドの複数のポーズは、活性部位における基質の少なくとも
約10のポーズを含む。
一部の実施形態では、上記(c)でのバリアントを選択するステップは、他のバリアン
トとの比較により、多数の活性ポーズを有すると決定されたバリアントを識別するステッ
プを伴う。一部の実施形態では、(c)での選択するステップは、バリアントが有する活
性ポーズの数、活性ポーズのドッキングスコア、および活性ポーズの結合エネルギーの1
つまたは複数によりバリアントをランク付けするステップを伴う。次いでバリアントは、
ランクに基づき選択される。一部の実施形態では、ドッキングスコアは、ファンデルワー
ルス力および静電相互作用に基づく。一部の実施形態では、結合エネルギーは、ファンデ
ルワールス力、静電相互作用、および溶媒和エネルギーの1つまたは複数に基づく。
一部の実施形態では、スクリーニング方法はまた、少なくとも1つの選択されたバリア
ントの少なくとも一部を含有するかまたはコードする複数のオリゴヌクレオチドを調製す
るステップも伴う。本方法は、複数のオリゴヌクレオチドを使用して1または複数のラウ
ンドの指向進化を実施するステップをさらに伴う。一部の実施形態では、複数のオリゴヌ
クレオチドを調製するステップは、核酸シンセサイザーを使用してオリゴヌクレオチドを
合成することを伴う。一部の実施形態では、1または複数のラウンドの指向進化を実施す
るステップは、複数のオリゴヌクレオチドを断片化して組み換えるステップを含む。一部
の実施形態では、1または複数のラウンドの指向進化を実施するステップは、複数のオリ
ゴヌクレオチドに飽和変異誘発を実施するステップを含む。
一部の実施形態では、スクリーニングされた酵素バリアントは、所望の触媒活性および
/または選択性を有する。また一部の実施形態の方法は、スクリーニングから選択された
酵素を合成するステップも伴う。
一部の実施形態では、スクリーニング方法を拡張して、酵素以外の生体分子をスクリー
ニングすることができる。一部の実施形態は、リガンドとの相互作用について複数のタン
パク質バリアントをスクリーニングするための方法を提供する。本方法は、(a)各タン
パク質バリアントごとに、コンピューターシステムによって、リガンドの計算上の表示を
、酵素バリアントの活性部位の計算上の表示にドッキングするステップであって、ドッキ
ングは、(i)活性部位におけるリガンドの複数のポーズを生成し、(ii)活性部位に
おけるリガンドのエネルギー的に好ましいポーズを識別する、ステップと、(b)各エネ
ルギー的に好ましいポーズごとに、ポーズが活性であるかどうかを決定するステップであ
って、活性ポーズは、タンパク質バリアントとの特定の相互作用を受けるというリガンド
に関する1つまたは複数の制約を満たす、ステップと、(c)1つまたは複数の活性ポー
ズを有すると決定されたタンパク質バリアントの少なくとも1つを選択するステップとを
伴う。一部の実施形態では、リガンドは、基質、中間体、遷移状態、生成物、阻害剤、ア
ゴニスト、および/またはアンタゴニストから選択されてもよい。
一部の実施形態では、酵素およびタンパク質をスクリーニングするための方法を実施す
るコンピュータープログラム製品およびコンピューターシステムも提供される。
本発明の実施形態において、例えば以下の項目が提供される。
(項目1)
基質との活性について複数の異なる酵素バリアントをスクリーニングするための1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムを使用して実施される方法であって、
(a)各酵素バリアントごとに、該コンピューターシステムによって、該基質の計算上の表示を、該酵素バリアントの活性部位の計算上の表示にドッキングするステップであって、ドッキングは、(i)該活性部位における該基質の複数のポーズを生成し、(ii)該活性部位における該基質のエネルギー的に好ましいポーズを識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決定するステップであって、活性ポーズは、該活性部位で触媒作用を受けるという該基質に関する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該酵素バリアントの少なくとも1つを選択するステップと
を含む、方法。
(項目2)
前記基質に対して(c)で選択された酵素バリアントの少なくとも1つを、化学反応を生じさせることによってスクリーニングするステップをさらに含む、項目1に記載の方法。
(項目3)
前記基質の前記計算上の表示が、前記酵素活性に関する反応座標に沿って種を表示し、該種は、該基質、該基質の反応中間体、または該基質の遷移状態から選択される、前記項目のいずれかに記載の方法。
(項目4)
前記複数の酵素バリアントが、複数の基質を転換することができる酵素のパネルを含み、該パネルのメンバーは、参照配列と比べて少なくとも1つの変異を有する、前記項目のいずれかに記載の方法。
(項目5)
前記少なくとも1つの変異が、前記酵素の前記活性部位における単一残基の変異である、項目4に記載の方法。
(項目6) 複数のバリアントが、酸化還元、トランスフェレーション、加水分解、異性化、ライゲーション、および加水分解、酸化、または還元以外の反応による化学結合の破断から選択される化学反応を触媒することができる1つまたは複数の酵素を含む、前記項目のいずれかに記載の方法。
(項目7)
前記酵素が、オキシドレダクターゼ、トランスフェラーゼ、ヒドロラーゼ、イソメラーゼ、リガーゼ、およびリアーゼから選択される、項目6に記載の方法。
(項目8)
前記複数のバリアントが、ケトンの還元、アミノ基転移反応、酸化、ニトリルの加水分解、イミンの還元、エノンの還元、アシル加水分解、およびハロヒドリンの脱ハロゲン化から選択される化学反応を触媒することができる1つまたは複数の酵素を含む、項目6に記載の方法。
(項目9)
前記酵素が、ケトンレダクターゼ、トランスアミナーゼ、シトクロムP450、バイヤー−ビリガーモノオキシゲナーゼ、モノアミンオキシダーゼ、ニトリラーゼ、イミンレダクターゼ、エノンレダクターゼ、アシラーゼ、およびハロヒドリンデハロゲナーゼから選択される、項目8に記載の方法。
(項目10)
前記複数のバリアントが、in vitroおよび/またはin silicoの1つまたは複数のラウンドの指向進化によって生成されたライブラリーのメンバーを含む、前記項目のいずれかに記載の方法。
(項目11)
前記複数のバリアントが、少なくとも約10種の異なるバリアントを含む、前記項目のいずれかに記載の方法。
(項目12)
前記複数のバリアントが、少なくとも約1000種の異なるバリアントを含む、前記項目のいずれかに記載の方法。
(項目13)
活性部位の前記計算上の表示が、前記複数のバリアントに関する3次元ホモロジーモデルから提供される、前記項目のいずれかに記載の方法。
(項目14)
前記複数のバリアントに関する前記3次元ホモロジーモデルを生成するステップをさらに含む、項目13に記載の方法。
(項目15)
前記基質の前記計算上の表示が、該基質の3次元モデルである、前記項目のいずれかに記載の方法。
(項目16)
複数の基質をスクリーニングするために適用される、前記項目のいずれかに記載の方法。
(項目17)
天然基質が野生型酵素によって触媒された化学変換を受けるときの、該天然基質、該天然基質の反応中間体、または該天然基質の遷移状態の1つまたは複数のポーズを識別することによって、触媒された化学変換を受けるという該基質に関する制約を識別するステップをさらに含む、前記項目のいずれかに記載の方法。
(項目18)
前記制約が、位置の制約、距離の制約、角度の制約、およびねじれの制約の1つまたは複数を含む、前記項目のいずれかに記載の方法。
(項目19)
前記制約が、前記基質上の特定の部分と、前記活性部位における特定の残基または残基部分との間の距離を含む、前記項目のいずれかに記載の方法。
(項目20)
前記制約が、前記基質上の特定の部分と、コファクター上の特定の残基または残基部分との間の距離を含む、前記項目のいずれかに記載の方法。
(項目21)
前記制約が、前記基質上の特定の部分と、前記活性部位における理想的に配置された天然基質との間の距離を含む、前記項目のいずれかに記載の方法。
(項目22)
前記複数の酵素バリアントに1つまたは複数の酵素の制約のセットを適用するステップをさらに含み、該1つまたは複数の酵素の制約は、天然基質が野生型酵素の存在下で触媒された化学変換を受ける場合の該野生型酵素の制約に類似している、前記項目のいずれかに記載の方法。
(項目23)
前記基質の前記複数のポーズが、高温での分子動力学、ランダムなローテーション、グリッドベースのアニーリングのシミュレートによる改良、グリッドベースのまたは十分な力場の最小化、およびそれらのいずれかの組合せからなる群から選択される1つまたは複数のドッキングオペレーションにより得られる、前記項目のいずれかに記載の方法。
(項目24)
リガンドの前記複数のポーズが、前記活性部位における前記基質の少なくとも約10のポーズを含む、前記項目のいずれかに記載の方法。
(項目25)
(c)における前記選択するステップが、他のバリアントとの比較により、多数の活性ポーズを有すると決定されたバリアントを識別するステップを含む、前記項目のいずれかに記載の方法。
(項目26)
(c)における前記選択するステップが、
前記バリアントが有する活性ポーズの数、該活性ポーズのドッキングスコア、および該活性ポーズの結合エネルギーの1つまたは複数により該バリアントをランク付けするステップと、
該バリアントのランクに基づきバリアントを選択するステップと
を含む、前記項目のいずれかに記載の方法。
(項目27)
前記ドッキングスコアが、ファンデルワールス力および静電相互作用に基づいている、項目26に記載の方法。
(項目28)
前記結合エネルギーが、ファンデルワールス力、静電相互作用、および溶媒和エネルギーの1つまたは複数に基づいている、項目26に記載の方法。
(項目29)
(c)で選択された少なくとも1つのバリアントの少なくとも一部を含有するかまたはコードする複数のオリゴヌクレオチドを調製するステップと、
該複数のオリゴヌクレオチドを使用して1つまたは複数のラウンドの指向進化を実施するステップと
をさらに含む、前記項目のいずれかに記載の方法。
(項目30)
複数のオリゴヌクレオチドを調製するステップが、前記オリゴヌクレオチドを核酸シンセサイザーを使用して合成するステップを含む、項目29に記載の方法。
(項目31)
1つまたは複数のラウンドの指向進化を実施するステップが、前記複数のオリゴヌクレオチドを断片化して組み換えるステップを含む、項目29から30のいずれかに記載の方法。
(項目32)
1つまたは複数のラウンドの指向進化を実施するステップが、前記複数のオリゴヌクレオチドに対して飽和変異誘発を実施するステップを含む、項目29から31のいずれかに記載の方法。
(項目33)
前記酵素バリアントの少なくとも1つが、所望の触媒活性および/または選択性を有する、前記項目のいずれかに記載の方法。
(項目34)
(c)で選択された前記酵素バリアントの少なくとも1つを合成するステップをさらに含む、前記項目のいずれかに記載の方法。
(項目35)
コンピューターシステムの1つまたは複数のプロセッサーによって実行されるとき、該コンピューターシステムが酵素バリアントの仮想スクリーニングのための方法を実施するコンピューター実行可能命令を記憶した1つまたは複数のコンピューター可読非一時的記憶媒体を含むコンピュータープログラム製品であって、該命令は、
(a)各酵素バリアントごとに、基質の計算上の表示を、該酵素バリアントの活性部位の計算上の表示にドッキングするステップであって、ドッキングは、(i)該活性部位における該基質の複数のポーズを生成し、(ii)該活性部位における該基質のエネルギー的に好ましいポーズを識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決定するステップであって、活性ポーズは、該活性部位で触媒作用を受けるという該基質に関する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該酵素バリアントの少なくとも1つを選択するステップと
を含む、コンピュータープログラム製品。
(項目36)
コンピューターシステムの1つまたは複数のプロセッサーによって実行されるとき、該コンピューターシステムが項目2から28のいずれかに記載の方法を実施するコンピューター実行可能命令をさらに含む、項目35に記載のコンピュータープログラム製品。
(項目37)
1つまたは複数のプロセッサーと、
システムメモリーと
を含むシステムであって、
該1つまたは複数のプロセッサーおよびメモリーは、基質との活性について酵素バリアントを仮想スクリーニングするための方法を実施するように設計されており、該方法は、
(a)各酵素バリアントごとに、該基質の計算上の表示を、該酵素バリアントの活性部位の計算上の表示にドッキングするステップであって、ドッキングは、(i)該活性部位における該基質の複数のポーズを生成し、(ii)該活性部位における該基質のエネルギー的に好ましいポーズを識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決定するステップであって、活性ポーズは、該活性部位で触媒作用を受けるという該基質に関する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該酵素バリアントの少なくとも1つを選択するステップと
を含む、システム。
(項目38)
前記1つまたは複数のプロセッサーおよびメモリーが、項目2から28のいずれかに記載の方法を実施するように設計される、項目37に記載のシステム。
(項目39)
リガンドとの相互作用について複数のタンパク質バリアントをスクリーニングするための1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムを使用して実施される方法であって、
(a)各タンパク質バリアントごとに、該コンピューターシステムによって、該リガンドの計算上の表示を、該タンパク質バリアントの活性部位の計算上の表示にドッキングするステップであって、ドッキングは、(i)該活性部位における該リガンドの複数のポーズを生成し、(ii)該活性部位における該リガンドのエネルギー的に好ましいポーズを識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決定するステップであって、活性ポーズは、タンパク質バリアントとの特定の相互作用を受けるという該リガンドに関する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該タンパク質バリアントの少なくとも1つを選択するステップと
を含む、方法。
(項目40)
前記リガンドが、基質、基質の中間体、基質の遷移状態、基質の生成物、タンパク質バリアントの阻害剤、タンパク質バリアントのアゴニスト、およびタンパク質バリアントのアンタゴニストから選択される、項目39に記載の方法。
これらおよび他の特徴を、関連する図面を参照して以下に提示する。
図1は、プロ−R選択性の触媒反応に関する活性ポーズを識別するための幾何学的な制約を例示し、この反応には、チロシン部分を有するケトンレダクターゼ酵素、アセトフェノン基質、およびコファクターNADPHが関わる。
図2は、一部の実施における候補生体分子の潜在的な活性を分析するためのワークフローを示す流れ図である。
図3Aは、本開示の一部の実施形態にしたがう生体分子の配列を設計するためのワークフローの例を示す流れ図である。
図3Bは、仮想スクリーニングから得られた配列を合成しアッセイすることを含む、生体分子の配列を設計するためのワークフローの例を示す流れ図である。
図3Cは、複数の反復適用の各ラウンドにおいてin vitroの指向進化と仮想スクリーニングとを組み合わせた、生体分子の配列を設計するためのワークフローの例を示す流れ図である。
図4は、本開示の一部の実施形態にしたがって実施することができる例示的なデジタルデバイスを示す。
図5は、指向進化の第2のラウンドからの10の最良のバリアントならびにラウンド1の骨格(Rd1BB)およびラウンド2の骨格(Rd2BB)の結合エネルギーおよび選択性を示すデータのプロットを提供する。
図6Aは、一部の実施形態にしたがう仮想タンパク質スクリーニングシステムからのデータを使用して構築された配列活性モデルの適合度を示す。
図6Bは、結合エネルギーの予測において図6Aで構築されたような配列活性モデルが正確であったことを提示するクロスバリデーションのデータを示す。
図6Cは、図6Aで構築されたような配列活性モデルにしたがう様々な変異についての係数を示す。
図7は、X軸に、転換を提示する量を示し、Y軸に、1,1,1−トリフルオロプロパン−2−オンからの(R)−1,1,1−トリフルオロプロパン(trifluropropan)−2−オールのエナンチオ選択的な生成に関する、ケトレダクターゼバリアントの仮想スクリーニングからの選択性を示す。
図8は、位置選択的なCHのC−OHへの酸化に関するP450の仮想指向進化からの転換およびヒット(一定のレベルの改善を示すバリアント)を提示する量を示す。
詳細な説明
タンパク質および酵素のスクリーニングは、リガンドおよび基質と相互作用するタンパ
ク質および酵素分子の化学的および物理的性質の測定を含む実際的な方法で実施すること
ができる。実際の測定は、時間および資源を消費し、根底にある物理的および化学的機構
はしばしば可視化または操作が困難である。本明細書で開示される「仮想」スクリーニン
グ方法およびシステムは、酵素、タンパク質、ならびにそれらの基質およびリガンドの構
造および動力学を可視化または操作するためのツールを提供する。これらのツールは、分
子を研究するための時間および/または材料を節約することができる。
一部の実施形態では、タンパク質または酵素の仮想スクリーニングは、目的のタンパク
質の指向進化で使用される。仮想スクリーニングは、これらの指向進化の実施形態の様々
な段階中に物理的なスクリーニングの代わりに使用され、実際のスクリーニングが必要と
する物理的な材料または時間を必要とせずに多数の分子および反応を研究することを可能
にする。これらの実施形態は、所望の性質を有するタンパク質および酵素を得るためのプ
ロセスをスピードアップすることができる。また材料および資源も、プロセスにおいて節
約することができる。一部の実施形態は、特定の基質が関与する触媒反応に関する所望の
活性および/または選択性を有する酵素を設計および開発するために特に有用である。
(I.定義)
本明細書で別段に定義されていない限り、本明細書で使用するすべての技術用語および
科学用語は、当業者が一般に理解するのと同じ意味を有する。本明細書に含まれる用語を
含む様々な科学辞書が、当業者に周知であり、利用可能である。本明細書に記載のものと
同様のまたは等価な任意の方法および材料は、本明細書に開示の実施形態の実行において
使用を見出す。
すぐ下に定義した用語は、全体として本明細書を参照することによってより完全に理解
される。定義は、特定の実施形態を記載することのみを目的とし、本明細書に記載の複雑
な概念の理解を助ける。これらは、本開示の全範囲を限定するように意図されていない。
具体的には、本開示は、記載の特定の配列、組成、アルゴリズム、システム、方法論、プ
ロトコル、および試薬に限定されないことが理解されるべきである。なぜなら、これらは
、これらが当業者によって使用される場面に応じて変動し得るためである。
本明細書および添付の特許請求の範囲で使用する場合、単数形の「1つの(a)」、「
1つの(an)」、および「その(the)」は、内容および文脈により別段に明確に要
求されない限り、複数形の指示対象を含む。したがって例えば、「デバイス」への言及は
、このようなデバイスの2つまたはそれより多くの組合せを含む、などである。別段に示
されていない限り、「または」の接続詞は、ブール論理演算子としてその正確な意味で使
用されることが意図されており、選択状況における特徴の選択(Aの選択がBから互に排
他的であるAまたはB)ならびに結合状況における特徴の選択(AおよびBの両方が選択
されるAまたはB)を包含する。
「ドッキング」は、本明細書で使用される場合、分子(例えば、基質またはリガンド)
の計算上の表示の、生体分子(例えば、酵素またはタンパク質)の活性部位の計算上の表
示への結合をシミュレートおよび/または特徴付けるためのコンピューターによるプロセ
スを指す。ドッキングは、典型的には、「ドッカー」コンピュータープログラムを使用し
たコンピューターシステムで実施される。典型的には、ドッキングプロセスの結果は、特
異的な「ポーズ」で活性部位に「ドッキングした」分子の計算上の表示である。複数のド
ッキングプロセスは、分子の同じ計算上の表示と活性部位の同じ計算上の表示との間で実
施されてもよく、それにより結果として活性部位における複数の異なる分子の「ポーズ」
がもたらされる。活性部位の計算上の表示における複数の異なる「ポーズ」の構造、コン
ホメーション、およびエネルギー学を評価することにより、ある特定の「ポーズ」を、リ
ガンドと生体分子との結合に関してよりエネルギー的に好ましいと識別することができる
一部の実施形態では、ドッキングから生成したポーズを評価して、それらが所望の生体
分子との相互作用に関して「活性」であるかどうかを決定する。「活性ポーズ」は、検討
中の活性に関する1つまたは複数の制約を満たすポーズである。「制約」は、ポーズの構
造、幾何学的配置、コンホメーション、エネルギー学などを制限する可能性がある。ある
特定の実施形態では、酵素の活性部位における基質の計算上の表示の「活性ポーズ」は、
酵素による触媒作用に関する条件を満たす。ドッキングが、活性部位の計算上の表示にお
ける基質の計算上の表示の非常に多くの活性ポーズを識別する場合、表示された具体的な
酵素は、基質の生成物への化学変換を触媒するために好ましいと選択されてもよい。
「ドッカー」は、分子(例えば、基質またはリガンド)の計算上の表示と、タンパク質
または他の生体分子における目的の活性部位の計算結果表示との間のドッキングプロセス
を、コンピューターによりシミュレートおよび/または特徴付けるコンピュータープログ
ラムである。
ドッカーは、典型的には、1つまたはそれより多くのプロセッサーなどのハードウェア
と共同して一時的または永久に記憶される場合のあるソフトウェアとして実装される。市
販のドッキングプログラムとしては、CDocker(Accelrys)、DOCK(
カリフォルニア大学、San Francisco)、AutoDock(Scripp
s Research Institute)、FlexX(tripos.com)、
GOLD(ccdc.cam.ac.uk)、およびGLIDE(schrodinge
r.com)がある。
ドッカーを使用するドッキングは、典型的には、活性部位に関して基質およびリガンド
の計算上の表示の「ポーズ」を生成する。これらのポーズは、ドッキングスコアを生成し
、または他の方法でドッキングを評価するために使用され得る。一部の実施形態では、ポ
ーズは、ドッカーによって計算された相互作用エネルギーの値と関連する。一部のポーズ
は、他のポーズよりエネルギー的に好ましい。一部の実施形態では、ドッカーは、ドッキ
ングを評価するために使用するためにユーザーがいくつかのポーズ(n)を指定すること
を可能にする。最良のドッキングスコアを有する上位n個のポーズのみが、ドッキングを
評価するために考慮される。一部の実施形態では、規定された基準を満たす好ましい相互
作用エネルギーを有するポーズのみが選択されて、活性または不活性ポーズとして分類さ
れる。
一部の実施形態では、ドッカーは、基質またはリガンドの1つまたは複数のポーズが生
体分子との好ましい相互作用エネルギーを有する場合、その基質またはリガンドは生体分
子と結合する可能性が高いことを決定することができる。結合したリガンドは、アゴニス
トまたはアンタゴニストとして作用し得る。様々なドッカーが、基質またはリガンドと生
体分子との間のドッキングスコアまたは他の結合尺度を出力する。生体分子の活性部位と
基質またはリガンドとの一部の組合せに関して、ドッキングプログラムは、結合が起こる
可能性が低いことを決定する。このような場合では、ドッキングプログラムは、基質また
はリガンドは生体分子と結合しないという結論を出力する。
ドッカーは、リガンドが生体分子の活性部位とドッキングする見込みの評価、またはこ
のようなドッキングの、それが起こった場合の品質を出力するようにプログラムされる場
合がある。ドッキングの見込みおよび品質は、リガンドが生体分子と結合する見込みを提
示する。一レベルにおいて、ドッカーは、リガンドが生体分子の活性部位に結合する見込
みがあるか否かを判定する。ドッカーのロジックが、結合の見込みがない、または結合が
高度に不都合であると結論付ける場合、これは、「洗練されたポーズが見つからなかった
」という結果を出力し得る。これは、ドッキングプログラムが生成したすべてのコンホメ
ーションが活性部位との不都合なファンデルワールス衝突および/または静電反発を有す
るとき起こり得る。ドッキング手順の上記例では、第2のオペレーションにより、閾値未
満のソフトエネルギーを有するポーズを見つけることができない場合、ドッカーは、「洗
練されたポーズが見つからなかった」などの結果を返し得る。ソフトエネルギーは、ファ
ンデルワールス力および静電気力を含めた非結合相互作用を主に考慮するので、「洗練さ
れたポーズが見つからなかった」という結果は、リガンドが、所与の数のポーズについて
、生体分子の受容体との厳しい立体的衝突および/または静電反発を有することを意味す
る。
ある特定の実施形態では、ドッカーは、リガンドと生体分子の活性部位との間の相互作
用を表すドッキングスコアを出力する。ドッカーは、リガンド−生体分子相互作用の様々
な特徴を算出し得る。一例では、出力は単に、リガンドと生体分子との間の相互作用エネ
ルギーである。別の実施形態では、全エネルギーが出力される。全エネルギーは、リガン
ド−生体分子相互作用エネルギーとリガンドの歪みとの組合せであると理解される場合が
ある。ある特定の実施では、このようなエネルギーは、CHARMmなどの力場を使用し
て算出され得る。
様々な実施形態では、ドッキングプログラムは、生体分子の活性部位におけるリガンド
の複数のポーズを考慮することによってこのような出力を生成する。各ポーズは、独自の
関連したエネルギー値を有する。一部の実施形態では、ドッキングプログラムは、ポーズ
をランク付けし、高ランクのポーズの1つまたは複数と関連したエネルギーを考慮する。
一部の場合では、これは、ある特定の高ランクのポーズのエネルギーを平均し、または他
の方法で上位ランクのポーズの統計分析を実施し得る。他の実施形態では、これは単に、
上位ランクのポーズに支持された値を選択し、これをドッキングについて得られたエネル
ギーとして出力する。
一部の実施形態では、基質の計算上の表示は、基質分子を所望の生成物分子に転換でき
る酵素反応の反応座標に沿った分子種に対応する。一部の実施形態では、基質の計算上の
表示は、基質分子それ自体を表示する。一部の実施形態では、基質の計算上の表示は、反
応座標に沿って形成される基質の中間体構造(すなわち、「基質の反応中間体」)を表示
する。一部の実施形態では、基質の計算上の表示は、酵素反応座標に沿って形成される遷
移状態の構造(すなわち、「基質の遷移状態」)を表示する。
一部の実施形態では、リガンドの計算上の表示は、酵素または生体分子に強く結合する
が反応座標に沿って所望の生成物に進行しない分子種を表示することができる。例えば、
リガンドの計算上の表示は、酵素の阻害剤またはタンパク質(例えば、受容体)の強く結
合するアンタゴニストもしくはアゴニストについてスクリーニングするために、強い阻害
剤を表示することができる。
「ポーズ」は、生物学的分子の活性部位に対する基質またはリガンドの位置または配向
である。ポーズでは、リガンドのいくつかまたはすべての原子の3次元位置が、活性部位
中の原子のいくつかまたはすべての位置に対して指定される。コンホメーションは活性部
位を考慮しないので、リガンドのコンホメーションはそのポーズではないが、コンホメー
ションを、ポーズを判定するために使用することができる。一部の実施形態では、リガン
ドの配向およびコンホメーションが一緒にポーズを定義する。一部の実施形態では、ポー
ズは、リガンドの配向/コンホメーションの組合せが、参照活性部位における定義された
閾値エネルギーレベルを満たす場合のみ存在する。
様々な計算の仕組みをドッキングのためにポーズを生成するために使用することができ
る。例としては、回転可能な結合についての系統的または確率論的ねじれサーチ(tor
sional search)、分子動力学シミュレーション、および新しい低エネルギ
ーコンホメーションを「進化させる」ための遺伝的アルゴリズムがある。これらの技法が
使用されて、「ポーズ空間」を探索するためのリガンドおよび/または活性部位の計算上
の表示が修正される。
ドッカーは、ポーズを評価してどのようにリガンドが活性部位と相互作用するかを判定
する。一部の実施形態では、これらは、上述した相互作用タイプの1つまたは複数(例え
ば、ファンデルワールス力)に基づいて相互作用のエネルギーを算出することによってこ
れを行う。この情報は、ドッキングを特徴付け、一部の場合では、ドッキングスコアを生
成するために使用される。一部の実施では、ドッカーは、ドッキングスコアに基づいてポ
ーズをランク付けする。一部の実施では、ドッカーは、考慮事項から不都合なドッキング
スコアを有するポーズを除去する。
ある特定の実施形態では、仮想タンパク質スクリーニングシステムがポーズを評価して
、ポーズが活性であるか否かを判定する。ポーズは、それが検討中の所望の活性にとって
重要であることが分かっている定義された制約を満たす場合、活性であると見なされる。
一例として、仮想タンパク質スクリーニングシステムは、ポーズが活性部位におけるリガ
ンドの触媒的変換をサポートするか否かを判定し得る。
「リガンド」は、生体分子の活性部位と相互作用して、少なくともリガンドおよび生体
分子を含有する安定な複合体を形成する分子または複合体である。リガンドおよび生体分
子に加えて、安定な複合体は、他の化学エンティティ、例えば、有機および無機コファク
ター(例えば、補酵素および補欠分子族)、金属イオンなどを含み得る(時に必要とする
)。リガンドは、アゴニストまたはアンタゴニストであり得る。
生体分子の「活性部位」は、分子(例えば、基質またはリガンド)の全部または一部を
含有するか、および/またはそれらと結合することができる生体分子の構造によって規定
される部位である。多くのタイプの活性部位が企図されており、これらの一部は本明細書
の他所で説明される。しばしば活性部位は、基質またはリガンドとの結合相互作用を形成
することができる化学的および/または物理的な特徴(例えば、アミノ酸残基)を含有す
る。一部の実施形態では(例えば、生体分子が酵素である場合)、「活性部位」は、少な
くとも1つの触媒性残基および複数の結合残基、および時には他の化学エンティティ、例
えば有機および無機コファクター(例えば、補酵素および補欠分子族)、金属イオンなど
を含む。活性部位の少なくとも1つの触媒性残基は、基質の転換を触媒する触媒性部分を
含有していてもよい。活性部位の結合残基は基質との結合相互作用をもたらし、立体選択
的および/または位置選択的な方式で活性部位中にそれを保持する。このような相互作用
としては、ファンデルワールス相互作用、静電相互作用、水素結合、親水性相互作用、疎
水性相互作用、溶媒相互作用、共有結合などを挙げることができる。
一部の実施形態では、活性部位の計算上の表示は、基質の計算上の表示またはリガンド
をドッキングし、それによって、活性部位との好ましい相互作用に関して評価することが
できるポーズを生成するために使用できる(例えば、ポーズについての結合エネルギーの
決定)。
一部の実施形態では、活性部位の計算上の表示は、球体または他の形状によって幾何学
的に規定される。一部の実施形態では、活性部位は、選択された物体(例えば、リガンド
および/または構造鋳型中の他の化学エンティティ)の質量中心をそれらが含まれるよう
に調整された半径で取り巻く球体を作製することによって規定される。最小半径は5Åで
あるが、活性部位のサイズは、球体の半径を1Å、2Å、3Å、4Å、6Å、8Å、10
Åなど増加させることによって拡張することができる。一部の実施において、半径のサイ
ズは、基質近傍の残基を捕捉するように選択される。それゆえに、より大きい基質は、よ
り大きい半径に関連し、小さい基質は、より小さい半径に関連する。本開示がいずれの特
定の半径の値に限定されることは意図されない。一部の実施形態では、活性部位は、受容
体の空洞から規定することができ、その場合、活性部位は、構造鋳型中で検出された空洞
の1つから誘導された。一部の実施形態では、構造鋳型のタンパク質データバンク(PD
B)ファイルはサイトの記録を使用して規定された活性部位を含むことが多いため、活性
部位は、PDBサイトの記録から規定することができる。構造鋳型を使用して全てのホモ
ロジーモデルが作製され得るため、規定された活性部位は、全てのホモロジーモデルに移
行可能である。
一部の実施形態では、活性部位の計算上の表示は、様々な3次元形状、例えば基質およ
び/または酵素上の部分を参照してユーザーがカスタマイズ可能な形状(例えば、楕円ま
たは基質の構造を反映した不規則な形状)などによって規定することができる。
一部の実施形態では、活性部位の計算上の表示は、活性部位における基質またはリガン
ド分子と直接的に(例えば、ファンデルワールス相互作用、静電相互作用、水素結合を介
して)相互作用しないが、活性部位の計算上の表示で他のアミノ酸と相互作用し、それに
よって基質またはリガンドのポーズの評価に影響を与えるアミノ酸を含むように規定する
ことができる。
一部の実施形態では、触媒作用および/または結合に寄与する残基は、上記で規定され
たような活性部位の計算上の表示の外側に存在していてもよい。このような残基は、変異
または組換えのための候補として活性部位以外の残基を検討することによって、指向進化
中に改変されてもよい。
「反応中間体」は、基質からの反応生成物への変換において基質から生成される化学実体
である。基質の「遷移状態」は、反応経路に沿った最高ポテンシャルエネルギーに相当す
る状態にある基質である。一過性の存在を有する傾向がある遷移状態において、反応物分
子の衝突が進行して生成物を形成する。本開示では、基質があるプロセスにおいて記載さ
れている場合に時には、中間体および遷移状態も、そのプロセスにとって適当であり得る
。このような局面では、基質、中間体、および遷移状態は、「リガンド」と総称して呼ば
れる場合がある。一部の場合には、複数の中間体が、基質の触媒的変換において生成され
る。ある特定の実施形態では、分析のために選択されるリガンド種(基質または中間体ま
たは遷移状態)は、触媒的変換の律速段階に関連していると公知であるものである。一例
として、酵素コファクターに共有結合的に結合した基質は、律速の段階において化学修飾
され得る。このような場合には、基質−コファクター種が相互作用をモデル化するために
使用される。
「リガンド」は、生体分子に結合することができる分子であり、結合してさらに触媒に
よる化学変換を受けることができる「基質」分子も含み得る。いくつかのリガンドは、活
性部位と結合するが、触媒的変換を起こさない。例としては、薬物設計分野において評価
されるリガンドがある。このようなリガンドは、薬理学的目的のために標的生体分子と非
共有結合的に結合するその能力について選択される低分子であり得る。一部の場合には、
リガンドは、生体分子の天然の挙動を増強、活性化、または阻害するその能力について評
価される。
「生体分子」または「生物学的分子」は、一般に生物有機体中に見つかるまたは生物有
機体によって生成される分子を指す。一部の実施形態では、生物学的分子は、複数のサブ
ユニットを有するポリマー生物学的巨大分子(すなわち、「バイオポリマー」)を含む。
典型的な生体分子としては、タンパク質、酵素、および他のポリペプチド、DNA、RN
Aおよび他のポリヌクレオチドが挙げられ、さらに、天然に存在するポリマー、例えばR
NA(ヌクレオチドサブユニットから形成される)、DNA(ヌクレオチドサブユニット
から形成される)、およびペプチドまたはポリペプチド(アミノ酸サブユニットから形成
される)といくつかの構造的特徴を共有する分子、例えば、RNA類似体、DNA類似体
、ポリペプチド類似体、ペプチド核酸(PNA)、RNAおよびDNAの組合せ(例えば
、キメラプラスト)なども挙げることができる。生体分子がいずれかの特定の分子に限定
されることは意図されていない。なぜなら、それだけに限らないが、例えば、脂質、炭水
化物、または1つもしくは複数の遺伝的にコード可能な分子(例えば、1つもしくは複数
の酵素もしくは酵素経路)などによって作製される他の有機分子などを含めて、任意の適
当な生物学的分子が本開示において有用であるためである。本開示の一部の態様にとって
特に目的のものは、リガンドと相互作用して化学的または生物学的変換、例えば、基質の
触媒変換、生体分子の活性化、または生体分子、特に酵素の不活化を行う活性部位を有す
る生体分子である。
一部の実施形態では、「有益な性質」または「活性」は、触媒反応速度(kcat)、
基質結合親和性(K)、触媒効率(kcat/K)、基質特異性、化学選択性、位置
選択性、立体選択性、立体特異性、リガンド特異性、受容体アゴニズム、受容体アンタゴ
ニズム、コファクターの転換、酸素安定性、タンパク質発現レベル、溶解度、熱活性、熱
安定性、pH活性、pH安定性(例えば、アルカリ性もしくは酸性pHにおける)、グル
コース阻害、ならびに/または阻害剤(例えば、酢酸、レクチン、タンニン酸、およびフ
ェノール化合物)およびプロテアーゼに対する耐性、の1つまたはそれより多くの増大ま
たは低下である。他の所望の活性として、特定の刺激に対する応答におけるプロファイル
の変化;例えば、温度および/またはpHプロファイルの変化を挙げることができる。合
理的なリガンド設計において、標的化共有結合的阻害(TCI)の最適化は、活性の一タ
イプである。一部の実施形態では、本明細書に記載するようにスクリーニングされる2種
またはそれより多くのバリアントは、同じ基質に対して作用するが、以下の活性:生成物
形成の速度、基質から生成物へのパーセント転換、選択性、および/またはコファクター
のパーセント転換の1つまたはそれより多くに関して異なる。本開示がいずれかの特定の
有益な性質および/または所望の活性に限定されることは意図されていない。
一部の実施形態では、「活性」は、基質から生成物への転換を触媒する酵素の能力とい
うより限定された概念を記述するために使用される。関連した酵素特性は、特定の生成物
、例えば、鏡像異性体または位置選択的生成物などに対するその「選択性」である。本明
細書に提示される「活性」の広い定義には選択性が含まれるが、慣例的に、選択性は、時
に酵素活性と異なるとみなされる。
用語「タンパク質」、「ポリペプチド」、および「ペプチド」は、長さまたは翻訳後修
飾(例えば、グリコシル化、リン酸化、脂質修飾、ミリスチル化(myristilat
ion)、ユビキチン化など)にかかわらず、アミド結合によって共有結合的に連結され
た少なくとも2つのアミノ酸のポリマーを表すために互換的に使用される。一部の場合に
は、ポリマーは、少なくとも約30のアミノ酸残基、通常少なくとも約50のアミノ酸残
基を有する。より典型的には、これらは、少なくとも約100のアミノ酸残基を含有する
。この用語は、全長タンパク質またはペプチドの断片であると慣例的に見なされる組成物
を含む。この定義内に含まれるのは、D−およびL−アミノ酸、ならびにD−とL−アミ
ノ酸の混合物である。本明細書に記載のポリペプチドは、遺伝的にコードされるアミノ酸
に制限されない。実際に、遺伝的にコードされるアミノ酸に加えて、本明細書に記載のポ
リペプチドは、全体的にまたは部分的に、天然に存在するおよび/または合成の非コード
アミノ酸で構成され得る。一部の実施形態では、ポリペプチドは、全長親ポリペプチドの
アミノ酸配列と比較した場合に、アミノ酸の付加もしくは欠失(例えば、ギャップ)、お
よび/または置換を含有するが、依然として機能活性(例えば、触媒活性)を保持する全
長祖先または親ポリペプチドの一部である。
「野生型(wild type)」または「野生型(wildtype)」(WT)の
生体分子または生物は、それが自然に発生するときに典型的な形態の種の表現型を有する
ものである。時には、野生型の生体分子は、天然に存在する源から単離される。他の場合
には、野生型の生体分子は、実験室の環境で誘導される。通常、野生型の生体分子は、変
異ゲノムとは対照的に、正常なまたは参照ゲノムの遺伝子配列に関するか、またはそれに
よってコードされている。「野生型の生体分子」の定義内には、天然型と同一な配列を有
するポリペプチドまたはポリヌクレオチドの組換え形態が含まれる。野生型の生体分子と
反応する基質またはリガンドは、時には、「天然」基質またはリガンドとみなされる。
本明細書において使用される場合、用語「バリアント」、「変異体」、「変異体配列」
、および「バリアント配列」は、標準または参照配列(例えば、一部の実施形態では、親
配列)といくつかの点で異なる生物学的配列を指す。この差異は、「変異」と呼ばれる場
合がある。一部の実施形態では、変異体は、少なくとも1つの置換、挿入、クロスオーバ
ー、欠失、および/または他の遺伝子操作によって変更されたポリペプチドまたはポリヌ
クレオチド配列である。本開示の目的に関して、変異体およびバリアントは、これらが生
成される特定の方法に限定されない。一部の実施形態では、変異体またはバリアント配列
は、親配列と比較して、増大した、低下した、または実質的に同様の活性または性質を有
する。一部の実施形態では、バリアントポリペプチドは、野生型ポリペプチド(例えば、
親ポリペプチド)のアミノ酸配列と比較した場合に変異させられた1つまたはそれより多
くのアミノ酸残基を含む。一部の実施形態では、ポリペプチドの1つまたはそれより多く
のアミノ酸残基は、複数のポリペプチドを構成するバリアントポリペプチドにおいて、親
ポリペプチドと比較した場合に一定に保たれ、不変であり、または変異させられていない
。一部の実施形態では、親ポリペプチドは、改善された安定性、活性、または任意の他の
所望の性質を有するバリアントを生成するための基盤として使用される。
本明細書において使用される場合、用語「酵素バリアント」および「バリアント酵素」
は、特にこれらの機能において参照酵素と同様であるが、これらを野生型または別の参照
酵素と配列が異なったものにするこれらのアミノ酸配列中の変異を有する酵素に言及して
使用される。酵素バリアントは、当業者に周知の多種多様な異なる変異誘発技法によって
作製することができる。さらに、変異誘発キットも、多くの商業的な分子生物学の供給業
者から入手可能である。規定のアミノ酸における特異的置換(部位指向性)、遺伝子の局
所領域内の特異的もしくはランダム変異(位置特異的)、または遺伝子全体にわたるラン
ダム変異誘発(例えば、飽和変異誘発)を行う方法が利用可能である。酵素バリアントを
生成するための多数の適当な方法が当業者に公知であり、これらとしては、それだけに限
らないが、PCRを使用する一本鎖DNAもしくは二本鎖DNAの部位指向性変異誘発、
カセット変異誘発、遺伝子合成、エラープローンPCR、シャッフリング、および化学的
飽和変異誘発、または当技術分野で公知の任意の他の適当な方法がある。バリアントが生
成された後、これらを所望の性質(例えば、高いもしくは増大した;または低いもしくは
低減された活性、増大した熱安定性および/またはアルカリ安定性など)についてスクリ
ーニングすることができる。
「酵素のパネル」は、パネルの各メンバーが同じ化学反応を触媒するように選択された
酵素の群である。一部の実施形態では、パネルのメンバーは、それぞれが同じ反応を起こ
して複数の基質を一括して転換することができる。多くの場合、パネルメンバーは、複数
の基質を効率的に転換するように選択される。一部の場合には、パネルは、市販されてい
る。他の場合には、これらは、ある企業体が独占している。例えば、パネルは、スクリー
ニング手順でヒットとして識別された様々な酵素を含み得る。ある特定の実施形態では、
パネルの1つまたはそれより多くのメンバーは、計算上の表示としてのみ存在する。言い
換えれば、その酵素は、仮想の酵素である。
「モデル」は、生体分子またはリガンドの構造の表示である。それは、時に原子の3次
元位置の集合物、または表示されているエンティティの部分として提供される。モデルは
、活性部位または酵素バリアントの他の態様の計算的に生成された表示を含有することが
多い。本明細書の実施形態に関連したモデルの例は、ホモロジーモデリング、タンパク質
スレッディング、またはRosetta(rosettacommons.org/so
ftware/)などのルーチンを使用するab initioタンパク質モデリング、
または分子動力学シミュレーションから生成される。
「ホモロジーモデル」は、検討中のリガンドの活性部位を少なくとも含有するタンパク
質またはタンパク質の一部の3次元モデルである。ホモロジーモデリングは、タンパク質
構造が相同タンパク質間で保存される傾向があるという観察結果に依拠する。ホモロジー
モデルは、骨格および側鎖を含めた残基の3次元位置を提供する。モデルは、モデル化さ
れた配列の構造に類似する可能性が高い相同タンパク質の構造鋳型から生成される。一部
の実施形態では、構造鋳型は、「配列を鋳型にアライメントする」および「ホモロジーモ
デルを構築する」という2つのステップで使用される。
「配列を鋳型にアライメントする」ステップは、モデル配列を1つまたはそれより多く
の構造鋳型配列にアライメントし、ホモロジーモデルを構築するための入力配列アライメ
ントを準備する。アラインメントにより、モデル配列と構造鋳型配列(複数可)との間の
ギャップおよび相違する他の領域が識別される。
「ホモロジーモデルを構築する」ステップは、構造鋳型の構造的特徴を使用して空間的
拘束を導出する。空間的拘束はひいては、例えば、共役勾配およびシミュレーテッドアニ
ーリング最適化手順を使用してモデルタンパク質構造を生成するために使用される。鋳型
の構造的特徴は、NMRまたはX線結晶構造解析法などの技法から得られ得る。このよう
な技法の例は、Qu X、Swanson R、Day R、Tsai、J.、Curr
Protein Pept Sci.、2009年6月;10巻(3号):270〜8
5頁による総説「A Guide to Template Based Struct
ure Prediction」において見つけることができる。
用語「活性コンホメーション」は、タンパク質が基質を化学変換(例えば、触媒反応)
させることを可能にするタンパク質(例えば、酵素)のコンホメーションについての言及
において使用される。
「活性ポーズ」は、リガンドが触媒的変換を起こす可能性が高い、または結合部位との
共有結合的結合などのいくつかの所望の役割を果たすポーズである。
用語「酸化還元」、「酸化−還元」、および「レドックス」は、1つの反応が酸化であ
り逆が還元である可逆的な化学反応を指して互換的に使用される。この用語はまた、原子
がそれらの酸化状態を変化させる全ての化学反応を指すためにも使用され、一般的に、酸
化還元反応は、種間の電子の移動を含む。これは、簡単な酸化還元プロセス、例えば炭素
が酸化されて二酸化炭素(CO)が生じるプロセス、もしくは炭素が水素で還元されて
メタン(CH4)が生じるプロセス、または複雑なプロセス、例えば一連の複雑な電子伝
達プロセスを介したヒトの体におけるグルコース(C12)の酸化のいずれかで
あり得る。
「オキシドレダクターゼ」は、酸化還元反応を触媒する酵素である。
用語「トランスフェレーション(transferation)」は、本明細書におい
て、一方の化合物から他方の化合物に官能基を移す化学反応を指すものとして使用される
。「トランスフェラーゼ」は、トランスフェレーション反応を触媒する様々な酵素のいず
れかを指すために使用される。
用語「加水分解」は、水が化合物と反応して他の化合物を生成する化学反応を指すため
に使用され、この反応は、水由来の水素カチオンおよび水酸化物アニオンの付加による化
学結合の開裂を含む。
「ヒドロラーゼ」は、加水分解反応を触媒する酵素である。
用語「異性化」は、化合物を異性体に転換する化学反応を指すために使用される。
「イソメラーゼ」は、異性化反応を触媒し、その基質を異性体の形態に変化させる酵素
である。
用語「ライゲーション」は、本明細書において、新しい化学結合を形成することによっ
て2つの分子を合体させるあらゆる化学反応を指すために使用される。一部の実施形態で
は、ライゲーション反応は、より大きい分子の1つに属する小さい化学基の加水分解を含
む。一部の実施形態では、酵素は2つの化合物を一緒に連結させることを触媒し、例えば
C−O、C−S、C−Nなどの合体を触媒する酵素である。ライゲーション反応を触媒す
る酵素は、「リガーゼ」と称される。
「リアーゼ」は、加水分解および酸化以外の手段によって様々な化学結合の破断を触媒
する酵素である。一部の実施形態では、リアーゼ反応は、新しい二重結合または新しい環
構造を形成する。
「ケトレダクターゼ」は、典型的にはコファクターNADPHを使用して、立体特異的
にケト基をヒドロキシル基に還元する酵素である(例えば、WO2008103248A
2、WO2009029554A2、WO2009036404A2、WO200904
2984A1、WO2009046153A1、およびWO2010025238A2で
開示されたバリアントを参照)。
「トランスアミナーゼ」または「アミノトランスフェラーゼ」は、アミノ酸とα−ケト
酸とのアミノ基転移反応を触媒する酵素であり、アミノ酸上のアミン基NHがα−ケト
酸上のケト基=Oと交換される(例えば、WO2010081053A2およびWO20
10099501A2で開示されたバリアントを参照)。
「シトクロム」タンパク質(「CYP」と略記される)は、有機物質の酸化に関与する
酵素である。一例は、シトクロムP450酵素である。CYP酵素の基質としては、これ
らに限定されないが、代謝中間体、例えば脂質およびステロイドホルモン、加えて生体異
物、例えば薬物および他の有毒化学物質が挙げられる。CYPは、薬物代謝および生体内
活性化に関与する主要な酵素である。CYPは、酵素反応における基質として、様々な低
分子および大分子を使用する。シトクロムP450によって触媒される最も一般的な反応
は、モノオキシゲナーゼ反応であり、例えば、一方の酸素原子を有機基質(RH)に挿入
し、同時に他方の酸素原子は還元されて水になる。シトクロムP450酵素は、ヘムコフ
ァクターを含有するタンパク質のスーパーファミリーに属しており、そのためヘムタンパ
ク質である。一般的にこれらは、電子伝達鎖において末端のオキシダーゼ酵素である。C
odexisより入手可能なMicroCyp(登録商標)スクリーニングプレートおよ
び酵素は、薬物生成代謝産物および新規のリード化合物の生成に有用である(例えば、W
O2002083868A2、WO2005017105A2、WO200501711
6A2、およびWO2003008563A2で開示されたバリアントを参照)。
「バイヤー−ビリガーモノオキシゲナーゼ」は、バイヤー−ビリガー酸化反応を触媒す
るためにNADPHおよび分子酸素を採用する酵素であり、酸素原子は、カルボニル系基
質の炭素−炭素結合に挿入される(例えば、WO2011071982A2およびWO2
012078800A2におけるバリアントを参照)。
「モノアミンオキシダーゼ」(MAO)(EC1.4.3.4)は、2炭素の鎖(−C
−CH−)により芳香環に接続されている1つのアミノ基を含有する、神経伝達物
質および神経調節物質であるモノアミンの酸化を触媒する酵素である。MAOは、フラビ
ン含有アミンオキシドレダクターゼのタンパク質ファミリーに属する(例えば、WO20
10008828A2におけるバリアントを参照)。
「ニトリラーゼ」またはニトリルアミノヒドロラーゼ(EC3.5.5.1)は、「遊
離の」アミド中間体の形成を伴わずにカルボン酸およびアンモニアへのニトリルの加水分
解を触媒する酵素である(例えば、WO2011011630A2におけるバリアントを
参照)。
「イミンレダクターゼ」は、炭素−窒素二重結合を含有するイミン官能基の還元を触媒
し、電子を窒素原子に供与して二重結合を破断させる酵素である。
「エノンレダクターゼ」は、アルケンおよびケトンの共役系を含むエノン官能基の還元
を触媒し、ケトまたはアルケン二重結合を破断させる酵素である(例えば、WO2010
075574A2で開示されたバリアントを参照)。
「アシラーゼ」は、アシルアミドまたはアシルエステル結合の加水開裂を触媒する酵素
である(例えば、WO2010054319A2におけるペニシリンGアシラーゼのバリ
アントを参照)。
「ハロヒドリンデハロゲナーゼ」「HHDH」は、ビシナルハロヒドリンの分解に関与
する酵素である。例えば、Agrobacterium radiobacter AD
1において、ハロヒドリンデハロゲナーゼは、ハロヒドリンの脱ハロゲン化を触媒して対
応するエポキシドを生成する(例えば、WO2010080635A2で開示されたバリ
アントを参照)。
用語「配列」は、それだけに限らないが、全ゲノム、全染色体、染色体セグメント、相
互作用する遺伝子についての遺伝子配列のコレクション、遺伝子、核酸配列、タンパク質
、ペプチド、ポリペプチド、多糖などを含めた任意の生物学的配列の順序およびアイデン
ティティーを指すために本明細書で使用される。一部の文脈では、「配列」は、タンパク
質中のアミノ酸残基の順序およびアイデンティティー(すなわち、タンパク質配列もしく
はタンパク質文字列)、または核酸中のヌクレオチドの順序およびアイデンティティー(
すなわち、核酸配列もしくは核酸文字列)を指す。配列は、文字列によって表示され得る
。「核酸配列」は、核酸を構成するヌクレオチドの順序およびアイデンティティーを指す
。「タンパク質配列」は、タンパク質またはペプチドを構成するアミノ酸の順序およびア
イデンティティーを指す。
「コドン」は、遺伝子コードの一部であり、かつタンパク質中の特定のアミノ酸を指定
する、またはタンパク質合成を開始もしくは停止する3つの連続したヌクレオチドの特異
的配列を指す。
用語「遺伝子」は、DNAまたは生物学的機能に関連した他の核酸の任意のセグメント
を指すために広く使用される。したがって、遺伝子は、コード配列および任意選択で、こ
れらの発現に要求される制御配列を含む。遺伝子は、例えば、他のタンパク質の認識配列
を形成する非発現核酸セグメントも任意選択で含む。遺伝子は、目的の源からのクローニ
ング、または公知のもしくは予測された配列情報からの合成を含めて、様々な源から得る
ことができ、所望のパラメータを有するように設計された配列を含み得る。
「部分(moiety)」は、官能基全体または下部構造としての官能基の一部を含み
得る分子の一部であり、一方、官能基は、これらの分子の特徴的な化学反応を担う分子内
の原子または結合の群である。
「スクリーニング」は、1つまたはそれより多くの生体分子の1つまたはそれより多く
の性質が決定されるプロセスを指す。例えば、典型的なスクリーニングプロセスには、1
つまたはそれより多くのライブラリーの1つまたはそれより多くのメンバーの1つまたは
それより多くの性質が決定されるものが含まれる。スクリーニングは、生体分子の計算モ
デルおよび生体分子の仮想環境を使用して計算的に実施することができる。一部の実施形
態では、仮想タンパク質スクリーニングシステムが、所望の活性および選択性の選択され
た酵素について提供される。
「発現系」は、遺伝子または他の核酸によってコードされるタンパク質またはペプチド
を発現させるための系である。
「指向進化」、「誘導進化(guided evolution)」、または「人工進
化」は、人為的な淘汰、変異、組換え、または他の操作によって1つまたはそれより多く
の生体分子配列(またはその配列を表示する文字列)を人工的に変化させるin sil
ico、in vitro、またはin vivoプロセスを指す。一部の実施形態では
、指向進化は、(1)個体の品種、(2)遺伝性遺伝情報を有するいくつかの品種、(3
)適合度の異なるいくつかの品種が存在する再現集団(reproductive po
pulation)内で生じる。再現の成功は、有益な特性などの所定の特性についての
選択の転帰によって決定される。再現集団は、例えば、in vitroプロセスにおけ
る物理的集団、またはin silicoプロセスにおけるコンピューターシステム内の
仮想集団とすることができる。
指向進化方法は、発現させ、スクリーニングし、アッセイすることができるバリアント
ライブラリーを生成するために、ポリヌクレオチドに容易に適用されることができる。変
異誘発法および指向進化方法は、当技術分野で周知である(例えば、米国特許第5,60
5,793号、同第5,830,721号、同第6,132,970号、同第6,420
,175号、同第6,277,638号、同第6,365,408号、同第6,602,
986号、同第7,288,375号、同第6,287,861号、同第6,297,0
53号、同第6,576,467号、同第6,444,468号、同第5,811238
号、同第6,117,679号、同第6,165,793号、同第6,180,406号
、同第6,291,242号、同第6,995,017号、同第6,395,547号、
同第6,506,602号、同第6,519,065号、同第6,506,603号、同
第6,413,774号、同第6,573,098号、同第6,323,030号、同第
6,344,356号、同第6,372,497号、同第7,868,138号、同第5
,834,252号、同第5,928,905号、同第6,489,146号、同第6,
096,548号、同第6,387,702号、同第6,391,552号、同第6,3
58,742号、同第6,482,647号、同第6,335,160号、同第6,65
3,072号、同第6,355,484号、同第6,03,344号、同第6,319,
713号、同第6,613,514号、同第6,455,253号、同第6,579,6
78号、同第6,586,182号、同第6,406,855号、同第6,946,29
6号、同第7,534,564号、同第7,776,598号、同第5,837,458
号、同第6,391,640号、同第6,309,883号、同第7,105,297号
、同第7,795,030号、同第6,326,204号、同第6,251,674号、
同第6,716,631号、同第6,528,311号、同第6,287,862号、同
第6,335,198号、同第6,352,859号、同第6,379,964号、同第
7,148,054号、同第7,629,170号、同第7,620,500号、同第6
,365,377号、同第6,358,740号、同第6,406,910号、同第6,
413,745号、同第6,436,675号、同第6,961,664号、同第7,4
30,477号、同第7,873,499号、同第7,702,464号、同第7,78
3,428号、同第7,747,391号、同第7,747,393号、同第7,751
,986号、同第6,376,246号、同第6,426,224号、同第6,423,
542号、同第6,479,652号、同第6,319,714号、同第6,521,4
53号、同第6,368,861号、同第7,421,347号、同第7,058,51
5号、同第7,024,312号、同第7,620,502号、同第7,853,410
号、同第7,957,912号、同第7,904,249号、およびすべての関連した非
米国対応物;Lingら、Anal.Biochem、254巻(2号):157〜78
頁[1997年];Daleら、Meth.Mol.Biol.、57巻:369〜74
頁[1996年];Smith、Ann.Rev.Genet.、19巻:423〜46
2頁[1985年];Botsteinら、Science、229巻:1193〜12
01頁[1985年];Carter、Biochem.J.、237巻:1〜7頁[1
986年];Kramerら、Cell、38巻:879〜887頁[1984年];W
ellsら、Gene、34巻:315〜323頁[1985年];Minshullら
、Curr.Op.Chem.Biol.、3巻:284〜290頁[1999年];C
hristiansら、Nat.Biotechnol.、17巻:259〜264頁[
1999年];Crameriら、Nature、391巻:288〜291頁[199
8年];Crameriら、Nat.Biotechnol.、15巻:436〜438
頁[1997年];Zhangら、Proc.Nat.Acad.Sci.U.S.A.
、94巻:4504〜4509頁[1997年];Crameriら、Nat.Biot
echnol.、14巻:315〜319頁[1996年];Stemmer、Natu
re、370巻:389〜391頁[1994年];Stemmer、Proc.Nat
.Acad.Sci.USA、91巻:10747〜10751頁[1994年];WO
95/22625;WO97/0078;WO97/35966;WO98/27230
;WO00/42651;WO01/75767;およびWO2009/152336を
参照。これらのすべては、参照により本明細書に組み込まれている)。
ある特定の実施形態では、指向進化方法は、親タンパク質から発生したバリアントをコ
ードする遺伝子を組み換えることによって、および親タンパク質バリアントライブラリー
内のバリアントをコードする遺伝子を組み換えることによってタンパク質バリアントライ
ブラリーを生成する。この方法は、親バリアントライブラリーの少なくとも1種のタンパ
ク質をコードする配列または部分配列を含むオリゴヌクレオチドを使用し得る。親バリア
ントライブラリーのオリゴヌクレオチドのいくつかは、他のバリアントと、組換えによっ
て変更されるように選択された代替アミノ酸のコドンの選択においてのみ異なって密接に
関連している場合がある。この方法は、所望の結果が実現されるまで1回または複数回の
サイクルについて実施され得る。複数のサイクルが使用される場合、各々は、典型的には
、許容される、または改善された性能を有し、少なくとも1つの後続の組換えサイクルで
使用するための候補であるバリアントを識別するためのスクリーニングステップを伴う。
一部の実施形態では、スクリーニングステップは、所望の基質についての酵素の触媒活性
および選択性を決定するための仮想タンパク質スクリーニングシステムを伴う。
一部の実施形態では、指向進化方法は、定義された残基における部位指向性変異誘発に
よってタンパク質バリアントを生成する。これらの定義された残基は、典型的には、結合
部位の構造解析、量子化学分析、配列相同性分析、配列活性モデルなどによって識別され
る。一部の実施形態は、特異的部位または遺伝子の狭い領域におけるすべての可能な(ま
たは可能な限り近い)変異を生成するように試みる飽和変異誘発を使用する。
「シャッフリング」および「遺伝子シャフリング」は、一連の鎖伸長サイクルによって
親ポリヌクレオチドの断片のコレクションを組み換える指向進化方法のタイプである。あ
る特定の実施形態では、鎖伸長サイクルの1つまたはそれより多くは、セルフプライミン
グであり、すなわち、断片自体以外のプライマーの付加を伴うことなく実施される。各サ
イクルは、ハイブリダイゼーションによる一本鎖断片のアニーリング、鎖伸長によるアニ
ールされた断片の後続の伸長、および変性を伴う。シャッフリングの過程にわたって、成
長中の核酸鎖は、典型的には、「鋳型切り替え」と時に呼ばれるプロセスにおいて複数の
異なるアニーリングパートナーにさらされる。このプロセスは、1つの核酸に由来する1
つの核酸ドメインを第2の核酸に由来する第2のドメインと切り替えることを伴う(すな
わち、第1および第2の核酸がシャッフリング手順における鋳型として機能を果たす)。
鋳型切り替えではしばしば、異なる起源の断片間のクロスオーバーの導入から生じるキ
メラ配列が生成される。クロスオーバーは、アニーリング、伸長、および変性の複数のサ
イクルの間の鋳型が切り替えられた組換えによって生成される。したがって、シャッフリ
ングにより、典型的には、バリアントポリヌクレオチド配列が生成される。一部の実施形
態では、バリアント配列は、バリアントの「ライブラリー」(すなわち、複数のバリアン
トを含む群)を含む。これらのライブラリーの一部の実施形態では、バリアントは、2つ
またはそれより多くの親ポリヌクレオチドに由来する配列セグメントを含む。
2つまたはそれより多くの親ポリヌクレオチドが使用されるとき、個々の親ポリヌクレ
オチドは、異なる親に由来する断片が、シャッフリングサイクルで使用されるアニーリン
グ条件下でハイブリダイズするほど十分に相同である。一部の実施形態では、シャッフリ
ングは、相対的に制限された/低い相同性レベルを有する親ポリヌクレオチドの組換えを
可能にする。多くの場合、個々の親ポリヌクレオチドは、目的の別個のおよび/もしくは
固有のドメイン、ならびに/または他の配列特性を有する。別個の配列特性を有する親ポ
リヌクレオチドを使用するとき、シャッフリングは、高度に多様なバリアントポリヌクレ
オチドを生成することができる。
様々なシャッフリング技法が当技術分野で公知である。例えば、米国特許第6,917
,882号、同第7,776,598号、同第8,029,988号、同第7,024,
312号、および同第7,795,030号を参照。これらのすべては、その全体が参照
により本明細書に組み込まれている。
いくつかの指向進化技法は、「Gene Splicing by Overlap
Extension」または「gene SOEing」を使用する。これは、制限部位
に依存することなくDNA配列を組み換え、そしてin vitroで変異させられたD
NA断片を直接生成するPCRベース方法である。この技法の一部の実施において、最初
のPCRにより、完全長生成物を作製するために第2のPCRのための鋳型DNAとして
使用される重なった遺伝子セグメントが生成される。内部PCRプライマーは、中間セグ
メントに重なった相補的3’末端を生成し、遺伝子スプライシングのためのヌクレオチド
置換、挿入、または欠失を導入する。これらの中間セグメントの重なった鎖は、第2のP
CRにおいて3’領域でハイブリダイズし、伸長されて完全長生成物を生成する。様々な
用途において、全長生成物は、クローニング目的で発現ベクター中に生成物を挿入するた
めの制限酵素部位を含むことができるフランキングプライマーによって増幅される。例え
ば、Hortonら、Biotechniques、8巻(5号):528〜35頁[1
990年]を参照。「変異誘発」は、標準配列または参照配列、例えば、親核酸または親
ポリペプチドなどの中に変異を導入するプロセスである。
部位指向性変異誘発は、変異を導入するための有用な技法の一例であるが、任意の適当
な方法が有用である。したがって、代替としてまたは追加的に、変異体は、遺伝子合成、
飽和ランダム変異誘発、残基の半合成組み合わせのライブラリー、再帰的配列組換え(「
RSR」)(例えば、その全体が本明細書に参照により組み込まれている、米国特許出願
公開第2006/0223143号を参照)、遺伝子シャッフリング、エラープローンP
CR、および/または任意の他の適当な方法によってもたらされ得る。
適当な飽和変異誘発手順の一例は、米国特許出願公開第2010/0093560号に
記載されており、これは、その全体が参照により本明細書に組み込まれている。
「断片」は、ヌクレオチドまたはアミノ酸の配列の任意の一部である。断片は、それだ
けに限らないが、ポリペプチドまたはポリヌクレオチド配列の切断を含めた当技術分野で
公知の任意の適当な方法を使用して生成され得る。一部の実施形態では、断片は、ポリヌ
クレオチドを切断するヌクレアーゼを使用することによって生成される。一部の追加の実
施形態では、断片は、化学的および/または生物学的合成技法を使用して生成される。一
部の実施形態では、断片は、相補的核酸(複数可)の部分的鎖伸長を使用して生成される
少なくとも1つの親配列の部分配列を含む。in silico技法を伴う一部の実施形
態では、化学的および/または生物学的技法によって生成される断片の結果を模倣するた
めに、仮想断片が計算的に生成される。一部の実施形態では、ポリペプチド断片は、完全
長ポリペプチドの活性を呈し、一方、一部の他の実施形態では、ポリペプチド断片は、完
全長ポリペプチドが呈する活性を有しない。
「親ポリペプチド」、「親ポリヌクレオチド」、「親核酸」、および「親」は、一般に
、野生型ポリペプチド、野生型ポリヌクレオチド、または指向進化などの多様性生成手順
における出発点として使用されるバリアントを指すために使用される。一部の実施形態で
は、親自体が、シャッフリングまたは他の多様性生成手順(複数可)を介して生成される
。一部の実施形態では、指向進化で使用される変異体は、親ポリペプチドに直接関連する
。一部の実施形態では、親ポリペプチドは、極度の温度、pH、および/または溶媒条件
にさらされるとき安定であり、シャッフリングのためのバリアントを生成するための基盤
として機能を果たすことができる。一部の実施形態では、親ポリペプチドは、極度の温度
、pH、および/または溶媒条件に対して安定でなく、親ポリペプチドは、ロバストなバ
リアントを作製するために進化させられる。
「親核酸」は、親ポリペプチドをコードする。
「ライブラリー」または「集団」は、少なくとも2つの異なる分子、文字列、および/
またはモデル、例えば、核酸配列(例えば、遺伝子、オリゴヌクレオチドなど)、または
これらに由来する発現生成物(例えば、酵素または他のタンパク質)などのコレクション
を指す。ライブラリーまたは集団は一般に、いくつかの異なる分子を含む。例えば、ライ
ブラリーまたは集団は、典型的には、少なくとも約10の異なる分子を含む。大きいライ
ブラリーは、典型的には、少なくとも約100の異なる分子、より典型的には、少なくと
も約1000の異なる分子を含む。一部の用途については、ライブラリーは、少なくとも
約10000またはそれより多くの異なる分子を含む。しかし、本発明が異なる分子の具
体的な数に限定されることは意図されていない。ある特定の実施形態では、ライブラリー
は、指向進化手順によって生成されるある数のバリアントまたはキメラ核酸またはタンパ
ク質を含む。
2つの核酸は、この2つの核酸の各々に由来する配列が組み合わされて子孫核酸(複数
可)が生成されるとき、「組み換えられる」。2つの配列は、核酸の両方が組換えの基質
であるとき、「直接」組み換えられる。
「選択」は、1つまたはそれより多くの生体分子が1つまたはそれより多くの目的の性
質を有すると識別されるプロセスを指す。したがって、例えば、ライブラリーをスクリー
ニングして、1つまたはそれより多くのライブラリーメンバーの1つまたはそれより多く
の性質を決定することができる。ライブラリーメンバーのうちの1つまたはそれより多く
が目的の性質を持っていると識別される場合、それは、選択される。選択は、ライブラリ
ーメンバーの分離を含むことができるが、これは必要ではない。さらに、選択およびスク
リーニングは、同時であることができ、同時であることが多い。本明細書に開示の一部の
実施形態は、望ましい活性および/または選択性の酵素をスクリーニングおよび選択する
ためのシステムおよび方法を提供する。
用語「配列−活性モデル」は、一方において生体分子の活性、特性、または性質と、他
方において様々な生物学的な配列との関係を説明するあらゆる数学モデルを指す。
「参照配列」は、配列のバリエーションの元になる配列である。一部の場合には、「参
照配列」は、バリエーションを規定するために使用される。このような配列は、所望の活
性の最高値(または最高値の1つ)を有するとモデルによって予測された配列であっても
よい。別の場合には、参照配列は、元のタンパク質バリアントライブラリーのメンバーの
配列であってもよい。ある特定の実施形態では、参照配列は、親のタンパク質または核酸
の配列である。
「次世代シーケンシング」および「ハイスループットシーケンシング」は、シーケンシ
ングプロセスを並列化し、数千または数百万の配列を一度に生成するシーケンシング技法
である。適当な次世代シーケンシング法の例としては、それだけに限らないが、単一分子
リアルタイムシーケンシング(例えば、Pacific Biosciences、Me
nlo Park、California)、イオン半導体シーケンシング(例えば、I
on Torrent、South San Francisco、Californi
a)、パイロシーケンシング(例えば、454、Branford、Connectic
ut)、ライゲーションによるシーケンシング(例えば、Life Technolog
ies、Carlsbad、CaliforniaのSOLiDシーケンシング)、合成
および可逆性ターミネーターによるシーケンシング(例えば、Illumina、San
Diego、California)、透過型電子顕微鏡法などの核酸イメージング技
術などがある。
「遺伝的アルゴリズム」は、進化のプロセスを模倣するプロセスである。遺伝的アルゴ
リズム(GA)は、完全には特徴付けられていないか、または複雑すぎて完全な特徴付け
ができないが、何らかの分析的評価が利用可能である問題を解決するために多種多様な分
野で使用される。すなわち、GAは、解の相対値(または少なくとも、別のものとの比較
における1つの潜在的な解の相対値)について何らかの定量化可能な尺度によって評価す
ることができる問題を解決するために使用される。本開示の場合において、遺伝的アルゴ
リズムは、典型的には文字列が1種または複数の生物学的分子(例えば、核酸、タンパク
質など)または配列活性モデルなどのモデルを訓練するために使用されるデータに対応す
る場合に、コンピューターで文字列を選択または操作するためのプロセスである。
典型的な実施において、遺伝的アルゴリズムは、第1世代で文字列の集団を提供し、評
価する。「適合度関数」は、集団のメンバーを評価し、高い活性などの1つまたは複数の
基準に基づきそれらをランク付けする。高くランク付けされた文字列は、第2世代に昇格
させるために、および/または第2世代のための「子供の文字列」を生成するためにメイ
ティングするために選択される。第2の世代における集団は、適合度関数によって同様に
評価され、高ランクのメンバーが、第1の世代と同様に昇格させられ、かつ/またはメイ
ティングされる。遺伝的アルゴリズムは、後続の世代についてこの様式で「収束基準」が
満たされるまで継続し、その時点でアルゴリズムは、1つまたは複数の高ランクの個体を
結論付ける。
用語「遺伝的操作」(または、「GO」)は、生物学的なおよび/または計算による遺
伝的操作を指し、ここで、文字列の任意のタイプの任意の集団の(かつしたがってこのよ
うな列によってコードされる物理的物体の任意の物理的性質の)すべての変化は、論理代
数関数の有限のセットのランダムなおよび/または所定の適用の結果として記述すること
ができる。GOの例としては、それだけに限らないが、増殖、クロスオーバー、組換え、
変異、ライゲーション、断片化などがある。
II.仮想タンパク質スクリーニング
一部の実施形態では、仮想タンパク質スクリーニングシステムは、規定された温度で反
応を効率的かつ選択的に触媒することなどの所望の活性を有する可能性が高い生体分子バ
リアントをコンピューターにより識別することに関連する様々なオペレーションを実施す
るように設計される。仮想タンパク質スクリーニングシステムは、入力として、バリアン
トと相互作用することが意図された1つまたは1つより多くのリガンドの表示を取り入れ
てもよい。システムは、他の入力として、生体分子バリアント、またはこれらのバリアン
トの少なくとも活性部位の表示を取り入れる場合がある。表示は、リガンドおよび/また
はバリアントの原子および/または部分の3次元位置を含有し得る。ホモロジーモデルは
、生体分子バリアントの表示の例である。仮想タンパク質スクリーニングシステムは、バ
リアントの機能を査定するためにドッキング情報および活性の制約を適用する場合がある
ある特定の実施形態では、仮想タンパク質スクリーニングシステムは、活性ポーズと不
活性ポーズとを区別するために1つまたは複数の制約を適用する。このようなポーズは、
上述したようなドッカーによって、または別のツールによって生成され得る。リガンドの
ポーズをその環境で評価して、触媒変換または他の規定された活性がもたらされるように
リガンドの1つまたは複数の特徴がその環境中に配置されるかどうかを決定する。問題と
なる環境は、典型的には酵素または他の生体分子の活性部位である。
基質または他のリガンドが生体分子の活性部位に結合すると仮定する場合、訪ねるべき
質問は、それが「活性な」方式で結合するのかどうかということである。典型的なドッキ
ングプログラムは、リガンドが活性部位に結合するか否かを答えることはできるが、リガ
ンドが「活性な」方式で結合するかどうかに答えることはない。
ある特定の実施形態では、活性は、ドッカーまたは他のツールによって生成された1つ
または複数のポーズを検討することによって決定される。各ポーズを評価して、それが目
的の活性(例えば、「所望の活性」)に関連する制約を満たすのかどうかを決定する。活
性ポーズは、リガンドが触媒変換を受けるか、または結合部位との共有結合などの何らか
の所望の役割を果たす可能性が高いポーズである。
基質の触媒転換を活性として考慮するとき、仮想タンパク質スクリーニングシステムは
、特定の反応に関連していることが分かっているポーズを識別するように構成してもよい
。一部の実施形態では、これは、基質自体ではなく、反応中間体または遷移状態を考慮す
る。転換に加えて、ポーズを、他のタイプの活性、例えば、鏡像異性体の立体選択的合成
、薬物発見に重要であると識別された標的生体分子の受容体への結合、生成物の位置選択
的な変換などに関して評価してもよい。一部の場合には、活性は、非可逆性または可逆性
共有結合であり、例えば、標的化共有結合阻害(TCI)などである。
制約は、直接的に、手動で、自動的に、経験的に、および/またはこれまでに公知の情
報に基づいて決定されてもよい。1つのアプローチにおいて、研究者は、野生型タンパク
質に関する活性部位および天然基質を評価する。これは、野生型タンパク質は、生来その
天然基質のために進化していることが分かっており、したがって最適な触媒定数(kca
)を有するためである。一部の場合には、野生型タンパク質および天然基質または中間
複合体の結晶構造がすでに解析されている。次いで、構造分析に基づき、制約をセットア
ップすることができる。これは、制約を決定するための「直接的なアプローチ」と称され
る。このような結晶構造が利用できない場合には、評価は、例えばドッキングプログラム
を用いて行なわれてもよい。プログラムを使用して、研究者は、野生型タンパク質におけ
る天然基質の触媒変換に関連する制約を識別する。これは、制約を決定するための手動的
または実験的アプローチと称される。別のアプローチにおいて、制約は、量子力学計算を
使用して決定される。例えば、研究者は、量子力学を使用して、触媒性残基(例えば、T
yr)の官能基および/またはコファクター(例えば、NADHP)の存在下で基質また
は中間体または遷移状態を最適化して、それらの状況と類似するように制約を設定するこ
とができる。このアプローチは、時には自動的または非経験的アプローチと称される。こ
のアプローチを使用する市販のツールの例は、www|.|Gaussian.comよ
り入手可能なGaussianである。
制約は、様々な形態を取り入れることができる。ある特定の実施形態では、一部または
全部のこれらの制約は、3次元空間においてリガンドのポーズ中の1つまたは複数の原子
の相対的な位置を特定する幾何学的な制約である。一部の実施形態では、空間は、活性部
位における原子の位置に対して規定されていてもよい。
「幾何学的な制約」は、2またはそれより多くの参加部分または他の化学要素の幾何学
的配置を評価する制約である。ある特定の実施形態では、参加物の1つは、リガンド上の
部分または他の化学種である。一部の実施形態では、他の参加物は、生体分子の活性部位
の部分または他の化学的特徴である。活性部位の部分または他の化学的特徴は、生体分子
の活性部位における残基(例えば、アミノ酸残基の側鎖)、コファクターにおける特徴ま
たは典型的には活性部位および/もしくは触媒作用に関連する他の化合物などに関連して
いてもよい。一例として、ケトレダクターゼタンパク質によるケトンの還元において、基
質のカルボニル基は、幾何学的な制約における1つの参加物であってもよく、酵素活性部
位のチロシン部分は、幾何学的な制約における第2の参加物であってもよい。
一般的に、幾何学的な制約は、一方ではリガンドに関して作成されるが、他方では結合
環境の1つまたは複数の特徴に関して作成される。一部の実施形態では、環境は、ペプチ
ド骨格(または側鎖)の残基位置および/またはコファクターあるいは活性部位に通常存
在する他の非骨格材料を含み得る。
幾何学的な制約における参加物の幾何学的配置は、部分間の距離、部分間の角度、部分
間のねじれ関係などに対して規定され得る。時には、制約は、活性を特徴付けるために使
用される、複数の基礎となる幾何学的な制約を含む。例えば、基質の位置に対する制約は
、2つまたはそれより多くの原子対間の距離によって規定され得る。図1に例を示す。ね
じれ関係の場合には、基質および活性部位環境の特徴が共通の回転軸を有する名目上平行
なプレートとみなされる場合に制約は適切であり得る。これらのプレートの軸周りの相対
的な角度位置は、ねじれの制約を規定する。
図1は、活性ポーズを識別するための幾何学的な制約を識別するために採用することが
できるワークフローの例を表す。表されたワークフローでは、野生型酵素がケトンレダク
ターゼであり、天然基質がアセトフェノンであると仮定される。図1の左上隅に表される
ように、天然の反応は、アセトフェノンを、立体選択的な触媒作用により対応するアルコ
ールに転換する。この反応は、ケトン基質のアセチル炭素にキラル中心を導入する。野生
型ケトンレダクターゼは、R鏡像異性体のみが生成されるように転換を制御する。この反
応は、コファクターとしてのNADPHの存在下で達成される。この反応は、図1の左上
隅で模式的に表される。
図1の右上隅に、触媒作用および選択性の機構が表される。この機構は、活性ポーズと
不活性ポーズとを区別するために使用される幾何学的な制約を規定するときに検討される
。プロセスの一部として、研究者または自動システムは、アセトフェノン基質の配向を、
野生型ケトンレダクターゼにおけるその触媒環境に対して決定する。一般的に、関連する
環境は、触媒変換が起こるときに存在する周辺の残基、コファクターなどを含む。
表された例において、野生型ケトンレダクターゼにおける活性部位環境の関連する特徴
は、(1)野生型酵素の骨格のチロシン残基および(2)コファクターであるNADPH
における原子の位置である。活性ポーズにおける基質の他の関連する環境の特徴は、活性
部位内のサブポケットである。これらは、図1には示されていない。サブポケットの1つ
はアセトフェノン基質のフェニル基を収容し、別のサブポケットはアセトフェノンのメチ
ル基を収容する。これらのサブポケットが一緒になって、反応の立体特異性を決定付ける
配向に基質を保持する。一部の実施形態では、上記の情報は、野生型ケトンレダクターゼ
と天然アセトフェノン基質との複合体の結晶構造の構造分析に基づき集められる。したが
って、幾何学的な制約を直接規定することができる。
ケトレダクターゼの触媒機構は、表された配置(図1の右上隅)で示された矢印の順番
によって表される。具体的には、NADPHは、アセトフェノンのカルボニル炭素とカッ
プリングしているヒドリドイオンを介して電子を供与する。同時に、アセトフェノンのカ
ルボニル酸素からの電子対はチロシン残基のプロトンに供与され、チロシンのヒドロキシ
ル酸素からの電子対は、NADP(H)のリボース部分のプロトンに供与され、そこで基
質の対応するアルコールへの転換が完了する。述べたように、この反応は、1つのより大
きいサブポケット中に基質のフェニル基が保持され、それより小さい下位のサブポケット
中にそのメチル基が保持され、チロシンのヒドロキシル基にごく近接してそのケトン基が
保持されている間に進行する。
図1にさらに示されるように、野生型ケトンレダクターゼは、本明細書で「所望の基質
」と称される異なる基質の転換を立体特異的に触媒するバリアントケトンレダクターゼに
進化させられる。図1の中央に表されるように、所望の反応は、メチルtert−ブチル
ケトンの対応するアルコールのS鏡像異性体(1tert−ブチルエチルアルコール)へ
の転換である。この反応は、転換に最適化されたバリアント酵素の活性部位でコファクタ
ーNADPHと共に触媒されると推測される。
反応が所望の立体特異性で展開することを確認するために、1つまたは複数の制約が決
定されるべきである。天然基質は、野生型ケトンレダクターゼによってR鏡像異性体に転
換され、所望の基質は、バリアントによってS鏡像異性体に転換されることに留意された
い。それゆえに、所望の基質のtert−ブチル基が、天然のアセトフェノン基質のメチ
ル基を通常収容するサブポケット中に配置され、所望の基質のメチル基が、天然基質のフ
ェニル基を収容するサブポケット中に配置されることを検討することができる。
これを念頭に置き、位置の制約のセットは、図1の左下隅に表されたように規定されて
もよい。そこで示したように、最大の転換(kcat)を得るために、結晶構造における
WT酵素の活性部位に天然基質が存在するときのように、天然基質の3次元位置に関連し
て様々な制約が規定される。言い換えれば、図1の右上隅における図表に関して決定され
るように、触媒による転換を決定付けるカルボニル炭素およびカルボニル酸素、ならびに
立体選択性決定するカルボニル炭素に隣接する2つの炭素のいずれかなどの天然基質の主
要な官能基の配向は、X、Y、Z座標に変換される。全てのバリアントのホモロジーモデ
ルは鋳型としてWTの構造を使用して構築されたので、X、Y、Z座標は、バリアントに
移行可能である。この参照のフレームを用いて、所望の基質の主要な官能基(C(C
)C=O)の位置は、触媒性チロシン残基およびNADPHコファクターに対して最適な
配向で存在すると予測される天然基質の対応する4個の原子の位置と比較することができ
る。注目すべきことに、触媒作用(例えば、チロシン)に関する残基およびコファクター
(NADPH)結合に関する残基は全てのバリアントで保存されており、このチロシンお
よびNADPHについては、全てのバリアントにおいてわずかな立体配座または位置の変
化しか予測されない。これを念頭に置いて、図1の左下隅に表された位置の制約は、所望
の基質のカルボニル炭素原子、カルボニル酸素原子、および中央のtert−ブチル原子
の、それに対応する天然基質のカルボニル炭素原子、カルボニル酸素原子、およびメチル
炭素原子の位置に対する位置の範囲を特定する。所望の基質の原子と天然基質の対応する
原子との位置的な差の範囲は、距離d1、d2、およびd3によって表される。一例とし
て、これらの距離のそれぞれは、所望の基質のポーズが活性ポーズとみなされるためには
、1オングストロームまたはそれ超もしくはそれ未満であることが必要な場合がある。制
約の値は通常、バリアント中の触媒性チロシンおよびコファクターのわずかなコンホメー
ション変化を反映する一定のフレキシビリティーを可能とする範囲になるように設定され
る。一部の実施において、これらの距離に関する基準は、機械学習アルゴリズムによって
改良される。
上記の例において、所望の基質の3つの関連する原子の位置は、天然基質の原子の位置
に近い。上記の位置の制約を満たすポーズにおいて所望の基質とドッキングされたケトレ
ダクターゼバリアントは、触媒活性でありS選択的であることが期待される。
一般的に、仮想タンパク質スクリーニングシステムは、様々なタイプのいずれの幾何学
的な制約も適用することができる。一部の実施において、上記システムは、参加物間の絶
対距離を適用する。例えば、基質カルボニル基中の酸素原子と活性部位のチロシン基の原
子との間の距離が、制約として特定されてもよい(例えば、これらの原子間の距離は、2
ű0.5Åでなければならない)。別の例において、カルボニル基中の炭素原子と酸素
原子との間の軸によって規定される1本の線と、活性部位中のフェニル基の軸に沿った別
の線との間の角度は、120°±20°である。
図1の右下は、それぞれ、結合ポケット内の所望の基質の1つまたは複数の原子と、酵
素またはコファクター(または他のエンティティ)の1つまたは複数の原子との間で規定
された、幾何学的な制約のタイプの例を表す。距離の制約は、基質における原子と、活性
部位残基、コファクターなどにおける原子との間の距離として規定される。角度の制約は
、基質およびその環境において規定された2本またはそれより多くの軸間の角度の関係に
よってポーズに関して規定される。軸は、共有結合、基質の原子と結合ポケット中の部分
との間の線などであり得る。例えば、角度は、基質における2つの原子間で規定された1
本の軸と、残基における原子および基質における原子の分離線として規定された別の軸と
の間で規定されていてもよい。一部の他の実施形態では、1つの軸は、残基側鎖における
2つの原子間で規定され、別の軸は、基質における原子と残基における原子との分離線に
よって規定される。追加のタイプの幾何学的な制約は、図1の右下隅に表される。このタ
イプの制約は、「ねじれの制約」と称され、結合ポケット中の2つの別個のエンティティ
(それらの1つは、典型的には基質の全部または一部である)が共通の回転軸を有すると
仮定される。ねじれの制約は、一方のエンティティの、共通の回転軸周りの他方に対する
角度位置の範囲によって規定され得る。
一般的に、幾何学的な制約は、結合ポケット内における基質部分のいくつかの事前設定
された幾何学的位置または配向に対して適用されてもよい。このような位置または配向は
、例えば、結合ポケット中の天然基質における活性な部分の代表的な位置によって特定す
ることができる。一例として、検討中の基質のカルボニル基の炭素および酸素原子は、結
合ポケット中の天然基質におけるカルボニル基の炭素および酸素原子の位置から1Å以内
になければならない。図1の左下隅に示される位置の制約を参照されたい。図1の左下隅
における位置の制約が、所望の基質と天然基質との間に存在していることに留意されたい
。しかしながら、位置の制約は、図1の下の中央および右隅における幾何学的な制約に対
応する所望の基質と酵素バリアントとの関係に変換することができる。
幾何学的な制約を直接的に、手動で、またはコンピューターシステムを使用して自動的
に決定することに加えて、スクリーニング結果により制約を改良することもできる。例え
ば、所望の反応に関して、実験室でのスクリーニングにより、1つまたは1つより多くの
バリアントが活性であると識別され、一方でそれ以外のいくつかが不活性であると識別さ
れる場合、それらのポーズをさらに分析してもよく、制約を訓練してもよい。
図1に表された例は所望の基質として比較的小さく単純な分子(メチルtert−ブチ
ルケトン)を使用しているが、指向進化の試みにおいてそれよりもはるかに大きくより複
雑な基質がしばしば評価される。
図2は、一部の実施における候補生体分子の潜在的な活性を分析するためのワークフロ
ーを示す。多くの様々な活性が検討され得るが、この実施形態では重要視される活性は、
基質の触媒的変換である。変換は、エナンチオ選択的または位置選択的であり得る。この
ような場合には、バリアントは、酵素である。この図の説明において、用語「基質」が使
用される場合、その概念は、反応生成物への基質の触媒的変換における律速段階において
重要な反応中間体または遷移状態などの関連リガンドにも及ぶ。
図2で示されたように、基質の活性ポーズと不活性ポーズとを区別するために制約を識
別することにより、プロセスが始まる。ブロック201を参照されたい。一部の場合には
、制約は、ドッキングによって識別される。このようなプロセスにおいて、研究者は、基
質または反応中間体または遷移状態と酵素の活性部位との相互作用を検討に入れる。プロ
セスにおいて、研究者は、所望の活性(例えば、基質の立体特異的な触媒的変換)をもた
らす制約を識別する。研究者は、酵素および関連する基質、中間体、または遷移状態の表
示を提供する構造解析、ドッキングプログラムおよび/または量子力学計算の助けによっ
てこれを行ってもよい。ドッカーを用いてなされるドッキングは、時には「実験的な」ド
ッキングアプローチと称され、量子力学ツールを用いてなされる最適化は、時には「非経
験的」アプローチと称される。一部の実施形態では、ドッキングは、野生型酵素および天
然基質、中間体、または遷移状態を用いて実施される。ブロック201を参照されたい。
上記で説明したように、一部の制約は、図1の左下隅で示されるような、所望の基質中の
部分と天然基質または関連するコファクター中の部分との相対的な位置を表示する幾何学
的な制約である。一部の実施において、制約は、所望の基質と酵素バリアントとの関係と
して規定することができ、例えば図1の下の中央および右隅に示される幾何学的な制約で
ある。
一部の場合には、活性ポーズに関する制約は、野生型酵素中の天然基質をドッキングす
ること以外の技術によって識別することもできる。例えば、触媒反応に関連する部分を識
別し、量子力学および分子動力学ツールを使用して識別された部分間の関係を規定するこ
とも可能である。
図2に示されるプロセスに戻れば、仮想タンパク質スクリーニングシステムは、活性に
関して検討しようとする複数のバリアント生体分子のそれぞれに関する構造モデルを生成
するかまたはそれを受け取る。ブロック203を参照されたい。説明したように、構造モ
デルは、活性部位または酵素バリアントの他の態様のコンピューターにより生成された3
次元表示である。これらのモデルを、その後のデータベースまたは他のデータリポジトリ
での使用のために保存することができる。一部の場合には、モデルの少なくとも1つは、
ワークフローで使用するために生成される。一部の場合には、モデルの少なくとも1つが
事前に生成されたが、この場合には、プロセスは単にこのようなモデルを受け取る。
複数のモデルは、それぞれ異なる生体分子の配列のためのものであり、図2に示される
プロセスで使用される。これは、ドッキングプログラムを利用する従来のワークフローと
は対照的であるはずである。従来のワークフローは、単一の標的または配列に焦点を当て
ている。一部の場合には、従来のワークフローは受容体の複数の事例を検討するが、これ
らは同じ配列に基づく。事例のそれぞれは、NMRまたは分子動力学シミュレーションか
ら生成される異なる3次元座標を有する。
図2のプロセスで使用される構造モデルは、活性部位または酵素配列中の何らかの他の
位置に関連する位置における、1つまたは複数のアミノ酸残基のモデルにおける挿入、欠
失、または置き換えにより互いに異なっていてもよい。構造モデルは、様々な技術によっ
て生成され得る。一実施形態では、それらはホモロジーモデリングによって生成される。
所定位置における活性の制約および構造モデルを用いて、仮想タンパク質スクリーニン
グシステムは、検討のために選択されたバリアントに反復適用される。反復適用の制御は
、ブロック205によって例示されており、これは、検討する次のバリアント酵素が分析
のために選択されていることを示す。このオペレーションおよび図2の残りのオペレーシ
ョンは、ソフトウェアまたはデジタル論理によって実施されてもよい。
現在検討中のバリアント酵素に関して、仮想タンパク質スクリーニングシステムはまず
、所望の基質をバリアントの活性部位にドッキングすることを試みる。ブロック207を
参照。このプロセスは、従来のドッキング手順に対応していてもよい。それゆえに、基質
がバリアント中の活性部位とドッキングできるか否かを決定するためにドッカーが利用さ
れる場合がある。この決定は、ブロック209に示される。所望の基質は、時には、制約
を生成するために使用された可能性がある天然基質と異なることに留意されたい。
仮想タンパク質スクリーニングシステムが、ドッキングが成功する可能性が低いと決定
する場合、プロセス制御はブロック220に方向付けられ、そこでシステムは、検討すべ
きそれ以上のバリアントがあるかどうかを決定する。検討すべきさらなるバリアントがな
い場合、提示されているように任意選択のオペレーション223でプロセスは完了する。
一方で、検討されるべき1つまたは複数のバリアントが残っている場合、プロセス制御は
、プロセスステップ205に戻るよう方向付けられ、そこで検討のための次のバリアント
が選択される。次いでこのバリアントは、ブロック207および209に関して上述した
ように、検討中の基質をドッキングするその能力に関して評価される。
検討中のバリアントが基質とうまくドッキングすることができることが判明した場合、
プロセス制御は、アルゴリズムの一部に方向付けられ、そこで複数のポーズが検討され、
それぞれ活性に関して評価される。後述するように、この分析は、ブロック211、21
3、215、および217によって表される。
示したように、プロセスは複数の利用可能なポーズにわたり反復適用される。様々な実
施形態では、ドッカーは、ポーズの選択を助ける。説明したように、ドッカーは、活性部
位において非常に多くの基質のポーズを生成することができる。またドッカーは、例えば
ドッキングスコア、エネルギーに関する検討などの1つまたは複数の基準に基づいてもポ
ーズをランク付けすることができる。他所で説明したように、全エネルギーおよび/また
は相互作用エネルギーが検討されてもよい。どのようにポーズが生成および/またはラン
ク付けされるかに関係なく、ワークフローは、特定の数のポーズを検討するように設計さ
れていてもよい。検討しようとするポーズの数は、任意に設定することができる。一実施
形態では、少なくとも上位の約10のポーズが検討される。別の実施形態では、少なくと
も約20のポーズが検討されるか、または少なくとも約50のポーズ、もしくは少なくと
も約100のポーズが検討される。しかしながら、本発明がポーズの具体的な数に限定さ
れることは意図されない。
ブロック211で表されるように、プロセスは、分析のために次のポーズを選択する。
次いで現在選択されているポーズは、ブロック201で識別された制約に対して評価され
て、そのポーズが活性ポーズであるかどうかが決定される。説明したように、このような
制約は、基質が所望の触媒的変換を受ける可能性が高いように、基質の1つまたは複数の
部分が活性部位内に位置するかどうかを決定する幾何学的な制約であってもよい。
ブロック213で行われる評価が、現在のポーズが活性ポーズではないことを提示する
場合、仮想タンパク質スクリーニングシステムは、次に、検討中の現在のバリアントのた
めに検討すべきそれ以上のいずれかのポーズがあるかどうかを決定する。ブロック215
を参照。検討すべきさらなるポーズがあると仮定すると、プロセス制御は、ブロック21
1に戻るよう方向付けられ、そこで次のポーズが検討される。
仮想タンパク質スクリーニングシステムが、ブロック213で検討中のポーズが活性で
あると決定すると仮定すると、このポーズはその後の検討のために記録される。ブロック
217を参照。一部の実施形態では、仮想タンパク質スクリーニングシステムは、現在検
討中のバリアントに関する活性ポーズの数のランニングタリー(running tal
ly)を維持してもよい。
現在のポーズが活性であることを適切に記録した後、プロセス制御は、ブロック215
に方向付けられ、そこで仮想タンパク質スクリーニングシステムは、検討すべきそれ以上
のポーズがあるかどうかを決定する。検討中のバリアントに関して全ての利用可能なポー
ズの検討を繰り返した後、仮想タンパク質スクリーニングシステムは、検討すべきさらな
るポーズがないと決定し、プロセス制御は、現在のバリアントの可能性がある活性を特徴
付けるブロック218に方向付けられる。特徴付けは、これらに限定されないが、検討中
のバリアントに関する活性ポーズの数および関連するドッキングスコア、ならびに本明細
書で説明されるような他の検討などの様々な技術によって行うことができる。ブロック2
18のオペレーションが完了した後、プロセス制御は、検討すべきそれ以上のいずれかの
バリアントがあるかどうかを決定する決定オペレーション220に方向付けられる。検討
すべき追加のバリアントがある場合、プロセス制御は、ブロック205に戻され、そこで
ワークフローは上述したように継続される。
ワークフローで全てのバリアントを検討した後、仮想タンパク質スクリーニングシステ
ムは、1つまたは複数の基準、例えばバリアントが有する活性ポーズの数、活性ポーズの
1つまたは複数のドッキングスコア、および/または活性ポーズの1つまたは複数の結合
エネルギーに基づき、それらをランク付けしてもよい。ブロック223を参照。活性ポー
ズとして識別されたポーズ(ブロック217)のみが、ブロック223のランク付けを実
施して評価する必要がある。この方式において、ワークフロー中のオペレーションは、活
性ポーズから不活性ポーズをフィルタリングして、バリアントのランク付けに関連するコ
ンピューターの労力を節約するために役立つ。図2では示されないが、バリアントは、そ
れらのランク付けに基づきさらなる調査のために選択されてもよい。
ある特定の実施形態では、バリアントの各活性ポーズのエネルギー特性を評価するため
に、結合エネルギーを算出するためのプロトコルが実行される。一部の実施では、このプ
ロトコルは、ファンデルワールス力、静電相互作用、および溶媒和エネルギーを考慮し得
る。溶媒和は、典型的には、ドッカーによって実施される算出において考慮されない。様
々な溶媒和モデルが結合エネルギーを算出するために利用可能であり、これらとしては、
それだけに限らないが、距離依存性誘電体、ペアワイズ加算を用いた一般化ボルン(Ge
nBorn)、インプリシットメンブレン(Implicit Membrane)を用
いた一般化ボルン(GBIM)、分子体積統合(Molecular Volume i
ntegration)を用いた一般化ボルン(GBMV)、単純スイッチング(sim
ple switching)を用いた一般化ボルン(GBSW)、および非極性表面積
(PBSA)を用いたポアソン−ボルツマン方程式がある。結合エネルギーを算出するた
めのプロトコルは、ドッカープログラムと異なり、またはそれと別個である。これらは一
般に、これらの算出において溶媒和効果を含めることに部分的に起因して、ドッキングス
コアより正確である結果を生じさせる。様々な実施では、結合エネルギーは、活性である
と見なされているポーズについてのみ算出される。
A.それぞれ活性部位を含有する複数の生体分子のモデルの生成
コンピューターシステムは、複数のタンパク質バリアントについての3次元モデルを提
供することができる。3次元モデルは、タンパク質バリアントの全長配列の一部またはす
べての計算上の表示である。典型的には最低でも、計算表示は、少なくともタンパク質バ
リアントの活性部位をカバーする。
一部の場合には、3次元モデルは、適切に設計されたコンピューターシステムを使用し
て調製されるホモロジーモデルである。3次元モデルは、タンパク質バリアントがこれら
のアミノ酸配列において相違する構造鋳型を使用する。一般に、構造鋳型は、モデル配列
に相同である配列についてX線結晶構造解析法またはNMRによって以前に解析された構
造である。ホモロジーモデルの品質は、構造鋳型の配列アイデンティティーおよび分解能
に依存する。ある特定の実施形態では、3次元モデルは、現在または将来のプロジェクト
に必要な場合に使用するためにデータベース中に記憶され得る。
タンパク質バリアントの3次元モデルは、ホモロジーモデリング以外の技法によって生
成され得る。一例は、タンパク質スレッディングであり、これも構造鋳型を必要とする。
別の例は、構造鋳型を必要とせず、根本的な物理的原理に基づくab initioまた
はde novoタンパク質モデリングである。ab initio技法の例としては、
分子動力学シミュレーションおよびRosettaソフトウェアスイートを使用するシミ
ュレーションがある。
一部の実施形態では、タンパク質バリアントは、これらの活性部位において互いに異な
る。一部の場合では、活性部位は、活性部位のアミノ酸配列中の少なくとも1つの変異に
よって互いに異なる。変異は、野生型タンパク質配列または一部の他の参照タンパク質配
列において行われ得る。一部の場合では、タンパク質バリアントの2つまたはそれより多
くは、活性部位について同じアミノ酸配列を共有するが、タンパク質の別の領域のアミノ
酸配列が異なる。一部の場合では、2つのタンパク質バリアントは、少なくとも約2つの
アミノ酸、または少なくとも約3つのアミノ酸、または少なくとも約4つのアミノ酸だけ
互いに異なる。しかし、本発明がタンパク質バリアント間のアミノ酸差異の具体的な数に
限定されることは意図されていない。
ある特定の実施形態では、複数のバリアントは、指向進化の1つまたは複数のラウンド
によって生成されるライブラリーのメンバーを含む。指向進化で使用される多様性生成技
法としては、遺伝子シャフリング、変異誘発、組換えなどがある。指向進化技法の例は、
その全体が参照により本明細書に組み込まれている米国特許出願公開第2006/022
3143号に記載されている。
一部の実施されるプロセスにおいて、複数のバリアントは、少なくとも約10の異なる
バリアント、または少なくとも約100の異なるバリアント、または少なくとも約100
0の異なるバリアントを含む。しかしながら、本発明がタンパク質バリアントの具体的な
数に限定されることは意図されない。
B.複数の異なるタンパク質バリアントにおけるリガンドの評価
本明細書に説明するように、ドッキングは、リガンドの計算上の表示および生成された
複数のバリアントの活性部位の計算上の表示を使用する適切にプログラムされたコンピュ
ーターシステムによって行われる。
一例として、ドッカーは、以下のオペレーションの一部またはすべてを実施するように
構成され得る:
1.ランダムな種を用いた高温分子動力学を使用して一組のリガンドコンホメーション
を生成する。ドッカーは、リガンドの環境を考慮することなくこのようなコンホメーショ
ンを生成し得る。したがって、ドッカーは、内部歪みまたはリガンドだけに特異的な他の
考慮事項のみを考慮することによって好ましいコンホメーションを識別し得る。生成され
るべきコンホメーションの数は、自由裁量で設定することができる。一実施形態では、少
なくとも約10のコンホメーションが生成される。別の実施形態では、少なくとも約20
コンホメーション、または少なくとも約50コンホメーション、または少なくとも約10
0のコンホメーションが生成される。しかし、本発明がコンホメーションの具体的な数に
限定されることは意図されていない。
2.リガンドの中心を受容体活性部位内の指定場所に並行移動し、一連結のランダムな
回転を実施することによってコンホメーションのランダムな向きを生成する。洗練するた
めの向きの数は、自由裁量で設定することができる。一実施形態では、少なくとも約10
の向きが生成される。別の実施形態では、少なくとも約20の向き、または少なくとも約
50の向き、または少なくとも約100の向きが生成される。しかし、本発明が向きのど
んな具体的な数にも限定されることは意図されていない。ある特定の実施形態では、ドッ
カーは、向きとコンホメーションのさらなる組合せを生成するための「柔軟化(soft
ened)」エネルギーを算出する。ドッカーは、活性部位中のある特定の向きの許容性
について物理的に非現実的な仮定を使用して柔軟化エネルギーを算出する。例えば、ドッ
カーは、リガンド原子および活性部位原子が、パウリ反発および立体的配慮に基づいて不
可能である、本質的に同じ空間を占有することができると仮定し得る。この柔軟化された
仮定は、例えば、コンホメーション空間を探索するときのレナード−ジョーンズポテンシ
ャルの緩和形式を使用することによって実施することができる。柔軟化エネルギー算出を
使用することによって、ドッカーは、物理的に現実的なエネルギー考慮事項を使用して利
用可能であるものより、コンホメーションの完全な探索を可能にする。特定の向きにおけ
るコンホメーションの柔軟化エネルギーが指定された閾値より低い場合、コンホメーショ
ン−向きは保たれる。これらの低エネルギーコンホメーションは、「ポーズ」として保持
される。ある特定の実施では、このプロセスは、所望の数の低エネルギーポーズが見つか
るか、または最大数の悪いポーズが見つかるまで継続する。
3.ステップ2からの各保持されたポーズにシミュレーテッドアニーリング分子動力学
を受けさせ、ポーズを洗練する。温度が高い値まで上昇され、次いで標的温度に冷却され
る。ドッカーは、柔軟化エネルギー算出によって提供されるより物理的に現実的な向きお
よび/またはコンホメーションを提供するためにこれを行い得る。
4.非柔軟化ポテンシャルを使用して剛性受容体(rigid receptor)に
おけるリガンドの最終的な最小化を実施する。これは、保持されたポーズについてより正
確なエネルギー値をもたらす。しかし、この算出は、ポーズのエネルギーについて部分的
な情報しかもたらさない場合がある。
5.各最終ポーズについて全エネルギー((受容体−リガンド相互作用エネルギー)+
(リガンド内部歪み))と相互作用エネルギー単独とを算出する。算出は、CHARMm
を使用して実施され得る。ポーズは、CHARMmエネルギーによって並び替えられ、上
位スコアの(最も否定的(most negative)、したがって結合に好ましい)
ポーズが保持される。一部の実施形態では、このステップ(および/またはステップ4)
により、エネルギー的に不都合であるポーズが除去される。
以下の参考文献は、ドッカーの機能の一例を提供するものである:Wuら、Detai
led Analysis of Grid−Based Molecular Doc
king:A Case Study of CDOCKER − A CHARMm−
Based MD Docking Algorithm、J.Computation
al Chem.、24巻、13号、1549〜62頁(2003年)。これは、その全
体が参照により本明細書に組み込まれている。
ドッカー、例えば本明細書で説明されたドッカーは、高性能バリアントを識別するため
にスクリーニングシステムによって使用された情報の1つまたは複数のピースを提供する
ことができる。このような情報としては、所望の基質とのドッキングが起こりそうにない
バリアントのアイデンティティーが挙げられる。このようなバリアントは、活性などに関
して評価する必要はない。ドッカーによって提供される他の情報としては、活性に関して
検討することができるポーズのセット(各バリアントにつき1つのセット)が挙げられる
。さらに他の情報としては、セット中のポーズのドッキングスコアが挙げられる。
C.ドッキングされたリガンドのポーズが活性であるかどうかの決定
リガンドとうまくドッキングするタンパク質バリアントに関して、仮想タンパク質スク
リーニングシステムは以下のオペレーション:(i)検討中のタンパク質バリアントの活
性部位におけるリガンドの計算上の表示の複数のポーズを検討すること、および(ii)
存在する場合、複数のポーズのどれが活性であるかを決定することを行う。
活性ポーズは、リガンドが規定された条件下で(自由裁量の結合条件ではなく)結合す
るための1つまたは複数の制約を満たすポーズである。リガンドが基質であり、タンパク
質が酵素である場合、活性な結合は、基質が触媒による化学変換、特に立体特異的変換を
起こすことを可能にする結合であり得る。一部の実施では、制約は、リガンド中の1つも
しくは複数の原子ならびにタンパク質および/またはタンパク質に会合したコファクター
中の1つもしくは複数の原子の相対的な位置の範囲を規定する幾何学的な制約である。
一部の場合には、制約は、天然の基質および/または後続の中間体であって、それが野
生型酵素によって触媒による化学変換を受けるときの中間体の1つまたは複数のコンホメ
ーションから識別される。ある特定の実施形態では、制約としては、(i)基質および/
もしくは後続の中間体上の特定の部分と活性部位中の特定の残基もしくは残基部分との間
の距離、(ii)基質および/もしくは後続の中間体上の特定の部分と活性部位中の特定
のコファクターとの間の距離、ならびに/または(iii)基質および/もしくは後続の
中間体上の特定の部分と活性部位中の理想的に位置された天然の基質および/もしくは後
続の中間体上の特定の部分との間の距離がある。ある特定の実施形態では、制約は、化学
結合間の角度、軸周りのねじれ、または化学結合における歪みを含み得る。
基質および/または後続の中間体の計算上の表示の複数のポーズは、検討中のタンパク
質バリアントの計算上の表示に関して生成され得る。複数のポーズは、様々な技法によっ
て生成され得る。このような技法の一般的な例として、回転可能な結合についての系統的
または確率論的ねじりサーチ、分子動力学シミュレーション、および低エネルギーコンホ
メーションを場所特定するように設計された遺伝的アルゴリズムがある。一例では、ポー
ズは、高温分子動力学を使用して生成され、その後、ランダム回転、グリッド−ベースシ
ミュレーテッドアニーリングによる洗練、ならびに最終的なグリッドベースもしくは力場
最小化が行われて、計算上の表示の活性部位中の基質および/もしくは後続の中間体のコ
ンホメーションおよび/もしくは配向を生成する。これらのオペレーションのいくつか、
例えば、グリッド−ベースシミュレーテッドアニーリングによる洗練、およびグリッド−
ベースまたは力場最小化は任意選択である。
ある特定の実施形態では、考慮されるポーズの数は、少なくとも約10、または少なく
とも約20、または少なくとも約50、または少なくとも約100、または少なくとも約
200、または少なくとも約500である。しかし、本発明が考慮されるポーズの具体的
な数に限定されることは意図されていない。
プロジェクトが成功した場合、バリアントの少なくとも1つは、活性でありエネルギー
的に好ましい1つまたは複数のポーズを有すると決定される。ある特定の実施形態では、
さらなる検討のために選択されたバリアントは、他のバリアントとの比較において多数の
活性なコンホメーションを有すると決定されたバリアントである。ある特定の実施形態で
は、バリアントは、それらが有する活性ポーズの数、活性ポーズに関する1つまたは複数
のドッキングスコア、および/または活性ポーズに関する1つまたは複数の結合エネルギ
ーに基づきバリアントをランク付けすることによって選択される。例として、検討される
可能性があるドッキングスコアのタイプとしては、ファンデルワールス力および/または
静電相互作用に基づくスコアが挙げられる。例として、検討される可能性がある結合エネ
ルギーのタイプとしては、ファンデルワールス力、静電相互作用、および溶媒和エネルギ
ーが挙げられる。
1つまたは複数の活性ポーズを支持するように決定されたタンパク質バリアントは、さ
らなる調査、合成、生成などのために選択されてもよい。一例において、選択されたタン
パク質バリアントは、1または複数のラウンドの指向進化を導入するために使用される。
一例として、1ラウンドの指向進化は、(i)選択されたタンパク質バリアントの少なく
とも一部を含有するかまたはコードする複数のオリゴヌクレオチドを調製するステップと
、(ii)複数のオリゴヌクレオチドを使用して1ラウンドの指向進化を実施するステッ
プとを含み得る。オリゴヌクレオチドは、これらに限定されないが、選択されたタンパク
質バリアントの一部または全部をコードする核酸の遺伝子合成、断片化などの任意の適当
な手段によって調製されてもよい。ある特定の実施形態では、指向進化のラウンドは、複
数のオリゴヌクレオチドを断片化して組み換えるステップを含む。ある特定の実施形態で
は、指向進化のラウンドは、複数のオリゴヌクレオチドに飽和変異誘発を実施するステッ
プを含む。
制約を使用してスクリーニングされ得る触媒された化学変換としては、これらに限定さ
れないが、例えば、ケトンの還元、アミノ基転移反応、酸化、ニトリルの加水分解、イミ
ンの還元、エノンの還元、アシル加水分解、およびハロヒドリンの脱ハロゲン化が挙げら
れる。制約を使用して評価される複数のバリアントを提供することができる酵素クラスの
例としては、これらに限定されないが、ケトンレダクターゼ、トランスアミナーゼ、シト
クロムP450、バイヤー−ビリガーモノオキシゲナーゼ、モノアミンオキシダーゼ、ニ
トリラーゼ、イミンレダクターゼ、エノンレダクターゼ、アシラーゼ、およびハロヒドリ
ンデハロゲナーゼが挙げられる。合理的にリガンドを設計する状況において、標的化され
た共有結合阻害(TCI)の最適化は、制約の使用のためにスクリーニングすることがで
きる活性のタイプである。TCI適用の例は、その全体が参照により本明細書に組み込ま
れているSinghら、The resurgence of covalent dr
ugs、Nature Reviews Drug Discovery、10巻、30
7〜317頁(2011年)で説明されている。一部の実施において、TCI活性は、タ
ンパク質中の求核性アミノ酸(例えば、システイン)を識別することによって見出される
。本明細書に記載されるプロセスは、阻害しようとする生体分子と反応することができる
、阻害に重要な求電子性部分の理想的な配向を規定する制約を満たす阻害剤(推定上の阻
害剤)の識別を助けることができる。
III.酵素を設計するための仮想タンパク質スクリーニングシステムの使用
一部の実施形態は、仮想タンパク質スクリーニングシステムを使用して酵素を仮想でモ
デリングし、スクリーニングして、それによって所望の性質、例えば触媒活性および選択
性を有する酵素を識別するためのプロセスを提供する。一部の実施形態では、現実の酵素
のファミリーを、仮想でモデリングして、最初のバリアントライブラリーとしてスクリー
ニングすることができる。一部の実施形態は、親のポリペプチドまたは参照配列として最
初のライブラリーから仮想スクリーニングによって選択された1つまたは複数の酵素を反
復して使用して、in silico、in vitro、またはin vivoの技術
によって新しいバリアントライブラリーを生成することができる。一部の実施形態では、
本明細書に記載されるようなシステムによって高くランク付けされた1つまたは複数の酵
素は、親のポリペプチドとして選択される。新しいバリアントライブラリーは、親のポリ
ペプチドの配列とは異なるタンパク質配列を含み、かつ/またはその後のバリエーション
を導入するための前駆体として使用することができる。
一部の実施形態では、親のポリペプチドは、指向進化の手順で、タンパク質バリアント
の新しいライブラリーを生成するために変異誘発および/または組換えベースの多様性生
成機構を実施することによって改変される。一部の実施形態では、親のポリペプチドは、
少なくとも1つの置換、挿入、交差、欠失、および/または他の遺伝子操作によって変更
される。指向進化は、ポリペプチドに対して直接的に(例えば、in silicoのプ
ロセスで)、またはポリペプチドをコードする核酸に対して間接的に(例えば、in v
itroのプロセスで)実施されてもよい。新しいライブラリーを使用して、さらなるス
クリーニングおよび指向進化のために新しいホモロジーモデルを生成することができる。
一部の実施形態では、酵素のモデリング、スクリーニング、および進化は、一定の基準
を満たす1つまたは複数の酵素に出会うまでin silicoで反復して実施される。
例えば、基準は、特定の結合エネルギーまたはスコア、またはそれらの改善であり得る。
他の実施形態は、in silicoの技術と物理的な(例えば、in vitroまた
はin vivoの)技術とを組み合わせてもよい。例えば、in vitroのスクリ
ーニングおよびシーケンシングによって誘導された酵素を使用した酵素設計プロセスを開
始することが可能である。in vitroのシーケンシングは、次世代のシーケンシン
グによって実施してもよい。次いで、酵素設計プロセスは、指向進化、モデリング、およ
びさらなるスクリーニングのためにin silicoの方法を使用することができる。
本プロセスは、最終的に、生物系で酵素を検証するためにin vitroおよび/また
はin vivoの技術を使用することができる。様々な適用のためにin silic
oおよび物理的な技術の他の組合せおよび順番が好適である。実際に、本発明が方法のい
ずれかの具体的な組合せおよび/または順番に限定されることは意図されない。
一部の実施形態では、ポリペプチド配列の調製は、in silicoで達成される。
他の実施形態では、ポリペプチドは、核酸シンセサイザーを使用してオリゴヌクレオチド
または核酸配列を合成し、ヌクレオチド配列を翻訳して、ポリペプチドを得ることによっ
て生成される。
上述したように、一部の実施形態では、選択された酵素は、タンパク質バリアントの新
しいライブラリーを生成するために1つまたは複数の組換えベースの多様性生成機構を実
施することによって改変されてもよい。このような組換え機構としては、これらに限定さ
れないが、例えば、シャッフリング、鋳型切り換え、オーバーラップ伸長による遺伝子ス
プライシング、エラープローンPCR、残基の半合成コンビナトリアルライブラリー、繰
り返し配列組換え(「RSR」)(例えば、その全体が参照により本明細書に組み込まれ
ている米国特許出願公開第2006/0223143号を参照)が挙げられる。一部の実
施形態では、これらの組換え機構の一部は、in vitroで実施されてもよい。一部
の実施形態では、これらの組換え機構の一部は、生物学的機構を模擬するためにコンピュ
ーターによりin silicoで実施されてもよい。
一部の実施形態は、タンパク質配列中の1つまたは複数の位置を選択すること、および
そのようにして選択された1つまたは複数の位置における、部位特異的変異方法、例えば
飽和変異誘発を実行することを含む。一部の実施形態では、位置は、本文書中の他所で論
じられたように、活性部位の構造および/または触媒反応に関する制約を評価することに
よって選択される。一部の実施形態では、仮想スクリーニングを配列−活性モデリングと
組み合わせることが有用である。これらの実施形態では、指向進化のプロセスは、配列−
活性モデルの項の係数を評価し、それによって目的の活性に寄与する残基の1つまたは複
数を識別することによって位置を選択することができる。米国特許第7,783,428
号(その全体が参照により本明細書に組み込まれている)は、変異誘発のためのアミノ酸
を識別するために使用できる配列活性モデルの例を提供する。
一部の実施形態では、本方法は、生成のための新しいタンパク質バリアントライブラリ
ーのメンバーの1つまたは複数を選択するステップを伴う。次いでこれらのバリアントの
1つまたは複数は、合成されてもよいし、および/または発現系で発現されてもよい。具
体的な実施形態では、本方法は、以下の方式:(i)新しいタンパク質バリアントライブ
ラリーの選択されたメンバーを発現することができる発現系を提供するステップと、(i
i)新しいタンパク質バリアントライブラリーの選択されたメンバーを発現するステップ
とにおいて継続される。
図3A〜3Cは、本明細書の他所で記載された要素の様々な組合せを実施する、生体分
子の配列を設計するためのワークフローの例を示す流れ図である。図3Aは、複数の開始
配列の配列情報を生体分子のパネル、例えば酵素のパネルから受け取るステップで開始さ
れるプロセス300に関する流れ図を示す。ブロック302を参照。次いでプロセスは、
仮想タンパク質スクリーニングシステムを使用して現在受け取っている配列の仮想スクリ
ーニングを実施する。ブロック304を参照。一部の実施形態では、仮想タンパク質スク
リーニングシステムは、開始配列の3次元ホモロジーモデルを作製して、上述したように
基質のポーズを検討することによって1つまたは複数の基質をホモロジーモデルとドッキ
ングし、それによって開始配列に関するドッキングスコアを生成することができる。また
仮想タンパク質スクリーニングシステムは、ドッキング参加物(酵素および基質)の相互
作用エネルギーおよび内部エネルギーを計算することもできる。さらに、仮想タンパク質
スクリーニングシステムは、ポーズの様々な制約を評価して、ポーズが活性であるかどう
か、すなわち基質の触媒的転換を引き起こす可能性の高い方式で基質が酵素と結合するか
どうかを決定することができる。さらに、一部の実施形態では、制約の評価はまた、触媒
反応の生成物がエナンチオ選択的および/または位置選択的であるかどうかに関する推論
も提供する。一部の実施形態では、プロセスは、仮想スクリーニングシステムによって決
定された結合エネルギー、活性、および選択性に基づき1つまたは複数の配列を選択する
。ブロック306を参照。次いでプロセスは、ステップ308で選択された配列のさらな
る調査を実行することが必要であるかどうかを評価する。必要な場合、この例におけるプ
ロセスは、選択された配列をコンピューターにより変異させる。変異は、上述した様々な
多様性生成機構、例えば変異誘発または組換えに基づく。ブロック310を参照。次いで
コンピューターにより変異させた配列は、仮想タンパク質スクリーニングシステムによる
仮想スクリーニングの新しいラウンドに提供される。ブロック304を参照。仮想スクリ
ーニングおよび選択は、配列のさらなる調査の必要性がなくなるまで反復適用のために実
施されてもよく、このような必要性は、反復適用の具体的な回数および/または所望の活
性の特定のレベルなどの事前設定された基準によって決定することができる。その時点で
、生体分子(例えば、酵素)を設計するプロセスをステップ312において完了させる。
図3Bは、酵素などの生体分子の指向進化のためのプロセス320に関する流れ図を示
し、このプロセスは、300のプロセスと比較して一部類似しているが一部異なる要素を
有する。プロセス320は、生体分子(例えば、酵素)の複数の開始配列のin vit
ro合成で開始され、これは、既存の生体分子パネルが利用できない場合に必要であるか
または有用である可能性がある。ブロック322を参照。また合成された配列をアッセイ
して配列に関するデータを収集してもよく、このデータは、仮想スクリーニングシステム
によりデータを得ることができない所望の性質の生体分子を設計するために有用な場合が
ある。次いでプロセスは、プロセス300のステップ304に類似するブロック324に
表された仮想タンパク質スクリーニングシステムを使用して合成された配列の仮想スクリ
ーニングを実施する。次いでプロセスは、仮想スクリーニングシステムによって決定され
た結合エネルギー、活性、および選択性に基づき1つまたは複数の配列を選択する。ブロ
ック326を参照。次いでプロセスは、ステップ328で選択された配列のさらなる指向
進化を実施することが必要かどうかを評価する。必要な場合、この例におけるプロセスは
、in silicoまたはin vitroで選択された配列を変異させる。変異は、
上述した様々な多様性生成機構に基づく。ブロック330を参照。次いで変異させた配列
は、仮想タンパク質スクリーニングシステムによる仮想スクリーニングの新しいラウンド
に提供される。ブロック324を参照。仮想スクリーニングおよび選択は、配列のさらな
る進化の必要性がなくなるまで反復適用のために実行されてもよく、このような必要性は
、反復適用の具体的な回数および/または所望の活性の特定のレベルなどの事前設定され
た基準によって決定することができる。その時点で、仮想スクリーニングシステムによっ
て選択された配列を合成し、発現させて、現実の酵素を生成する。ブロック332を参照
。生成された酵素は、仮想スクリーニングプロセスの結果を検証するために使用できる目
的の活性についてアッセイすることができる。ブロック334を参照。アッセイ後、指向
進化プロセスをステップ336において終結させる。
図3Cは、酵素などの生体分子の指向進化のためのプロセス340に関する流れ図を示
す。プロセス340は、in vitroの指向進化で開始して、生体分子(例えば、酵
素)の複数の開始配列を誘導する。ブロック342を参照。プロセス320におけるよう
に、誘導された配列をアッセイして、配列が所望の活性または選択性などの一定の基準を
満たすかどうかを決定する。基準を満たす配列は、さらなる開発のためのヒットとして決
定される。ブロック344を参照。次いでプロセスは、プロセス300のステップ304
に類似するブロック346に表された仮想タンパク質スクリーニングシステムを使用して
ヒットの仮想スクリーニングを実施する。一部の実施形態では、プロセスはまた、上述し
たような仮想スクリーニングシステムによって決定された結合エネルギー、活性、および
選択性にも基づいて、1つまたは複数の配列を選択する。次いでプロセスは、ステップ3
48で選択された配列の指向進化のさらなるラウンドを実施することが必要かどうかを評
価する。必要な場合、プロセスは、新しい反復適用におけるin vitroの指向進化
のさらなるラウンドのために選択された配列を提供する。ブロック342を参照。仮想ス
クリーニングおよび選択は、配列のさらなる進化の必要性がなくなるまで反復適用のため
に実施されてもよく、このような必要性は、事前設定された基準によって決定することが
できる。その時点で、生体分子(例えば、酵素)を設計するプロセスをステップ350に
おいて終了させる。
IV.タンパク質バリアントライブラリーの生成
タンパク質バリアントライブラリーは、ライブラリー中のメンバーによって異なる1つ
または複数の残基を有する複数のタンパク質の群を含む。これらのライブラリーは、本明
細書に記載の方法および/または当技術分野において公知の任意の適当な手段を使用して
生成することができる。様々な実施形態では、これらのライブラリーは、仮想タンパク質
スクリーニングシステムのための候補酵素を提供する。一部の実施形態では、ライブラリ
ーは、最初のラウンドではin silicoで提供されスクリーニングされてもよく、
その結果として得られた、その後のまたは最後のラウンドから仮想スクリーニングシステ
ムによって選択されたタンパク質は、in vitroでシーケンシングおよび/または
スクリーニングされてもよい。スクリーニングの最初のラウンドはin silicoで
実施されるため、スクリーニングのための時間およびコストを顕著に低減することができ
る。タンパク質バリアントライブラリー中に含まれるタンパク質の数は、従来の物理的な
スクリーニングと比較して、一部の実施におけるスクリーニングの最初のラウンドで容易
に増加させることができる。本開示が、本開示の方法で使用されるタンパク質ライブラリ
ー中のいずれかの特定のタンパク質数に限定されることは意図されない。さらに、本開示
が、いずれかの特定のタンパク質バリアントライブラリー(単数または複数)に限定され
ることも意図されない。
一例において、タンパク質バリアントライブラリーは、一部の実施形態では単一の遺伝
子ファミリーによってコードされ得る1つまたは複数の天然に存在するタンパク質、また
は他の実施形態では酵素のパネルから生成される。他の開始点としては、これらに限定さ
れないが、公知のタンパク質の組換え物および/または新規の合成タンパク質が挙げられ
る。ライブラリーは、これらの「シード」または「開始」タンパク質から様々な技術によ
って生成され得る。一例において、ライブラリーは、生物学的または化学的な技術を反映
する仮想プロセス、例えば、Stemmer(1994年)Proceedings o
f the National Academy of Sciences、USA、1
0747〜10751頁およびWO95/22625(両方とも、参照により本明細書に
組み込まれている)で説明されているようなDNA断片化媒介組換え、Nessら(20
02年)Nature Biotechnology 20巻:1251〜1255頁お
よびWO00/42561(両方とも、参照により本明細書に組み込まれている)で説明
されているような合成オリゴヌクレオチド媒介組換え、または1つまたは複数の親のタン
パク質の一部または全部をコードする核酸によって生成される。これらの方法の組合せが
使用され得(例えば、DNAフラグメントおよび合成オリゴヌクレオチドの組換え)、加
えて、当技術分野において公知の他の組換えベースの方法、例えば両方とも参照により本
明細書に組み込まれているWO97/20078およびWO98/27230が使用され
得る。タンパク質バリアントライブラリーを生成するために使用される任意の適当な方法
が、本開示において有用である。実際に、本開示が、バリアントライブラリーを生成する
ためのいずれかの特定の方法に限定されることは意図されない。
一部の実施形態では、単一の「開始」配列(これは、「祖先」配列であり得る)が、モ
デリングプロセスで使用される変異の群を規定する目的のために利用され得る。一部の実
施形態では、1つより多くの開始配列がある。一部の追加の実施形態では、開始配列の少
なくとも1つは、野生型配列である。ある特定の実施形態では、変異は、(a)基質特異
性、選択性、安定性、および/または他のいずれかの目的の性質に影響を及ぼすものとし
て、文献において識別され、かつ/または(b)タンパク質のフォールディングパターン
の改善(例えば、タンパク質の内部残基をパッキングすること)、リガンドの結合の改善
、サブユニットの相互作用の改善、または多種多様な相同体間のファミリーシャッフリン
グ方法の改善などのために、コンピューターにより予測される。本発明が目的の性質また
は機能のいずれかの具体的な選択に限定されることは意図されない。
一部の実施形態では、変異は、開始配列に仮想的に導入されてもよいし、タンパク質は
、有益な性質について仮想スクリーニングされてもよい。部位指向変異誘発は、変異を導
入するための有用な技術の一例であるが、任意の適当な方法が利用される。したがって、
代替的にまたは付加的に、変異体は、遺伝子合成、飽和ランダム変異誘発、残基の半合成
コンビナトリアルライブラリー、指向進化、繰り返し配列組換え(「RSR」)(例えば
、その全体が参照により本明細書に組み込まれている米国特許出願公開第2006/02
23143号を参照)、遺伝子シャッフリング、エラープローンPCR、および/または
他の任意の適当な方法によって提供されてもよい。好適な飽和変異誘発手順の一例は、そ
の全体が参照により本明細書に組み込まれている米国特許出願公開第2010/0093
560号で説明されている。
開始配列は、野生型タンパク質のアミノ酸配列と同一でなくてもよい。しかしながら、
一部の実施形態では、開始配列は、野生型タンパク質の配列である。一部の実施形態では
、開始配列は、野生型タンパク質に存在しない変異を含む。一部の実施形態では、開始配
列は、共通の性質を有するタンパク質の群、例えばタンパク質のファミリーに由来するコ
ンセンサス配列である。
一部の実施形態では、仮想スクリーニングシステムを使用してスクリーニングされ得る
触媒された化学変換としては、これらに限定されないが、例えば、ケトンの還元、アミノ
基転移反応、酸化、ニトリルの加水分解、イミンの還元、エノンの還元、アシル加水分解
、およびハロヒドリンの脱ハロゲン化が挙げられる。評価される複数のバリアントを提供
することができる酵素クラスの例としては、これらに限定されないが、ケトンレダクター
ゼ、トランスアミナーゼ、シトクロムP450、バイヤー−ビリガーモノオキシゲナーゼ
、モノアミンオキシダーゼ、ニトリラーゼ、イミンレダクターゼ、エノンレダクターゼ、
アシラーゼ、およびハロヒドリンデハロゲナーゼが挙げられる。
親配列の源として役立ち得る酵素のファミリーまたはクラスの非限定的な代表的な列挙
は、これらに限定されないが、オキシドレダクターゼ(E.C.1);トランスフェラー
ゼ(E.C.2);ヒドロリアーゼ(E.C.3);リアーゼ(E.C.4);イソメラ
ーゼ(E.C.5)およびリガーゼ(E.C.6)を含む。オキシドレダクターゼのより
具体的であるが非限定的なサブグループは、デヒドロゲナーゼ(例えば、アルコールデヒ
ドロゲナーゼ(カルボニルレダクターゼ)、キシルロースレダクターゼ、アルデヒドレダ
クターゼ、ファルネソールデヒドロゲナーゼ、乳酸デヒドロゲナーゼ、アラビノースデヒ
ドロゲナーゼ、グルコースデヒドロゲナーゼ(dehyrodgenase)、フルクト
ースデヒドロゲナーゼ、キシロースレダクターゼおよびコハク酸デヒドロゲナーゼ(de
hyrogenase))、オキシダーゼ(例えば、グルコースオキシダーゼ、ヘキソー
スオキシダーゼ、ガラクトースオキシダーゼおよびラッカーゼ)、モノアミンオキシダー
ゼ、リポキシゲナーゼ、ペルオキシダーゼ、アルデヒドデヒドロゲナーゼ、レダクターゼ
、長鎖アシル−[アシル担体タンパク質]レダクターゼ、アシル−CoAデヒドロゲナー
ゼ、エンレダクターゼ、シンターゼ(例えば、グルタミン酸シンターゼ)、硝酸レダクタ
ーゼ、モノおよびジオキシゲナーゼ、ならびにカタラーゼを含む。トランスフェラーゼの
より具体的であるが非限定的なサブグループは、メチル、アミジノ、およびカルボキシル
トランスフェラーゼ、トランスケトラーゼ、トランスアルドラーゼ、アシルトランスフェ
ラーゼ、グリコシルトランスフェラーゼ、トランスアミナーゼ、トランスグルタミナーゼ
およびポリメラーゼを含む。ヒドロラーゼのより具体的であるが非限定的なサブグループ
は、エステルヒドロラーゼ、ペプチダーゼ、グリコシラーゼ、アミラーゼ、セルラーゼ、
ヘミセルラーゼ、キシラナーゼ、キチナーゼ、グルコシダーゼ、グルカナーゼ、グルコア
ミラーゼ、アシラーゼ、ガラクトシダーゼ、プルラナーゼ、フィターゼ、ラクターゼ、ア
ラビノシダーゼ、ヌクレオシダーゼ、ニトリラーゼ、ホスファターゼ、リパーゼ、ホスホ
リパーゼ、プロテアーゼ、ATPアーゼ、およびデハロゲナーゼを含む。リアーゼのより
具体的であるが非限定的なサブグループは、デカルボキシラーゼ、アルドラーゼ、ヒドラ
ターゼ、デヒドラターゼ(例えば、炭酸脱水酵素)、シンターゼ(例えば、イソプレン、
ピネンおよびファルネセンシンターゼ)、ペクチナーゼ(例えば、ペクチンリアーゼ)お
よびハロヒドリンデヒドロゲナーゼを含む。イソメラーゼのより具体的であるが非限定的
なサブグループは、ラセマーゼ、エピメラーゼ、イソメラーゼ(例えば、キシロース、ア
ラビノース、リボース、グルコース、ガラクトースおよびマンノースイソメラーゼ)、ト
ートメラーゼ、およびムターゼ(例えばアシル転移ムターゼ、ホスホムターゼ、およびア
ミノムターゼを含む。リガーゼのより具体的な、ただし非限定的なサブグループは、エス
テルシンターゼを含む。親配列の源として使用され得る他の酵素のファミリーまたはクラ
スは、トランスアミナーゼ、プロテアーゼ、キナーゼ、およびシンターゼを含む。この列
挙は、本開示の可能性のある酵素のある特定の具体的な態様を例示しているが、網羅的で
あるとはみなされず、限定を示したりまたは本開示の範囲の境界を定めたりしない。
一部の場合には、本明細書に記載の方法において有用な候補酵素は、例えば、エナンチ
オ選択的な還元反応などのエナンチオ選択的な反応を触媒することができる。このような
酵素は、例えば医薬化合物の合成において有用な中間体の作製に使用できる。
一部の実施形態では、候補酵素は、エンドキシラナーゼ(EC3.2.1.8);β−
キシロシダーゼ(EC3.2.1.37);アルファ−L−アラビノフラノシダーゼ(E
C3.2.1.55);アルファ−グルクロニダーゼ(EC3.2.1.139);アセ
チルキシランエステラーゼ(EC3.1.1.72);フェルロイルエステラーゼ(EC
3.1.1.73);クマロイルエステラーゼ(EC3.1.1.73);アルファ−ガ
ラクトシダーゼ(EC3.2.1.22);ベータ−ガラクトシダーゼ(EC3.2.1
.23);ベータ−マンナナーゼ(EC3.2.1.78);ベータ−マンノシダーゼ(
EC3.2.1.25);エンド−ポリガラクツロナーゼ(EC3.2.1.15);ペ
クチンメチルエステラーゼ(EC3.1.1.11);エンド−ガラクタナーゼ(EC3
.2.1.89);ペクチンアセチルエステラーゼ(EC3.1.1.6);エンド−ペ
クチンリアーゼ(EC4.2.2.10);ペクチン酸リアーゼ(EC4.2.2.2)
;アルファラムノシダーゼ(EC3.2.1.40);エキソ−ポリアルファ−ガラクツ
ロノシダーゼ(galacturonosidase)(EC3.2.1.82);1,
4−アルファ−ガラクツロニダーゼ(galacturonidase)(EC3.2.
1.67);エキソポリガラクツロネート(exopolygalacturonate
)リアーゼ(EC4.2.2.9);ラムノガラクツロナンエンドリアーゼ(endol
yase)EC(4.2.2.B3);ラムノガラクツロナンアセチルエステラーゼ(E
C3.2.1.B11);ラムノガラクツロナンガラクツロノヒドロラーゼ(galac
turonohydrolase)(EC3.2.1.B11);エンド−アラビナナー
ゼ(arabinanase)(EC3.2.1.99);ラッカーゼ(EC1.10.
3.2);マンガン依存性ペルオキシダーゼ(EC1.10.3.2);アミラーゼ(E
C3.2.1.1)、グルコアミラーゼ(EC3.2.1.3)、プロテアーゼ、リパー
ゼ、およびリグニンペルオキシダーゼ(EC1.11.1.14)から選択される。1、
2、3、4、5種、または5種より多くの酵素の任意の組合せが、本開示の組成物におい
て有用である。本発明が、いずれかの特定の数の酵素および/または酵素クラスに限定さ
れることは意図されない。
任意の適当な方法が有用であるため、本発明が、系統的に変化させた配列を生成するた
めのいずれかの特定の方法に限定されることは意図されない。本開示の1つまたは複数の
実施形態では、ライブラリーを生成するために、単一の開始配列は様々な方式で改変され
る。一部の実施形態では、ライブラリーは、開始配列の個々の残基を系統的に変化させる
ことによって生成される。ライブラリーの系統的に変化させた配列のセットは、データセ
ット中の配列を規定するために実験計画(DOE)方法を使用して演繹的に設計されても
よい。DOE方法の説明は、Diamond, W.J.(2001年)Practic
al Experiment Designs: for Engineers and
Scientists、John Wiley & Sons、およびWilliam
J Drummondによる「Practical Experimental De
sign for Engineers and Scientists」(1981年
)Van Nostrand Reinhold Co New York、「Stat
istics for experimenters」George E.P. Box
、William G HunterおよびJ. Stuart Hunter(197
8年)John Wiley and Sons、New Yorkに、または例えばワ
ールドワイドウェブにおいてitl.nist.gov/div898/handboo
k/で見出すことができる。関連する数学を実施するために利用可能な数々のコンピュー
ター用パッケージがあり、例えば、Statistics Toolbox(MATLA
B(登録商標))、JMP(登録商標)、STATISTICA(登録商標)、およびS
TAT−EASE(登録商標)DESIGN EXPERT(登録商標)が挙げられる。
結果は、本明細書で開示された仮想タンパク質スクリーニングシステムによりスクリーニ
ングするために適当な配列の系統的に変化させた直交分散データのセットである。またD
OEベースのデータセットは、当技術分野で公知のようなプラケット−バーマンまたはフ
ラクショナルファクトリアルデザイン(Fractional Factorial D
esign)のいずれかを使用しても容易に生成することができる。Diamond,
W.J.(2001年)。
スクリーニングの最初のラウンドはin silicoにより高効率で実施することが
できるため、一部の実施形態は、通常バリアントの数が従来の物理的な方法でスクリーニ
ングするには多すぎる場合、利用可能な配列の一部または全部を使用して、タンパク質バ
リアントライブラリーを提供することができる。例えば、それぞれ20種の可能性のある
アミノ酸を有する15個の位置を有する配列について、300個の可能性のある位置対ア
ミノ酸の対が存在し、

種の異なるバリアント配列が存在する。一部の実施において、ライブラリーは、利用可能
な計算能力および用途の必要性に応じて、この可能性のあるプールからの数百、数千、数
万、数十万、またはそれより多くのバリアントを含む可能性がある。本開示が、ライブラ
リー中のいずれかの特定のバリアント数に限定されることは意図されない。
V.タンパク質バリアントのシーケンシング
一部の実施形態では、上述したような仮想スクリーニングで使用されるタンパク質バリ
アントの活性部位のコンピューターによるモデルを生成するために、物理的なタンパク質
バリアントが使用される。一部の実施形態では、仮想スクリーニングから得られたタンパ
ク質バリアントは、上述した様々な方法を使用して物理的に生成される。一部の実施形態
では、物理的に生成されたタンパク質バリアントは、1つまたは複数の目的のリガンドに
対するそれらの反応に関してアッセイされる。様々な実施形態では、物理的なタンパク質
バリアントの配列は、タンパク質シーケンシング方法によって確認され、その方法の一部
はさらに後述される。
タンパク質シーケンシングは、タンパク質のアミノ酸配列を決定することを伴う。いく
つかのタンパク質シーケンシング技法は、タンパク質がとるコンホメーション、およびタ
ンパク質が任意の非ペプチド分子と複合体形成される程度も決定する。質量分析法および
エドマン分解反応は、タンパク質のアミノ酸の配列を直接決定するために使用される場合
がある。
エドマン分解反応は、タンパク質の順序付けられたアミノ酸組成を発見するのを可能に
する。一部の実施形態では、自動エドマンシーケンサーをタンパク質バリアントの配列を
決定するために使用することができる。自動エドマンシーケンサーは、ますますより長い
配列(例えば、最大でおよそ長さ50アミノ酸の配列)のペプチドをシーケンシングする
ことができる。一部の実施形態では、エドマン分解を実施するタンパク質シーケンシング
プロセスは、以下のうちの1つ以上を伴う。
−− 還元剤、例えば、2−メルカプトエタノールを用いてタンパク質中のジスルフィ
ド架橋をブレイクする。ヨード酢酸などの保護基を、結合の再形成を妨げるために使用し
得る。
−− 1つを超えて存在する場合、タンパク質複合体の個々の鎖を分離および精製する

−− 各鎖のアミノ酸組成を決定する
−− 各鎖の末端アミノ酸を決定する
−− 各鎖をブレイクして断片、例えば、長さ50アミノ酸未満の断片にする。
−− 断片を分離および精製する
−− エドマン分解反応を使用して各断片の配列を決定する
−− アミノ酸配列の追加のリード(複数可)をもたらすために異なるパターンの切断
を適用して上記ステップを繰り返す。
−− アミノ酸配列リードから全体的なタンパク質の配列を構築する。
様々な実施において、約50〜70アミノ酸より長いペプチドは、エドマン反応による
シーケンシングを促進するために小さい断片にブレイクされるべきである。より長い配列
の消化は、トリプシンもしくはペプシンなどのエンドペプチダーゼによって、または臭化
シアンなどの化学試薬によって実施することができる。異なる酵素は、異なる切断パター
ンを与え、断片同士の重複を、全体的な配列を構築するために使用することができる。
エドマン分解反応中、シーケンシングされるペプチドは、基板の固体表面上に吸着され
ている。一部の実施形態では、1つの適当な基板は、ポリブレン、カチオン性ポリマーで
被覆されたガラス繊維である。エドマン試薬、フェニルイソチオシアネート(PITC)
が、トリメチルアミンの弱塩基性緩衝液と一緒に吸着されたペプチドに添加される。この
反応溶液は、N末端アミノ酸のアミン基と反応する。次いで末端アミノ酸を、無水酸を添
加することによって選択的に引き離すことができる。次いで誘導体が異性化して置換フェ
ニルチオヒダントインを与え、これを洗い落とし、クロマトグラフィーによって識別する
ことができる。次いでこのサイクルを繰り返すことができる。
一部の実施形態では、質量分析法を使用して、アミノ酸配列の断片の質量対電荷比を決
定することによってアミノ酸配列を決定することができる。多重荷電した断片に対応する
ピークを含む質量スペクトルを決定することができ、この場合、異なる同位体に対応する
ピーク同士の距離は、断片上の電荷に反比例する。質量スペクトルは、例えば、以前にシ
ーケンシングされたタンパク質のデータベースに対する比較によって分析されて、断片の
配列が決定される。次いでこのプロセスが異なる消化酵素を用いて繰り返され、配列にお
ける重複が使用されて、完全なアミノ酸配列が構築される。
ペプチドは、全タンパク質より、調製し、質量分析法で分析するのが容易であることが
多い。一部の実施形態では、エレクトロスプレーイオン化がペプチドをスペクトル計に送
達するために使用される。タンパク質は、エンドプロテアーゼによって消化され、得られ
た溶液は、高圧液体クロマトグラフィーカラムを通過させられる。このカラムの末端で、
溶液は、質量分析計中に噴霧され、陽電位で荷電される。溶液滴上の電荷が、これらを単
一イオンに断片化させる。次いでペプチドが断片化され、断片の質量対電荷比が測定され
る。
タンパク質をコードするDNAまたはmRNA配列からアミノ酸配列を間接的に決定す
ることも可能である。核酸シーケンシング方法、例えば、様々な次世代シーケンシング方
法が、DNAまたはRNA配列を決定するために使用され得る。一部の実施において、タ
ンパク質配列は、タンパク質をコードするヌクレオチドの知識なしで新しく単離される。
このような実施において、直接タンパク質シーケンシング方法の1つを使用して短いポリ
ペプチド配列を最初に決定し得る。タンパク質のRNAの相補的マーカーを、この短い配
列から決定することができる。次いでこれを、このタンパク質をコードするmRNAを単
離するために使用することができ、次いでこのmRNAをポリメラーゼ連鎖反応で複製し
てかなりの量のDNAを得ることができ、次いでこのDNAを、DNAシーケンシング方
法を使用してシーケンシングすることができる。次いでタンパク質のアミノ酸配列を、D
NA配列から演繹することができる。演繹法では、mRNAが翻訳された後に除去される
アミノ酸を考慮に入れることが必要である。
1つまたは複数の実施形態では、核酸配列データは、タンパク質の指向進化のプロセス
における様々な段階で使用することができる。1つまたはそれより多くの実施形態では、
配列データは、第1の世代のシーケンシング方法と見なされる例えば、サンガーシーケン
シングまたはマクサム−ギルバートシーケンシングを含めたバルクシーケンシング方法を
使用して得ることができる。標識されたジデオキシ鎖ターミネーターを使用することを伴
うサンガーシーケンシングは、当技術分野で周知である。例えば、Sangerら、Pr
oceedings of the National Academy of Sci
ences of the United States of America、74
巻、5463〜5467頁(1997年)を参照。核酸試料の断片に対して複数の部分的
な化学分解反応を実施し、その後断片を検出および分析して配列を推測することを伴うマ
クサム−ギルバートシーケンシングも当技術分野で周知である。例えば、Maxamら、
Proceedings of the National Academy of S
ciences of the United States of America、
74巻、560〜564頁(1977年)を参照。別のバルクシーケンシング方法は、ハ
イブリダイゼーションによるシーケンシングであり、このシーケンシングでは、試料の配
列が、例えば、マイクロアレイまたは遺伝子チップ上の複数の配列へのそのハイブリダイ
ゼーション性質に基づいて演繹される。例えば、Drmanacら、Nature Bi
otechnology、16巻、54〜58頁(1998年)を参照。
1つまたはそれより多くの実施形態では、核酸配列データは、次世代シーケンシング法
を使用して得られる。次世代シーケンシングは、ハイスループットシーケンシングとも呼
ばれる。この技法は、シーケンシングプロセスを並列化し、数千または数百万の配列を一
度に生成する。適当な次世代シーケンシング方法の例としては、それだけに限らないが、
単一分子リアルタイムシーケンシング(例えば、Menlo Park、Califor
niaのPacific Biosciences)、イオン半導体シーケンシング(例
えば、South San Francisco、CaliforniaのIon To
rrent)、パイロシーケンシング(例えば、Branford、Connectic
utの454)、ライゲーションによるシーケンシング(例えば、Carlsbad、C
aliforniaのLife Technologiesが所有するSOLiDシーケ
ンシング)、合成および可逆性ターミネーターによるシーケンシング(例えば、San
Diego、CaliforniaのIllumina)、透過型電子顕微鏡法などの核
酸イメージング技術などがある。
一般に、次世代シーケンシング方法は、典型的には、個々のDNA分子を増幅するため
にin vitroクローニングステップを使用する。エマルジョンPCR(emPCR
)は、油相内の水滴においてプライマー被覆ビーズとともに個々のDNA分子を単離する
。PCRは、DNA分子のコピーを生成し、これらはビーズ上のプライマーに結合し、そ
の後、後のシーケンシングのために固定化される。emPCRは、Marguilisら
(454 Life Sciences、Branford、CTによって商品化された
)、ShendureおよびPorrecaら(「ポロニーシーケンシング」としても公
知)による方法、ならびにSOLiDシーケンシング(Applied Biosyst
ems Inc.、Foster City、CA)で使用される。M.Marguli
esら(2005年)、「Genome sequencing in microfa
bricated high−density picolitre reactors
」、Nature、437巻:376〜380頁;J.Shendureら(2005年
)、「Accurate Multiplex Polony Sequencing
of an Evolved Bacterial Genome」、Science、
309巻(5741号):1728〜1732頁を参照。in vitroクローン増幅
は、「ブリッジPCR」によっても実施することができ、この場合、断片は、プライマー
が固体表面に付着されると増幅される。Braslavskyらは、この増幅ステップを
省略し、DNA分子を表面に直接固定する単一分子方法を開発した(Helicos B
iosciences Corp.、Cambridge、MAによって商品化された)
。I.Braslavskyら(2003年)、「Sequence informat
ion can be obtained from single DNA mole
cules」、Proceedings of the National Acade
my of Sciences of the United States of A
merica、100巻:3960〜3964頁。
表面に物理的に結合したDNA分子を、並列にシーケンシングすることができる。「合
成によるシーケンシング」では、相補鎖は、DNAポリメラーゼを使用して鋳型鎖の配列
に基づいて構築される。色素停止電気泳動シーケンシングのように、可逆性ターミネータ
ー方法(Illumina,Inc.、San Diego、CAおよびHelicos
Biosciences Corp.、Cambridge、MAによって商品化され
た)は、色素ターミネーターの可逆バージョンを使用し、一度に1つのヌクレオチドを付
加して、別のヌクレオチドの重合を可能にするためにブロッキング基を繰り返し除去する
ことによって、リアルタイムで各位置における蛍光を検出する。「パイロシーケンシング
」も、DNA重合を使用し、一度に1つのヌクレオチドを付加し、結合していたピロリン
酸の遊離によって放出された光によって所与の場所に付加されたヌクレオチドの数を検出
および定量化する(454 Life Sciences、Branford、CTによ
って商品化された)。M.Ronaghiら(1996年)、「Real−time D
NA sequencing using detection of pyropho
sphate release」、Analytical Biochemistry、
242巻:84〜89頁を参照。
次世代シーケンシング方法の具体例は、以下でさらに詳細に記載されている。本発明の
1つまたはそれより多くの実施は、本発明の原理から逸脱することなく、以下のシーケン
シング方法の1つまたはそれより多くを使用し得る。
単一分子リアルタイムシーケンシング(SMRTとしても公知)は、Pacific
Biosciencesが開発した、合成技術による並列化された単一分子DNAシーケ
ンシングである。単一分子リアルタイムシーケンシングは、ゼロモード導波路(ZMW)
を利用する。単一のDNAポリメラーゼ酵素が、鋳型としてのDNAの単一分子とともに
ZMWの底部に固定される。ZMWは、DNAポリメラーゼによって組み込まれているD
NAの単一のヌクレオチド(塩基としても公知)のみを観察するために十分小さい照らさ
れた観察体積を生成する構造体である。4つのDNA塩基の各々には、4つの異なる蛍光
色素の1つが結合されている。ヌクレオチドがDNAポリメラーゼによって組み込まれる
とき、蛍光タグが切り離され、ZMWの観察エリア外に拡散し、ここで、その蛍光は、も
はや観察可能でない。検出器は、ヌクレオチド組込みの蛍光シグナルを検出し、色素の対
応する蛍光にしたがって塩基のコールが行われる。
適用可能な別の単一分子シーケンシング技術は、Helicos True Sing
le Molecule Sequencing(tSMS)技術(例えば、Harri
s T.D.ら、Science、320巻:106〜109頁[2008年]に記載さ
れた)である。tSMS技法では、DNA試料が切断されておよそ100〜200ヌクレ
オチドの鎖にされ、polyA配列が各DNA鎖の3’末端に付加される。各鎖は、蛍光
標識アデノシンヌクレオチドの付加によって標識される。次いでDNA鎖は、フローセル
表面に固定化された数百万のオリゴ−T捕捉部位を含むフローセルにハイブリダイズされ
る。ある特定の実施形態では、鋳型は、約1億の鋳型/cmの密度とすることができる
。次いでフローセルは、計測器、例えば、HeliScope(商標)シーケンサー中に
装填され、レーザーがフローセルの表面を照らし、各鋳型の位置を明らかにする。CCD
カメラは、フローセル表面上の鋳型の位置をマッピングすることができる。次いで鋳型の
蛍光標識が切断され、洗い流される。シーケンシング反応は、DNAポリメラーゼおよび
蛍光標識ヌクレオチドを導入することによって始まる。オリゴ−T核酸は、プライマーと
して機能を果たす。ポリメラーゼは、鋳型指向様式でプライマーに標識ヌクレオチドを組
み込む。ポリメラーゼおよび組み込まれなかったヌクレオチドは、除去される。蛍光標識
ヌクレオチドの組込みを示す鋳型は、フローセル表面をイメージングすることによって見
分けられる。イメージング後、切断ステップにより、蛍光標識が除去され、プロセスは、
所望のリード長が達成されるまで他の蛍光標識ヌクレオチドを用いて繰り返される。配列
情報は、各ヌクレオチド付加ステップで収集される。単一分子シーケンシング技術による
全ゲノムシーケンシングは、シーケンシングライブラリーの調製におけるPCRベースの
増幅を除外し、または典型的には不要にし、この方法は、試料のコピーの測定ではなくそ
の試料の直接測定を可能にする。
イオン半導体シーケンシングは、DNAの重合中に放出される水素イオンの検出に基づ
くDNAシーケンシングの方法である。これは、シーケンシング中に相補鎖が鋳型鎖の配
列に基づいて構築される「合成によるシーケンシング」の一方法である。シーケンシング
される鋳型DNA鎖を含むマイクロウェルは、単一種のデオキシリボヌクレオチド三リン
酸(dNTP)であふれさせられる。導入されるdNTPがリーディング鋳型ヌクレオチ
ド(leading template nucleotide)に相補的である場合、
それは、成長中の相補鎖に組み込まれる。これは、反応が起こったことを示す、ISFE
Tイオンセンサーを作動させる水素イオンの放出を引き起こす。ホモポリマーリピートが
鋳型配列中に存在する場合、複数のdNTP分子が単一のサイクルで組み込まれる。これ
は、対応する数の水素の放出および比例してより高い電子シグナルをもたらす。この技術
は、修飾ヌクレオチドまたは光学系が使用されないという点で他のシーケンシング技術と
異なる。イオン半導体シーケンシングは、イオントレントシーケンシング、pH媒介シー
ケンシング、シリコンシーケンシング、または半導体シーケンシングと呼ばれる場合もあ
る。
パイロシーケンシングでは、重合反応によって放出されるピロリン酸イオンは、ATP
スルフリラーゼによってアデノシン5’ホスホ硫酸と反応させられてATPを生成する。
次いでATPは、ルシフェラーゼによるルシフェリンのオキシルシフェリンおよび光への
転換を推進する。蛍光は一過性であるので、蛍光を排除する別個のステップは、この方法
では必要でない。一タイプのデオキシリボヌクレオチド三リン酸(dNTP)が一度に付
加され、配列情報は、どのdNTPが反応部位において有意なシグナルを生成するかによ
って見分けられる。市販のRoche GS FLX計測器は、この方法を使用して配列
を取得する。この技法およびその用途は、例えば、Ronaghiら、Analytic
al Biochemistry、242巻、84〜89頁(1996年)、およびMa
rguliesら、Nature、437巻、376〜380頁(2005年)(Nat
ure、441巻、120頁(2006年)の誤植)に詳細に論じられている。市販のパ
イロシーケンシング技術は、454シーケンシング(Roche)(例えば、Margu
lies,M.ら、Nature、437巻:376〜380頁[2005年]に記載さ
れた)である。
ライゲーションシーケンシングでは、オーバーハングを有する部分的に二本鎖のオリゴ
ヌクレオチドを、オーバーハングを有するシーケンシングされている核酸に接合するため
に、リガーゼ酵素が使用される。ライゲーションが起こるために、オーバーハングは、相
補的でなければならない。部分的に二本鎖のオリゴヌクレオチドのオーバーハング中の塩
基は、部分的に二本鎖のオリゴヌクレオチドおよび/または部分的に二本鎖のオリゴヌク
レオチドの別の一部にハイブリダイズする第2のオリゴヌクレオチドにコンジュゲートし
たフルオロフォアによって識別することができる。蛍光データを取得した後、ライゲーシ
ョンされた複合体は、その認識部位(部分的に二本鎖のオリゴヌクレオチド中に含まれて
いた)から固定距離をカットするII型制限酵素、例えば、Bbvlなどによって、ライ
ゲーション部位の上流で切断される。この切断反応により、先のオーバーハングのすぐ上
流に新しいオーバーハングが露出され、このプロセスが繰り返される。この技法およびそ
の用途は、例えば、Brennerら、Nature Biotechnology、1
8巻、630〜634頁(2000年)に詳細に論じられている。一部の実施形態では、
ライゲーションシーケンシングは、環状核酸分子のローリングサークル増幅生成物を得、
ライゲーションシーケンシングの鋳型としてローリングサークル増幅生成物を使用するこ
とによって、本発明の方法に適応されている。
ライゲーションシーケンシング技術の市販の例は、SOLiD(商標)技術(Appl
ied Biosystems)である。SOLiD(商標)のライゲーションによるシ
ーケンシングでは、ゲノムDNAがせん断されて断片にされ、アダプターが断片の5’お
よび3’末端に結合されて断片ライブラリーが生成される。あるいは、アダプターを断片
の5’および3’末端にライゲーションし、断片を環状化し、環状化した断片を消化して
内部アダプターを生成し、アダプターを得られた断片の5’および3’末端に結合させる
ことによって内部アダプターを導入して、メイトペアのライブラリーを生成することがで
きる。次に、クローンのビーズ集団が、ビーズ、プライマー、鋳型、およびPCRコンポ
ーネントを含むマイクロリアクター内で調製される。PCRの後、鋳型が変性され、伸長
した鋳型を有するビーズを分離するためにビーズが濃縮される。選択されたビーズ上の鋳
型は、ガラススライドへの結合を可能にする3’修飾に付される。配列は、特異的フルオ
ロフォアによって識別される中央決定塩基(central determined b
ase)(または塩基の対)を有する部分的にランダムなオリゴヌクレオチドを逐次ハイ
ブリサイズおよびライゲーションすることによって決定することができる。色が記録され
た後、ライゲーションされたオリゴヌクレオチドが切断および除去され、次いでこのプロ
セスが繰り返される。
可逆性ターミネーターシーケンシングでは、ブロッキング基の存在に起因して可逆性鎖
ターミネーターである蛍光色素標識ヌクレオチド類似体が、単一塩基伸長反応で組み込ま
れる。塩基のアイデンティティーは、フルオロフォアによって決定される。言い換えれば
、各塩基は、異なるフルオロフォアと対形成される。蛍光/配列データが取得された後、
フルオロフォアおよびブロッキング基は、化学的に除去され、サイクルは、次の塩基の配
列情報を取得するために繰り返される。Illumina GA計測器は、この方法によ
って動作する。この技法およびその用途は、例えば、Ruparelら、Proceed
ings of the National Academy of Sciences
of the United States of America、102巻、59
32〜5937頁(2005年)、およびHarrisら、Science、320巻、
106〜109頁(2008年)に詳細に論じられている。
可逆性ターミネーターシーケンシング法の市販の例は、Illuminaの合成による
シーケンシングおよび可逆性ターミネーターベースのシーケンシング(例えば、Bent
leyら、Nature、6巻:53〜59頁[2009年]に記載された)である。I
lluminaのシーケンシング技術は、断片化されたゲノムDNAの、オリゴヌクレオ
チドアンカーが結合している平面の光学的に透明な表面への結合を利用する。鋳型DNA
が末端修復されて5’−リン酸化平滑末端が生成され、クレノウ断片のポリメラーゼ活性
が使用されて、平滑リン酸化DNA断片の3’末端に単一のA塩基が付加される。この付
加により、オリゴヌクレオチドアダプターへのライゲーションのためのDNA断片が調製
され、このアダプターは、その3’末端に単一のT塩基のオーバーハングを有することに
よってライゲーション効率を増大させる。アダプターオリゴヌクレオチドは、フローセル
アンカーと相補的である。限界希釈条件下で、アダプター修飾一本鎖鋳型DNAがフロー
セルに添加され、アンカーへのハイブリダイゼーションによって固定化される。結合した
DNA断片は、伸長および架橋増幅されて、それぞれが約1,000コピーの同じ鋳型を
含む数億のクラスターを有する超高密度シーケンシングフローセルが生成される。鋳型は
、除去可能な蛍光色素を有する可逆性ターミネーターを使用するロバストな4色のDNA
の合成によるシーケンシング技術を使用してシーケンシングされる。高感度蛍光検出が、
レーザー励起および全内部反射光学系を使用して達成される。約20〜40bp、例えば
、36bpの短い配列リードが繰り返しマスクされた参照ゲノムに対してアラインメント
され、この短い配列リードの参照ゲノムへの固有のマッピングが、特別に開発されたデー
タ解析パイプラインソフトウェアを使用して識別される。繰り返しマスクされていない参
照ゲノムも使用することができる。繰り返しマスクされた参照ゲノムが使用されても、繰
り返しマスクされていない参照ゲノムが使用されても、参照ゲノムにユニークにマッピン
グするリードのみがカウントされる。最初のリードが完了した後、断片の反対の末端から
の第2のリードを可能にするために、鋳型をin situで再生することができる。し
たがって、DNA断片のシングルエンドまたはペアエンドシーケンシングのいずれかを使
用することができる。試料中に存在するDNA断片の部分的なシーケンシングが実施され
、既知の参照ゲノムにマッピングされる所定の長さ、例えば、36bpのリードを含む配
列タグがカウントされる。
ナノ細孔シーケンシングでは、一本鎖核酸分子が、例えば電気泳動駆動力を使用して細
孔に通され、一本鎖核酸分子が細孔を通過する際に得られるデータを分析することによっ
て配列が演繹される。データは、イオン電流データとすることができ、ここで各塩基は、
例えば、細孔を通過する電流を異なる、区別可能な程度に部分的に遮断することによって
電流を変化させる。
別の例示的な、しかし非限定的な実施形態では、本明細書に記載の方法は、透過型電子
顕微鏡法(TEM)を使用して配列情報を得るステップを含む。本方法は、重原子マーカ
ーで選択的に標識された高分子量(150kbまたはそれ超)DNAの単原子分解能透過
型電子顕微鏡イメージングを利用するステップ、および一貫した塩基間間隔を有する超高
密度(3nmの鎖間)並列アレイにおいて超薄膜上にこれらの分子を配列するステップを
含む。電子顕微鏡は、膜上の分子をイメージングして重原子マーカーの位置を決定し、D
NAから塩基配列情報を抽出するために使用される。本方法は、PCT特許公開第WO2
009/046445号にさらに記載されている。
別の例示的な、しかし非限定的な実施形態では、本明細書に記載の方法は、第3の世代
のシーケンシングを使用して配列情報を得るステップを含む。第3の世代のシーケンシン
グでは、多くの小さい(約50nm)穴を有するアルミニウム被膜を含むスライドがゼロ
モード導波路として使用される(例えば、Leveneら、Science、299巻、
682〜686頁(2003年)を参照)。アルミニウム表面は、ポリホスホネート化学
、例えば、ポリビニルホスホネート化学によってDNAポリメラーゼの結合から保護され
ている(例えば、Korlachら、Proceedings of the Nati
onal Academy of Sciences of the United S
tates of America、105巻、1176〜1181頁(2008年)を
参照)。これは、アルミニウム被膜の穴中の露出したシリカへのDNAポリメラーゼ分子
の優先的な結合をもたらす。この設定は、蛍光バックグラウンドを低減させるためにエバ
ネッセント波現象を使用することを可能にし、より高い濃度の蛍光標識されたdNTPの
使用を可能にする。フルオロフォアは、dNTPの終端リン酸に結合されており、その結
果、dNTPが組み込まれると蛍光が放出されるが、フルオロフォアは、新しく組み込ま
れたヌクレオチドに結合されたままでなく、これは、複合体が、組込みの別のラウンドの
ために直ちに準備ができることを意味する。この方法によって、アルミニウム被膜の穴の
中に存在する個々のプライマー−鋳型複合体へのdNTPの組込みを検出することができ
る。例えば、Eidら、Science、323巻、133〜138号(2009年)を
参照。
(VI.遺伝子およびタンパク質バリアントのアッセイ)
一部の実施形態では、本発明の方法に関連して生成されるポリヌクレオチドは、活性ス
クリーニングのためのタンパク質バリアントを発現させるように細胞内に任意選択でクロ
ーニングされる(またはスクリーニングされる生成物を作製するためにin vitro
転写反応で使用される)。さらに、タンパク質バリアントをコードする核酸は、in v
itroで濃縮し、シーケンシングし、発現させ、増幅し、または任意の他の一般的な組
換え方法で処理することができる。
クローニング、変異誘発、ライブラリー構築、スクリーニングアッセイ、細胞培養など
を含めた本明細書で有用な分子生物学的技法を記載する一般的な教科書としては、Ber
gerおよびKimmel、Guide to Molecular Cloning
Techniques,Methods in Enzymology、152巻、Ac
ademic Press,Inc.、San Diego、CA(Berger);S
ambrookら、Molecular Cloning − A Laborator
y Manual(2版)、1〜3巻、Cold Spring Harbor Lab
oratory、Cold Spring Harbor、New York、1989
年(Sambrook)、ならびにCurrent Protocols in Mol
ecular Biology、F.M.Ausubelら編、Current Pro
tocols、Greene Publishing Associates,Inc.
とJohn Wiley & Sons,Inc.、New Yorkとの間のジョイン
トベンチャー(2000年にかけて補足された)(Ausubel))がある。核酸を植
物および動物細胞を含めた細胞に形質導入する方法と同様に、このような核酸によってコ
ードされるタンパク質を発現させる方法も、一般に利用可能である。Berger、Au
subel、およびSambrookに加えて、動物細胞の培養についての有用な一般的
な参考文献としては、Freshney(Culture of Animal Cel
ls,a Manual of Basic Technique、3版、Wiley−
Liss、New York(1994年))、およびその中に引用された参考文献、
Humason(Animal Tissue Techniques、4版、W.H.
Freeman and Company(1979年))、ならびにRicciard
elliら、In Vitro Cell Dev.Biol.、25巻:1016〜1
024頁(1989年)がある。植物細胞のクローニング、培養、および再生についての
参考文献としては、Payneら(1992年)、Plant Cell and Ti
ssue Culture in Liquid Systems、John Wile
y & Sons,Inc.、New York、NY(Payne);ならびにGam
borgおよびPhillips(編)(1995年)、Plant Cell,Tis
sue and Organ Culture; Fundamental Metho
ds Springer Lab Manual、Springer−Verlag(B
erlin Heidelberg New York)(Gamborg)がある。様
々な細胞培養培地が、AtlasおよびParks(編)、The Handbook
of Microbiological Media(1993年)、CRC Pres
s、Boca Raton、FL(Atlas)に記載されている。植物細胞培養につい
ての追加の情報は、市販の文献、例えば、Sigma−Aldrich,Inc.(St
Louis、MO)からのthe Life Science Research C
ell Culture Catalogue(1998年)(Sigma−LSRCC
C)、および例えば、同様にSigma−Aldrich,Inc.(St Louis
、MO)からのthe Plant Culture Catalogue and s
upplement(1997年)(Sigma−PCCS)に見つかる。
例えば、オリゴヌクレオチド組換え核酸を増幅するために有用なin vitro増
幅方法に当業者を導くために十分な技法の例として、ポリメラーゼ連鎖反応(PCR)、
リガーゼ連鎖反応(LCR)、Qβ−レプリカーゼ増幅、および他のRNAポリメラーゼ
媒介技法(例えば、NASBA)がある。これらの技法は、Berger、Sambro
ok、およびAusubel、上記、ならびにMullisら(1987年)、米国特許
第4,683,202号;PCR Protocols A Guide to Met
hods and Applications(Innisら編)、Academic
Press Inc.、San Diego、CA(1990年)(Innis);Ar
nheimおよびLevinson(1990年10月1日)C&EN、36〜47頁;
The Journal Of NIH Research(1991年)、3巻、81
〜94頁;Kwohら(1989年)、Proc.Natl.Acad.Sci.USA
、86巻、1173頁;Guatelliら(1990年)、Proc.Natl.Ac
ad.Sci.USA、87巻、1874頁;Lomellら(1989年)、J.Cl
in.Chem、35巻、1826頁;Landegrenら(1988年)、Scie
nce、241巻、1077〜1080頁;Van Brunt(1990年)、Bio
technology、8巻、291〜294頁;WuおよびWallace(1989
年)、Gene、4巻、560頁;Barringerら(1990年)、Gene、8
9巻、117頁、ならびにSooknananおよびMalek(1995年)、Bio
technology、13巻:563〜564頁に見つかる。増幅核酸をin vit
roでクローニングする改良方法は、Wallaceら、米国特許第5,426,039
号に記載されている。PCRによって大きい核酸を増幅する改良方法は、Chengら(
1994年)、Nature、369巻:684〜685頁、およびその中の参考文献に
要約されており、これらの中で最大で40kbのPCRアンプリコンが生成されている。
本質的に任意のRNAを、制限消化、PCR拡大、ならびに逆転写酵素およびポリメラー
ゼを使用するシーケンシングに適した二本鎖DNAに変換することができることを当業者
は理解する。Ausubel、Sambrook、およびBerger、すべて上記を参
照。
一好適な方法では、再アセンブルされた配列が、ファミリーベース組換えオリゴヌクレ
オチドの組込みについて点検される。これは、例えば、Sambrook、Berger
、およびAusubel、上記に本質的に教示されているように、核酸をクローニングお
よびシーケンシングすることによって、かつ/または制限消化によって行うことができる
。さらに、配列をPCR増幅し、直接シーケンシングすることができる。したがって、例
えば、Sambrook、Berger、Ausubel、およびInnis(上記)に
加えて、追加のPCRシーケンシング方法論も特に有用である。例えば、PCR中のホウ
素化ヌクレアーゼ耐性ヌクレオチドのアンプリコン中への選択的な組み込み、および大き
さを合わせた鋳型断片を生成するためのヌクレアーゼを用いたアンプリコンの消化による
PCR生成アンプリコンの直接シーケンシングが実施された(Porterら(1997
年)、Nucleic Acids Research、25巻(8号):1611〜1
617頁)。この方法では、鋳型に対して4つのPCR反応が実施され、その各々におい
て、PCR反応混合物中のヌクレオチド三リン酸の1つが2’デオキシヌクレオシド5’
−[P−ボラノ]−三リン酸と部分的に置換される。ホウ素化ヌクレオチドは、鋳型のP
CR断片の入れ子集合においてPCRアンプリコンに沿った様々な位置でPCR生成物中
に確率論的に組み込まれる。組み込まれたホウ素化ヌクレオチドによって遮断されたエキ
ソヌクレアーゼがPCRアンプリコンを切断するために使用される。次いで切断されたア
ンプリコンは、ポリアクリルアミドゲル電気泳動を使用してサイズによって分離され、ア
ンプリコンの配列をもたらす。この方法の利点は、それが、PCRアンプリコンの標準的
なサンガースタイルシーケンシングを実施するより、少ない生化学的操作を使用すること
である。
合成遺伝子は、慣例的なクローニングおよび発現手法に適用でき、したがって、遺伝子
およびこれらがコードするタンパク質の性質は、宿主細胞内でこれらを発現させた後に容
易に検査することができる。合成遺伝子は、in vitro(無細胞)転写および翻訳
によってポリペプチド生成物を生成するためにも使用することができる。したがって、ポ
リヌクレオチドおよびポリペプチドを、様々な所定のリガンド、低分子、およびイオン、
または他のタンパク質およびポリペプチドエピトープを含めたポリマーおよびヘテロポリ
マー物質、ならびに微生物細胞壁、ウイルスの粒子、表面、および膜に結合するこれらの
能力について検査することができる。
例えば、多くの物理的な方法を、直接ポリヌクレオチドによる、またはコードされたポ
リペプチドによる化学反応の触媒作用に関連した表現型をコードするポリヌクレオチドを
検出するために使用することができる。もっぱら例示の目的のために、かつ目的の特定の
所定の化学反応の細目に応じて、これらの方法は、基質(複数可)と生成物(複数可)と
の間の物理的差異、または化学反応と関連した反応媒体の変化(例えば、電磁放射線、吸
着、散逸、および蛍光(UV、可視、もしくは赤外(熱)であってもなくても)の変化)
を説明する当技術分野で公知の多数の技法を含み得る。これらの方法は、以下のうちの任
意の組合せから選択することができる:質量分析;核磁気共鳴;同位体分布または標識生
成物形成を説明する同位体標識材料、分割法およびスペクトル法;反応生成物(複数可)
のイオンまたは元素の組成における付随する変化(pH、無機および有機イオンなどの変
化を含む)を検出するためのスペクトル法および化学的方法。本明細書の方法で使用する
ために適した物理的なアッセイの他の方法は、レポーター性質を有する抗体を含むもの、
またはレポーター遺伝子の発現および活性とカップリングしたin vivo親和性認識
に基づくものを含めた反応生成物(複数可)に特異的なバイオセンサーの使用に基づくこ
とができる。in vivoでの反応生成物検出および細胞寿命−細胞死−細胞増殖選択
のための酵素併用アッセイも、適切な場合使用することができる。物理的なアッセイの特
異的な性質にかかわらず、これらはすべて、目的の生体分子によってもたらされ、または
コードされる所望の活性または所望の活性の組合せを選択するために使用される。
選択に使用される具体的なアッセイは、用途に依存することになる。タンパク質、受容
体、リガンド、酵素、基質などについての多くのアッセイが公知である。フォーマットと
しては、固定化されたコンポーネントへの結合、細胞または生物生存能、レポーター組成
物の生成などがある。
ハイスループットアッセイは、本発明で使用されるライブラリーをスクリーニングする
ために特に適している。ハイスループットアッセイでは、1日で、最大で数千の異なるバ
リアントをスクリーニングすることが可能である。例えば、マイクロタイタープレートの
各ウェルを、別個のアッセイを走らせるために使用することができ、または濃度もしくは
インキュベーション時間効果が観察される場合、5〜10ウェル毎に、単一のバリアント
を(例えば、異なる濃度で)試験することができる。したがって、単一の標準的なマイク
ロタイタープレートは、約100(例えば、96)の反応をアッセイすることができる。
1536ウェルプレートが使用される場合、単一のプレートは、約100〜約1500の
異なる反応を容易にアッセイすることができる。1日当たりに数個の異なるプレートをア
ッセイすることが可能であり、最大で約6,000〜20,000の異なるアッセイ(す
なわち、異なる核酸、コードされるタンパク質、濃度などを伴う)のアッセイスクリーニ
ングが、本発明の総合システムを使用して可能である。さらに最近では、試薬操作に対す
るマイクロ流体手法が、例えば、Caliper Technologies(Moun
tain View、CA)によって開発されており、これは、非常にハイスループット
なマイクロ流体アッセイ方法をもたらすことができる。
ハイスループットスクリーニングシステムは、市販されている(例えば、Zymark
Corp.、Hopkinton、MA;Air Technical Indust
ries、Mentor、OH;Beckman Instruments,Inc.、
Fullerton、CA;Precision Systems,Inc.、Nati
ck、MAなどを参照)。これらのシステムは、典型的には、すべての試料および試薬の
ピペット操作、液体分注、時限インキュベーション、ならびにアッセイに適切な検出器(
複数可)におけるマイクロプレートの最終的な読み取りを含む全手順を自動化する。これ
らの構成可能なシステムは、ハイスループットで迅速な開始、ならびに高度の柔軟性およ
びカスタマイゼーションを提供する。
このようなシステムの製造者は、様々なハイスループットスクリーニングアッセイのた
めの詳細なプロトコルを提供している。したがって例えば、Zymark Corp.は
、遺伝子転写の調節、リガンド結合などを検出するためのスクリーニングシステムを記載
する技術告示を提供している。
例えば、PC(Intel x86もしくはペンティアム(登録商標)チップ互換性の
MAC OS、WINDOWS(登録商標)ファミリー、またはUNIX(登録商標)ベ
ース(例えば、SUNTMワークステーション)コンピューターを使用して、デジタル化
されたビデオ、またはデジタル化された光学もしくは他のアッセイ画像をデジタル化、記
憶、および分析するために、様々な市販の周辺装置およびソフトウェアが利用可能である
分析用システムは、典型的には、本明細書の方法の1つまたはそれより多くのステップ
を指示するためのソフトウェアを使用する特殊なアルゴリズムを実施するように具体的に
プログラムされたデジタルコンピューターを含み、かつ任意選択で、例えば、次世代シー
ケンシングプラットフォーム制御ソフトウェア、ハイスループット液体制御ソフトウェア
、画像解析ソフトウェア、データ解釈ソフトウェア、源からデジタルコンピューターに作
動可能に連結した移動先に溶液を移動させるためのロボット液体制御アーマチュア、ロボ
ット液体制御アーマチュアによるオペレーションまたはハイスループット液体移動を制御
するためにデジタルコンピューターにデータを入力するための入力デバイス(例えば、コ
ンピューターキーボード)、および任意選択で、標識されたアッセイコンポーネントから
の標識シグナルをデジタル化するためのイメージスキャナーも含む。イメージスキャナー
は、プローブ標識強度の測定値をもたらすように画像解析ソフトウェアとインターフェー
スをとることができる。典型的には、プローブ標識強度測定値は、データ解釈ソフトウェ
アによって解釈されて、標識プローブが固体支持体上のDNAにハイブリダイズするか否
かが示される。
一部の実施形態では、in vitroオリゴヌクレオチド媒介組換え生成物、または
in silicoで組み換えられた核酸の物理的な実施形態を含む細胞、ウイルスプラ
ーク、胞子などは、固体培地上で分離されて個々のコロニー(またはプラーク)を生成す
ることができる。自動コロニーピッカー(例えば、Q−bot、Genetix、U.K
.)を使用して、コロニーまたはプラークが識別され、摘み取られ、最大で10,000
の異なる変異体が、2個の3mmのガラス玉/ウェルを含む96ウェルマイクロタイター
皿に接種される。Q−botは、コロニー全体を摘み取るのではなく、コロニーの中心を
通じてピンを挿入し、細胞(または菌糸体)および胞子(またはプラーク用途におけるウ
イルス)を少し試料採取して終了する。ピンがコロニー中に存在する時間、培養培地に接
種するためのディップの数、ピンがその培地中に存在する時間、各効果の接種量、および
各パラメータは、制御および最適化することができる。
Q−botなどの自動コロニーピッキングの均一なプロセスにより、人のハンドリング
誤差が減少し、培養を確立する速度が増大する(おおよそ10,000/4時間)。これ
らの培養物は、温度および湿度が制御されたインキュベーター内で任意選択で振盪される
。マイクロタイタープレート中の任意選択のガラス玉は、発酵槽のブレードと同様に細胞
の均一な通気および細胞(例えば、菌糸体)断片の分散を促進するように作用する。目的
の培養物に由来するクローンは、限界希釈によって単離することができる。やはり上記に
記載したように、ライブラリーを構成するプラークまたは細胞は、ハイブリダイゼーショ
ン、タンパク質活性、抗体へのタンパク質結合などのいずれかを検出することによって、
タンパク質の生成について直接スクリーニングすることもできる。十分なサイズのプール
を識別する機会を増大させるために、処理される変異体の数を10倍増大させるプレスク
リーニングを使用することができる。一次スクリーニングの目標は、親株(複数可)と等
しい、またはそれより良好な生成物力価を有する変異体を迅速に識別すること、およびこ
れらの変異体のみを後続の分析のために液体細胞培養に進めることである。
多様なライブラリーをスクリーニングする一手法は、大量並列固相手順を使用してポリ
ヌクレオチドバリアント、例えば、酵素バリアントをコードするポリヌクレオチドを発現
する細胞をスクリーニングすることである。吸収、蛍光、またはFRETを使用する大量
並列固相スクリーニング装置が利用可能である。例えば、Bylinaらの米国特許第5
,914,245号(1999年)を参照。http://www|.|kairos−
scientific.com/;Youvanら(1999年)「Fluoresce
nce Imaging Micro−Spectrophotometer (FIM
S)」、Biotechnologyその他、<www|.|et−al.com>、1
巻:1〜16頁;Yangら(1998年)、「High Resolution Im
aging Microscope (HIRIM)」、Biotechnologyそ
の他、<www|.|et−al.com>、4巻:1〜20頁;およびwww|.|k
airos−scientific.com.に書き込まれたYouvanら(1999
年)、「Calibration of Fluorescence Resonanc
e Energy Transfer in Microscopy Using Ge
netically Engineered GFP Derivatives on
Nickel Chelating Beads」も参照。これらの技法によってスクリ
ーニングされた後、目的の分子は、典型的には単離され、当技術分野で公知である方法を
使用して任意選択でシーケンシングされる。次いで配列情報が本明細書に示したように使
用されて、新しいタンパク質バリアントライブラリーが設計される。
同様に、いくつかの周知のロボットシステムも、アッセイシステムで有用な溶液相化学
反応のために開発された。これらのシステムとしては、Takeda Chemical
Industries,LTD.(大阪、日本)によって開発された自動合成装置のよ
うな自動ワークステーション、および科学者によって実施されるマニュアル合成操作を模
倣する、ロボットアームを利用する多くのロボットシステム(Zymate II、Zy
mark Corporation、Hopkinton、Mass.;Orca、Be
ckman Coulter,Inc.(Fullerton、CA))がある。上記デ
バイスのいずれも、本発明で使用するために、例えば、本明細書に記載されるように進化
させられた核酸によってコードされる分子のハイスループットスクリーニングに適してい
る。これらのデバイスを本明細書に論じたように操作することができるようにこれらを改
良すること(もしあれば)の特質および実施は、当業者に明らかとなるであろう。
(VII.デジタル装置およびシステム)
明らかであるはずであるように、本明細書に記載の実施形態は、1つまたはそれより多
くのコンピューターシステム内に記憶された、またはこれらによって移された命令および
/またはデータの制御下で作用するプロセスを使用する。本明細書に開示の実施形態は、
これらのオペレーションを実施するための装置にも関する。一部の実施形態では、装置は
、要求される目的のために特別に設計および/または構築されており、またはこれは、コ
ンピューター中に記憶されたコンピュータープログラムおよび/またはデータ構造によっ
て選択的に稼働させられ、または再構成される汎用コンピューターであり得る。本開示に
よって提供されるプロセスは、任意の特定のコンピューターまたは他の具体的な装置に本
質的に関係しない。特に、様々な汎用マシンが、本明細書の教示に従って書かれたプログ
ラムを用いた使用を見出す。しかし、一部の実施形態では、特殊な装置が、要求される方
法のオペレーションを実施するために構築される。様々なこれらのマシンについての特定
の構造の一実施形態を以下に記載する。
さらに、本開示のある特定の実施形態は、様々なコンピューター実装されたオペレーシ
ョンを実施するためのプログラム命令および/またはデータ(データ構造を含む)を含む
コンピューター読み取り可能な媒体またはコンピュータープログラム製品に関する。コン
ピューター読み取り可能な媒体の例としては、それだけに限らないが、ハードディスクな
どの磁気媒体;CD−ROMデバイスおよびホログラフィックデバイスなどの光媒体;光
磁気媒体;ならびにフラッシュメモリーなどの半導体メモリーデバイスがある。ハードウ
ェアデバイス、例えば、リードオンリーメモリーデバイス(ROM)およびランダムアク
セスメモリデバイス(RAM)などが、プログラム命令を記憶するために構成され得る。
ハードウェアデバイス、例えば、特定用途向け集積回路(ASIC)およびプログラマブ
ルロジックデバイス(PLD)などが、プログラム命令を実行し、記憶するために構成さ
れ得る。本開示がコンピューター実装されたオペレーションを実施するための命令および
/またはデータを含むどんな特定のコンピューター読み取り可能な媒体またはどんな他の
コンピュータープログラム製品にも限定されることは意図されていない。
プログラム命令の例としては、それだけに限らないが、コンパイラーによって生成され
るものなどの低レベルコード、およびインタープリターを使用してコンピューターによっ
て実行され得るより高いレベルのコードを含むファイルがある。さらに、プログラム命令
としては、それだけに限らないが、マシンコード、ソースコード、および本開示に従って
計算機のオペレーションを直接または間接的に制御する任意の他のコードが含まれる。コ
ードは、入力、出力、算出、条件文、ブランチ、反復ループなどを指定し得る。
1つの例示的な例において、本明細書で開示された方法を具体化するコードは、適切に
設計されたコンピューティングデバイスにロードされた場合に、デバイスに、1つまたは
複数のリガンドと相互作用する1つまたは複数の生体分子バリアントの仮想スクリーニン
グを実施させる論理命令および/またはデータを含有する固定媒体または伝達可能なプロ
グラム要素で具体化される。図4は、媒体817、ネットワークポート819、ユーザー
入力キーボード809、ユーザー入力811、または他の入力手段からの命令を読むこと
ができる論理装置である例示的なデジタルデバイス800を示す。その後、装置800は
、それらの命令を使用して、例えば、リガンド部分と活性部位、コファクターなどの1つ
または複数の特徴との幾何学的関係を評価するための(例えば、活性部位中の天然基質の
位置と、タンパク質バリアントの活性部位中の検討中の基質の位置との間の距離を決定す
るための)データ空間中での統計オペレーションを指示することができる。開示した実施
形態を具現化することができる一タイプの論理装置は、CPU 807、任意選択のユー
ザー入力デバイスキーボード809、およびGUIポインティングデバイス811、なら
びに周辺コンポーネント、例えば、ディスクドライブ815およびモニター805(これ
は、GO改変された文字列をディスプレイし、ユーザーによるこのような文字列のサブセ
ットの簡易化された選択をもたらす)などを含むコンピューターシステム800のような
コンピューターシステムである。固定媒体817が、総合システムをプログラムするため
に任意選択で使用され、これらとして、例えば、ディスクタイプ光媒体もしくは磁気媒体
、または他の電子メモリー記憶素子を挙げることができる。通信ポート819をシステム
をプログラムするために使用することができ、これは、任意のタイプの通信接続を表すこ
とができる。
ある特定の実施形態は、特定用途向け集積回路(ASIC)またはプログラマブルロジ
ックデバイス(PLD)の電気回路内でも具現化することができる。このような場合では
、実施形態は、ASICまたはPLDを作製するために使用することができるコンピュー
ター読み取り可能な記述言語で実装される。本開示の一部の実施形態は、様々な他のデジ
タル装置、例えば、PDA、ラップトップコンピューターシステム、ディスプレイ、画像
編集設備などの電気回路または論理プロセッサー内で実装される。
一部の実施形態では、本開示は、コンピューターシステムの1つまたはそれより多くの
プロセッサーによって実行されると、コンピューターシステムにタンパク質バリアントの
仮想スクリーニングおよび/または所望の活性を有するタンパク質のin silico
指向進化のための方法を実装させるコンピューター実行可能命令を記憶した1つまたはそ
れより多くのコンピューター読み取り可能な記憶媒体を含むコンピュータープログラム製
品に関する。このような方法は、図および疑似コードによって包含されるものなどの本明
細書に記載の任意の方法であり得る。一部の実施形態では、例えば、本方法は、複数の酵
素に関する配列データを受け取り、生体分子の3次元ホモロジーモデルを生成し、酵素の
ホモロジーモデルを基質の1つまたは複数の計算上の表示とドッキングし、所望の触媒活
性および選択性を有する酵素を選択する。一部の実施形態では、本方法は、スクリーニン
グプロセスによって高くランク付けされたバリアントからバリアントライブラリーをさら
に開発することができる。バリアントライブラリーは、繰り返しの指向進化およびスクリ
ーニングで使用することができ、これは所望の有益な性質を有する酵素をもたらすことが
できる。
一部の実施形態では、酵素のホモロジーモデルの基質の1つまたはそれより多くの計算
上の表示とのドッキングは、本明細書に記載の様式でリガンドの計算上の表示および複数
のバリアントの活性部位の計算上の表示を使用するコンピューターシステム上のドッキン
グプログラムによって行われる。様々な実施形態では、ドッキングを決定するための方法
は、基質および酵素のポーズ間の結合エネルギーを評価することを含む。リガンドとうま
くドッキングするタンパク質バリアントについて、仮想タンパク質スクリーニングシステ
ムは、検討中のタンパク質バリアントの活性部位におけるリガンドの計算上の表示の複数
のポーズを検討して、存在する場合、複数のポーズのどれが活性であるかを決定する。様
々な実施形態では、活性ポーズを決定するための方法は、リガンド中の1つまたは複数の
原子と、タンパク質および/またはそのタンパク質に会合するコファクター中の1つまた
は複数の原子との相対的な位置の範囲を規定する地理的な制約を評価することを含む。
(VIII.ウェブサイトおよびクラウドコンピューティングにおける実施形態)
インターネットは、通信リンクによって相互接続されたコンピューター、情報家電、お
よびコンピューターネットワークを含む。相互接続したコンピューターは、様々なサービ
ス、例えば、電子メール、ftp、ワールドワイドウェブ(「WWW」)、およびセキュ
アなサービスを含めた他のサービスなどを使用して情報を交換する。WWWサービスは、
サーバーコンピューターシステム(例えば、Webサーバーまたはウェブサイト)が情報
のウェブページを遠隔のクライアントの情報家電またはコンピューターシステムに送るこ
とを可能にするものとして理解することができる。そのとき遠隔のクライアントコンピュ
ーターシステムは、ウェブページをディスプレイすることができる。一般に、WWWの各
リソース(例えば、コンピューターまたはウェブページ)は、ユニフォームリソースロケ
ーター(「URL」)によってユニークに識別可能である。具体的なウェブページを閲覧
し、またはそれと相互作用するために、クライアントコンピューターシステムは、リクエ
ストでそのウェブページのURLを指定する。リクエストは、そのウェブページをサポー
トするサーバーに転送される。サーバーがリクエストを受け取ると、これは、そのウェブ
ページをクライアント情報システムに送る。クライアントコンピューターシステムがその
ウェブページを受け取ると、これは、ブラウザを使用してウェブページをディスプレイす
ることができ、またはウェブページまたは別段に提供されるインターフェースと相互作用
することができる。ブラウザは、ウェブページをリクエストすること、およびウェブペー
ジをディスプレイすることまたはそれと相互作用することを行う論理モジュールである。
現在、表示可能なウェブページは、典型的にはハイパーテキストマークアップ言語(「
HTML」)を使用して定義される。HTMLは、ウェブページがどのようにディスプレ
イされるべきかを定義するタグの標準セットを提供する。HTMLドキュメントは、テキ
スト、グラフィックス、コントロール、および他の特徴をディスプレイすることを制御す
る様々なタグを含む。HTMLドキュメントは、そのサーバーコンピューターシステムま
たは他のサーバーコンピューターシステム上で利用可能な他のウェブページのURLを含
み得る。URLは、必ずしもユーザーに情報をディスプレイすることなく、遠隔情報家電
またはサーバーと通信するために情報家電が使用するCGIスクリプトまたは実行可能な
インターフェースのようなものなどを含めた他のタイプのインターフェースを示すことも
できる。
インターネットは特に、1人または複数の遠隔の顧客に情報サービスを提供する助けに
なる。サービスは、インターネットによって購入者に電子的に送達されるアイテム(例え
ば、音楽または株価)を含むことができる。サービスは、慣例的な流通チャネル(例えば
、一般的なキャリア)によって送達され得るアイテム(例えば、食料品、書籍、または化
学的もしくは生物学的化合物など)の注文のハンドリングも含むことができる。サービス
は、購入者が後の時間にアクセスする航空会社または劇場の予約などのアイテムの注文の
ハンドリングも含み得る。サーバーコンピューターシステムは、利用可能であるアイテム
またはサービスを列挙するインターフェースの電子版を提供し得る。ユーザーまたは潜在
的な購入者は、ブラウザを使用してインターフェースにアクセスし、目的の様々なアイテ
ムを選択し得る。ユーザーが所望のアイテムの選択を完了したとき、次いでサーバーコン
ピューターシステムは、サービスを完了するために必要な情報をユーザーに促す場合があ
る。このトランザクション固有の注文情報は、購入者の名称もしくは他の識別、支払いの
識別(企業の発注番号もしくはアカウント番号など)、または飛行情報などのサービスを
完了するために必要な追加の情報を含み得る。
特に目的のサービスの中でも、インターネットおよび他のネットワークによって提供
されることができるものは、生物学的データおよび生物学的データベースである。このよ
うなサービスには、国立衛生研究所(NIH)の国立バイオテクノロジー情報センター(
NCBI)によって提供される様々なサービスが含まれる。NCBIは、分子生物学、生
化学、および遺伝学についての知識を記憶および分析するための自動システムを作製し;
研究団体および医学界によるこのようなデータベースおよびソフトウェアの使用を促進し
;全国的および国際的の両方でバイオテクノロジー情報を集める取り組みを調整し;生物
学的に重要な分子の構造および機能を分析するためのコンピューターベース情報処理の高
度な方法の研究を実施することを担当している。
NCBIは、GenBank(登録商標)DNA配列データベースの責任を負っている
。このデータベースは、個々の研究所、ならびに国際的なヌクレオチド配列データベース
、ヨーロッパ分子生物学研究所(EMBL)、および日本のDNAデータベース(DDB
J)とのデータ交換によって提出された配列から構築されており、米国特許商標庁に提出
される特許配列データを含む。GenBank(登録商標)に加えて、NCBIは、医学
界および科学界のために様々なデータベースをサポートおよび配信する。これらとしては
、オンライン版ヒトメンデル遺伝(OMIM)、3Dタンパク質構造の分子モデリングデ
ータベース(MMDB)、ユニークヒト遺伝子配列コレクション(Unique Hum
an Gene Sequence Collection)(UniGene)、ヒト
ゲノムの遺伝子地図、分類学ブラウザ、および国立がん研究所と共同したがんゲノム解剖
学プロジェクト(Cancer Genome Anatomy Project)(C
GAP)がある。Entrezは、ユーザーに配列、マッピング、分類学、および構造デ
ータへの統合アクセスを提供するNCBIのサーチ(search)および検索(ret
rieval)システムである。Entrezは、配列および染色体マップのグラフィカ
ルビューも提供する。Entrezの特徴は、関連した配列、構造、および参考文献を検
索する能力である。本明細書に記載のBLASTは、全DNAデータベースに対して配列
サーチを実行することができる、遺伝子および遺伝子の特徴を識別するためにNCBIで
開発された配列類似性サーチのためのプログラムである。NCBIによって提供されてい
る追加のソフトウェアツールとしては、オープンリーディングフレームファインダー(O
RF Finder)、電子PCR、ならびに配列提出ツール(sequence su
bmission tool)であるSequinおよびBankItがある。NCBI
の様々なデータベースおよびソフトウェアツールが、WWWから、FTPによって、また
はe−mailサーバーによって利用可能である。さらなる情報は、www|.|ncb
i.nlm.nih.govで利用可能である。
インターネットによって利用可能な一部の生物学的データは、特別なブラウザ「プラグ
イン」または他の実行可能なコードで一般に閲覧されるデータである。このようなシステ
ムの一例は、CHIME、生物学的な分子構造を含めた分子構造の相互作用的仮想3次元
ディスプレイを可能にするブラウザのプラグインである。CHIMEに関するさらなる情
報は、www|.|mdlchime.com/chime/で利用可能である。
様々な会社および施設が生体化合物を注文するためのオンラインシステムを提供してい
る。このようなシステムの例は、www|.|genosys.com/ oligo_
custinfo.cfmまたはwww|.|genomictechnologies
.com/Qbrowser2_FP.htmlで見つけることができる。典型的には、
これらのシステムは、所望の生体化合物(オリゴヌクレオチド、DNA鎖、RNA鎖、ア
ミノ酸配列など)のいくつかの記述子を受け入れ、次いでリクエストされた化合物が製造
され、溶液または他の適切な形態で顧客に発送される。
本明細書に提供される方法は、以下でさらに記載されるようにウェブサイト上で実装さ
れ得るので、本開示の一部の実施形態によって生成されるポリペプチドまたはポリヌクレ
オチドを伴う計算結果または物理的結果は、上述した生物情報および化合物と同様の様式
でインターネットを通じて提供され得る。
さらに例示するために、本発明の方法を、ローカライズまたは分散コンピューティング
環境で実装することができる。分散環境では、本方法は、複数のプロセッサーを含む単一
のコンピューターまたは多数のコンピューターで実装され得る。コンピューターを例えば
、共通のバスを通じてリンクすることができるが、より好ましくはコンピューター(複数
可)は、ネットワーク上のノードである。ネットワークは、汎用または専用のローカルま
たはワイドエリアネットワークとすることができ、ある特定の好適な実施形態では、コン
ピューターは、イントラネットまたはインターネットのコンポーネントであり得る。
インターネットの一実施形態では、クライアントシステムは、典型的にはウェブブラウ
ザを実行し、Webサーバーを実行するサーバーコンピューターにカップリングされてい
る。ウェブブラウザは、典型的には、IBMのWeb Explorer、Micros
oftのインターネットエクスプローラー、NetScape、Opera、またはMo
saicなどのプログラムである。Webサーバーは、典型的には、しかし必ずしもでは
ないが、IBMのHTTP Daemonまたは他のwww daemon(例えば、プ
ログラムのLINUX(登録商標)ベース形式)などのプログラムである。クライアント
コンピューターは、ラインによって、またはワイヤレスシステムを介してサーバーコンピ
ューターと双方向でカップリングされている。次に、サーバーコンピューターは、ウェブ
サイト(ウェブサイトをホストしているサーバー)と双方向でカップリングされており、
本発明の方法を実装するソフトウェアへのアクセスをもたらしている。
述べたように、イントラネットまたはインターネットに接続されているクライアントの
ユーザーは、クライアントに、本発明の方法の実装を提供するアプリケーション(複数可
)をホストしているウェブサイト(複数可)の一部であるリソースをリクエストさせ得る
。次いでサーバープログラム(複数可)は、リクエストを処理して指定されたリソースを
返す(これらが現在利用可能であると仮定して)。標準的な命名規則(すなわち、ユニフ
ォームリソースロケーター(「URL」))は、ハイパーテキスト転送プロトコル(「h
ttp」)、ファイル転送プロトコル(「ftp」)、ゴーファー、および広域情報サー
ビス(「WAIS」)などのサブクラスを現在含む、いくつかのタイプのロケーション名
を包含する。リソースがダウンロードされるとき、それは、追加のリソースのURLを含
み得る。したがって、クライアントのユーザーは、彼または彼女が具体的にはリクエスト
していなかった新しいリソースの存在を容易に学習することができる。
本発明の方法(複数可)を実装するソフトウェアは、真のクライアント−サーバーアー
キテクチャ内でウェブサイトをホストするサーバー上で局所的に稼働することができる。
したがって、クライアントコンピューターは、リクエストをホストサーバーに知らせ、こ
れは、リクエストされた処理(複数可)を局所的に稼働させ、次いでクライアントに結果
をダウンロードする。代わりに、本発明の方法を、本方法(複数可)のコンポーネントが
クライアントによって局所的に実施される「マルチティア」フォーマットで実装すること
ができる。これは、クライアントによるリクエストに対してサーバーからダウンロードさ
れたソフトウェア(例えば、Java(登録商標)アプリケーション)によって実装する
ことができ、またはこれは、クライアント上に「永続的に」インストールされたソフトウ
ェアによって実装することができる。
一実施形態では、本発明の方法を実装するアプリケーション(複数可)は、フレームに
分配される。このパラダイムでは、特徴または機能性のコレクションほどではなく、代わ
りに別々のフレームまたはビューのコレクションとしてアプリケーションを見ることが有
用である。例えば、典型的なアプリケーションは一般に、一組のメニューアイテムを含み
、その各々は、特定のフレーム、すなわち、アプリケーションのある特定の機能性を顕在
化する形式を呼び起こす。この観点で、アプリケーションは、コードのモノリシック体と
してではなく、アプレットのコレクションまたは機能性の束として見られる。ブラウザ内
からこのようにして、ユーザーは、ウェブページリンクを選択し、これはひいては、アプ
リケーションの特定のフレーム(すなわち、サブアプリケーション)を呼び起こす。した
がって、例えば、1つまたはそれより多くのフレームは、生物学的分子(複数可)を1つ
またはそれより多くのデータ空間に入力および/またはエンコードするための機能性を提
供し得る一方、別のフレームは、データ空間のモデルを洗練するためのツールを提供する
ある特定の実施形態では、本発明の方法は、例えば、以下の機能性(複数可)を提供す
る1つまたは複数のフレームとして実装される:2つまたはそれより多くの生物学的分子
を文字列にエンコードして2つまたはそれより多くの異なる最初の文字列のコレクション
をもたらす機能(複数可)であって、前記生物学的分子の各々は、サブユニットの選択さ
れたセットを含む、機能;文字列から少なくとの2つの部分文字列を選択する機能;部分
文字列を繋ぎ合わせて、最初の文字列の1つまたはそれより多くとほぼ同じ長さの1つま
たはそれより多くの生成文字列を形成する機能;文字列のコレクションに生成文字列を付
加(配置)する機能;酵素および基質の計算上の表示/モデルを作製およびマニピュレー
トする機能、基質(例えば、リガンド)の計算上の表示を酵素(例えば、タンパク質)の
計算上の表示とドッキングする機能;分子モデルに分子動力学を適用する機能;分子を伴
う化学反応に影響する分子同士間の様々な制約(例えば、基質部分と酵素活性部位との間
の距離または角度)を算出する機能;および本明細書に示した任意の特徴を実施する機能
これらの機能性の1つまたはそれより多くも、もっぱらサーバー上またはクライアント
コンピューター上で実装され得る。これらの機能、例えば、生物学的分子のコンピュータ
ーモデルを作製またはマニピュレートするための機能は、ユーザーが生物学的分子の表示
(複数可)を挿入またはマニピュレートすることができる1つまたはそれより多くのウィ
ンドウを提供することができる。さらに、諸機能はまた任意選択で、ローカルネットワー
クおよび/またはイントラネットによってアクセス可能な私的なおよび/または公共のデ
ータベースへのアクセスを提供し、それによってデータベース中に含まれる1つまたはそ
れより多くの配列を本発明の方法に入力することができる。したがって、例えば、一実施
形態では、ユーザーは任意選択で、GenBank(登録商標)のサーチをリクエストし
、このようなサーチによって返された配列の1つまたはそれより多くをエンコーディング
および/または多様性生成機能に入力する能力を有することができる。
コンピューターおよび/またはデータアクセス処理のイントラネットおよび/またはイ
ントラネット実施形態を実装する方法は、当業者に周知であり、非常に詳細に文書提供さ
れている(例えば、Cluerら(1992年)、「A General Framew
ork for the Optimization of Object−Orien
ted Queries」、Proc SIGMOD International C
onference on Management of Data、San Dieg
o、California、1992年6月2〜5日、SIGMOD Record、2
1巻、2号、1992年6月;Stonebraker,M.編;ACM Press、
383〜392頁;ISO−ANSI、作業草案、「Information Tech
nology−Database Language SQL」、Jim Melton
編、International Organization for Standar
dization and American National Standards
Institute、1992年7月;Microsoft Corporation
、「ODBC 2.0 Programmer’s Reference and SD
K Guide.The Microsoft Open Database Stan
dard for Microsoft Windows(登録商標).TM and
Windows(登録商標) NTTM,Microsoft Open Databa
se Connectivity.TM.Software Development
Kit」、1992年、1993年、1994年、Microsoft Press、3
〜30頁および41〜56頁;ISO作業草案、「Database Language
SQL−Part 2:Foundation (SQL/Foundation)」
、CD9075−2:199.chi.SQL、1997年9月11日などを参照)。ウ
ェブベースアプリケーションに関する追加の該当する詳細は、Selifonovおよび
Stemmerによる「METHODS OF POPULATING DATA ST
RUCTURES FOR USE IN EVOLUTIONARY SIMULAT
IONS」という表題のWO00/42559に見つかる。
一部の実施形態では、ポリヌクレオチドまたはポリペプチド配列を探索、スクリーニン
グ、および/または開発する方法は、コンピューターネットワークを介して分布した複数
のプロセシングユニットおよびメモリーを含むコンピューターシステム上のマルチユーザ
ーシステムとして実装することができ、ここでネットワークは、LAN上のイントラネッ
トおよび/またはインターネットを含み得る。一部の実施形態では、分散コンピューティ
ングアーキテクチャは、計算およびデータ記憶のためにコンピューターネットワークを介
して利用可能なコンピューターシステムのコレクションである「クラウド」を伴う。クラ
ウドを伴うコンピューター環境は、クラウドコンピューティング環境と呼ばれる。一部の
実施形態では、1人または複数のユーザーが、イントラネットおよび/またはインターネ
ットを介して分布したクラウドのコンピューターにアクセスすることができる。一部の実
施形態では、ユーザーは、上述したタンパク質バリアントをスクリーニングおよび/また
は開発する方法を実装するウェブクライアント、サーバーコンピューターによって遠隔で
アクセスし得る。
クラウドコンピューティング環境を伴う一部の実施形態では、仮想計算機(VM)がサ
ーバーコンピューター上にプロビジョニングされており、仮想計算機の結果をユーザーに
送り返すことができる。仮想計算機(VM)は、コンピューターのソフトウェアベースエ
ミュレーションである。仮想計算機は、仮定的コンピューターの仕様に基づき得るか、ま
たは実世界のコンピューターのコンピューターアーキテクチャおよび機能をエミュレート
し得る。VMの構造および機能は、当技術分野で周知である。典型的には、VMは、シス
テムハードウェアを含むホストプラットフォーム上にインストールされ、VM自体は、仮
想システムハードウェアおよびゲストソフトウェアを含む。
VMのホストシステムハードウェアは、1つまたはそれより多くの中央処理装置(CP
U)、メモリー、1つまたはそれより多くのハードディスク、および様々な他のデバイス
を含む。VMの仮想システムハードウェアは、1つまたはそれより多くの仮想CPU、仮
想メモリー、1つまたはそれより多くの仮想ハードディスク、および1つまたはそれより
多くの仮想デバイスを含む。VMのゲストソフトウェアは、ゲストシステムソフトウェア
およびゲストアプリケーションを含む。一部の実装では、ゲストシステムソフトウェアは
、仮想デバイスのドライバーを伴ったゲストオペレーティングシステムを含む。一部の実
装では、VMのゲストアプリケーションは、上述した仮想タンパク質スクリーニングシス
テムの少なくとも1つの事例を含む。
一部の実施形態では、プロビジョニングされるVMの数は、解かれるべき問題の計算負
荷に対して増減することができる。一部の実施形態では、ユーザーは、クラウドからの仮
想計算機、仮想スクリーニングシステムを含むVMをリクエストすることができる。一部
の実施形態では、クラウドコンピューティング環境は、ユーザーのリクエストに基づいて
VMをプロビジョニングすることができる。一部の実施形態では、VMは、イメージリポ
ジトリー中に記憶させることができる以前に記憶されたVMイメージで存在し得る。クラ
ウドコンピューティング環境は、イメージをサーチし、サーバーまたはユーザーシステム
に転送することができる。次いでクラウドコンピューティング環境は、サーバーまたはユ
ーザーシステム上でイメージを起動することができる。
IX.実施例
(実施例1)
以下の実施例は、酵素バリアントを仮想スクリーニングし、様々な実施形態を実施する
所望の触媒活性および選択性を有する酵素を開発するプロセスを例示する。
まとめると、プロセスは、実際の酵素のパネルの3次元ホモロジーモデルを生成し、酵
素パネルのメンバーを仮想スクリーニングして、(a)活性ポーズで基質とドッキングし
た、(b)プロ−Sコンホメーションでドッキングした、(c)活性ポーズで、かつプロ
−Sコンホメーションでドッキングしたもののなかでも最も低い全結合エネルギー(また
はドッキングスコア)を有した第1のバリアントを選択することを含んでいた。次いでプ
ロセスは、ラウンド1の骨格または親配列として第1のバリアントを使用して、仮想指向
進化のための仮想変異誘発技術を使用したラウンド1の仮想バリアントライブラリーを生
成した。次いで、プロセスは、ラウンド1の仮想バリアントライブラリーのメンバーのモ
デルを生成し、ラウンド1の仮想バリアントライブラリーをスクリーニングし、ラウンド
1の骨格を選択したときと類似した選択方法を使用してラウンド2の骨格として第2のバ
リアントを選択した。プロセスはまた、ラウンド1の仮想バリアントライブラリーから追
加のバリアントも選択した。追加のバリアントは、(a)活性ポーズで基質とドッキング
し、(b)活性ポーズでドッキングするもののなかでも低い全結合エネルギー(またはド
ッキングスコア)を有した。次いでプロセスは、ラウンド2の骨格を追加のバリアントと
組み換えて、ラウンド2のバリアントライブラリーに多様性を導入した。最終的に、プロ
セスは、バリアントをコンピューターによりモデリングし、スクリーニングし、選択して
、ラウンド1およびラウンド2の骨格と比較して改善された活性および選択性を有する仮
想酵素バリアントを得た。
より具体的には、本実施例のプロセスは、実際の酵素のパネルの194個のホモロジー
モデルを生成するステップによって開始した。これらの酵素は、所望の基質に構造的また
は機能的に関連する天然基質を触媒する。プロセスは、所望の基質をホモロジーモデルに
ドッキングし、実際の酵素パネルのメンバーを仮想スクリーニングして、(a)活性ポー
ズで所望の基質とドッキングし、(b)プロ−Sコンホメーションでドッキングした唯一
のバリアントを見出した。活性ポーズでの結合の成功は、リガンドが、触媒的変換を受け
るか、または結合部位との共有結合などのなんらかの所望の役割を果たす可能性が高いこ
とを示唆していた。所望の基質およびパネルのメンバーのドッキングを、上記で詳細に説
明されたドッキング方法によって実施した。所望の基質の機能的に関連する部分と天然基
質とを、ドッキング空間中の同じX、Y、Z座標にこの2つの基質を置くことによって比
較した。所望の基質のポーズが、活性であるか、プロ−Sであるか、またはプロ−Rであ
るかどうかを、所望の基質および天然基質の部分間の距離によって決定した。この実施例
について、距離の基準を1.25Åに設定した。基準値およびルール(距離の平均、最小
、最大などが基準より小さいことが求められる)は、異なる適用において、および指向進
化の様々なラウンドにおいて、調整が可能である。
このバリアントは、プロ−Sおよびプロ−Rコンホメーションの両方で基質と結合する
ことができることが見出された。バリアントはそれほど選択的ではない可能性があると考
えられた。所望の基質に関して活性でありS選択的な酵素を誘導するために、このバリア
ントをラウンド1の骨格として選択して、in silicoの指向進化の第1のラウン
ドにおける変異誘発によって、ラウンド1のバリアントライブラリーを生成した。このラ
ウンド1の骨格中の15個の活性部位の位置が識別され、各位置につきラウンド1の骨格
バリアントとは異なる19種の可能性のあるアミノ酸があり、合計で285種の異なる可
能性のある点変異があった。ラウンド1の進化において、ラウンド1のバリアントライブ
ラリーのために1000種の変異体が生成され、各変異体はランダムな数の変異を有し、
ここでこのランダムな数は、平均=4およびSD=2のガウス分布から選択された。28
5種の可能性のある点変異から、変異をランダムに選択した。
次いで、プロセスは、ポーズの活性および選択性を決定するための基準を、1.25Å
とは対照的により厳格な値である1Åに設定したことを除き、実際の酵素パネルに関して
上述した方法に類似したドッキングおよびスクリーニング方法を使用した。プロセスは、
活性でありプロ−Sのポーズで結合する全ての変異体のなかでも最も低い全結合エネルギ
ーを有する変異を含むものとして1つのバリアントを識別した。実際に、このバリアント
における変異は、望ましくないプロ−Rコンホメーションでの基質の結合を防ぎ、これは
、選択性に関して有益な変異を示していた。したがってプロセスは、このバリアントを、
ラウンド2の指向進化のための骨格として選択した。
しかしながら、0.38303kcal/molのラウンド2の骨格の結合エネルギー
は、ラウンド1の骨格に関して決定された結合エネルギー(−4.005kcal/mo
l)と比較しても比較的高く、これは、進化により酵素の有益な性質をさらに改善できる
ことを示唆していた。ラウンド2の指向進化を、ラウンド2の骨格に29種の変異を導入
することによってin silicoで実施した。ラウンド1の進化から得られた全ての
バリアントのなかでも最も低い結合エネルギーを有するラウンド1のライブラリーの29
種のバリアントから、29種の変異を誘導した。ラウンド2の進化において、1000種
の変異体を生成してラウンド2のバリアントライブラリーを生成し、各変異体は、ランダ
ムな数の変異を有し、ここでこのランダムな数は、平均=6およびSD=4のガウス分布
から選択された。29種のバリアントから誘導された29種の可能性のある変異から、変
異をランダムに選択した。
次いで、プロセスは、上述した方法に類似したドッキングおよびスクリーニング方法を
使用して、ほとんどのバリアントが所望のプロ−Sコンホメーションのみでの基質との結
合を選び、少なくとも10種のバリアントが、ラウンド1およびラウンド2の骨格より優
れた結合エネルギーを有することを決定した。ラウンド2の進化からの改善されたバリア
ントならびにラウンド1およびラウンド2の骨格の結合エネルギーに関しては、表1を参
照されたい。表1のデータを示すことに加えて、図5は、ラウンド2の進化からの10種
の改善されたバリアント、ならびにラウンド1およびラウンド2の骨格の選択性を示す。
この図は、酵素パネルの仮想スクリーニングは、最初に、低い結合エネルギーを有するが
S−選択的ではないラウンド1の骨格を識別したことを例示する。次いでプロセスは、i
n silicoの指向進化(変異誘発)を使用してS−選択性を改善し、ラウンド2の
骨格を得た。最終的にプロセスは、ラウンド2の進化において基質結合を組換えにより改
善し、所望の基質と高親和性を有しエナンチオ選択的な酵素バリアントを得た。
2ラウンドの進化でもたらされた多様性は、生物学的な遺伝子操作からアイデアを得た
変異誘発および組換えによって生成した。一部の用途において、仮想タンパク質スクリー
ニング方法は、指向進化方法をガイドする配列−活性モデルと組み合わせてもよい。米国
特許第7,783,428号に記載された方法にしたがう多重線形回帰技術を用いて配列
活性モデルを構築した。図6Aにおいて、配列活性モデルの予測された結合エネルギーは
、配列の試験セットに関して仮想スクリーニングシステムにより得られた観察されたエネ
ルギーに対してプロットされている。試験セットから除外された配列の検証セットを試験
することによって、配列活性モデルのクロスバリデーションを行った。このモデルは、試
験セットにおける分散の90.9%(R=0.909)を占める。図6Bにおけるクロ
スバリデーションのデータは、特定の位置に特定の変異を有する配列から結合エネルギー
を予測することにおいて配列活性モデルが正確であったことを示し、検証セットにおいて
分散の82.9%(R=0.829)を占める。
このモデルを使用して、変異誘発のためのアミノ酸を識別することができる。指向進化
をガイドするために配列活性モデルを使用する他の方式のなかでも、1つの方式は、タン
パク質活性への変異の寄与率を反映する特定の位置における特定の残基の特定の変異に関
する回帰係数に依存する。具体的には、指向進化のプロセスは、配列−活性モデルの項の
係数を評価して、仮想スクリーニングシステムによって計算された実質的な結合エネルギ
ーに寄与する1つまたは複数のアミノ酸を識別することによって変異のための位置を選択
することができた。例えば、この実施例において、変異1は大きい正の係数を有しており
、これは、変異1が大幅に活性を増加させることを示唆している。図6Cを参照。それと
は対照的に、変異27は大きい負の係数を有しており、これは、図6Cで測定されたよう
に、高い活性を得るためにこの変異は回避されるべきであることを示唆している。
(実施例2)
実施例2は、図7の上に示した反応のような、プロ−キラルケトンからのキラルアルコ
ールのR−鏡像異性体についてのケトレダクターゼバリアントの仮想スクリーニングの実
験的な検証を提供する。
プロセスは、ケトレダクターゼ酵素バリアントの2つの既存のパネル(各パネルにつき
96ウェルのフォーマット)の3次元ホモロジーモデルを生成し、ケトレダクターゼパネ
ルの192種のメンバーを仮想スクリーニングして、(a)活性ポーズで基質とドッキン
グし、(b)プロ−Rコンホメーションでドッキングし、(c)好ましいドッキングスコ
アを有するバリアントを選択することを含んでいた。
プロセスは、活性でありエネルギー的に好ましいポーズをもたらすことができる24種
のバリアントを識別したが、さらなる開発およびスクリーニングのためにこれに優先順位
を付けてもよい。仮想in silicoスクリーニング結果の有用性および妥当性を検
証するために、プロセスはさらに、標準的なプロトコルを用いて全ての192種のメンバ
ーに対してin vitroのスクリーニングも実施し、高速液体クロマトグラフィー(
HPLC)を用いて基質/生成物を検出した。
結果を図7に示し、ここでx軸は、(ピーク面積(R)−アルコール+ピーク面積(S
)−アルコール)÷(ピーク面積(R)−アルコール+ピーク面積(S)−アルコール
ピーク面積ケトン)×100%として計算された転換%であり、y軸は、(ピーク面積
R)−アルコール−ピーク面積(S)−アルコール)÷(ピーク面積(R)−アルコール
+ピーク面積(S)−アルコール)×100%として計算された所望のR生成物に対する
e.e.%(エナンチオ選択性の指標)である。仮想スクリーニングによって優先順位を
付けられた24種のバリアントを赤色の四角形として強調表示し、残りのバリアントを青
色のひし形としてハイライトした。結果から、1)仮想スクリーニングは、任意のin
vitroのスクリーニングの前に酵素バリアントのセットを用いて所望の転化が実現可
能であるかどうかの決定を助けることができること;2)このような小さくフレキシブル
な基質は通常、モデリングにとって難題であるとみなされているという事実にもかかわら
ず、相当量の予測されたバリアントが実際に高い活性(転化%)およびエナンチオ選択性
(e.e.%)をもたらしたことが示唆される。それゆえに仮想スクリーニングは、in
vitroのスクリーニングのために起こる可能性が極めて低い反応をフィルタリング
して除き、試験のためにより少ない試料を選択することができ(このケースでは192種
に対して24種)、それにより顕著な時間およびコストの節約をもたらすことができる。
(実施例3)
実施例3は、図8の上に示された反応のような立体選択的なC=OのCH−NHへの
還元に関するトランスアミナーゼの仮想指向進化の実験的な検証を提供する。
プロセスは、骨格の12個の活性部位の位置のin silicoの飽和変異誘発から
228種の仮想配列の3次元ホモロジーモデルを生成し(12個の位置×位置1個当たり
19種のAA=228種のバリアント、バリアント1種当たり1種の変異)、228種の
仮想バリアントを仮想スクリーニングして、(a)活性ポーズで基質とドッキングし、(
b)所望の立体選択性をもたらすコンホメーションでドッキングし、(c)活性ポーズで
かつ標的のコンホメーションでドッキングしたもののなかでも最も低い全結合エネルギー
を有するバリアントを選択することを含んだ。
次いでプロセスは、活性でありエネルギー的に好ましいポーズをもたらすことができる
12種のバリアントまたは12種の変異を識別した。12種の変異を使用してライブラリ
ーを合成し、これをin vitroでスクリーニングした。特許化されているプロトコ
ルを用いて360種のバリアント(バリアント1種当たり1種または1種より多くの変異
)に対してin vitroのスクリーニングを実施した。HPLCを用いて基質/生成
物を検出した。
図8にin vitroのスクリーニングからの最良のバリアントに関する結果を示し
、ここでx軸は、スクリーニングされた試料であり、y軸は、FIOPCであり、これは
、陽性対照に対する改善の倍率(Fold Improvement Over Pos
itive Control)と定義され、(転換バリアント%−転換陰性対照%)÷(
転換陽性対照%−転換陰性対照%)×100%として計算される。陽性対照は、仮想スク
リーニングおよびin vitroのスクリーニングの骨格であり、陰性対照は、酵素を
含まない空のベクターである。
in vitroのライブラリースクリーニングは、13%のFIOPC>1.5を有
するバリアントおよび5.3%のFIOPC>2を有するバリアントをもたらした。最上
位のヒットは、2.4のFIOPCを有した。それゆえに仮想スクリーニングは、in
vitroのスクリーニングにとって有害な変異をフィルタリングして除き、より標的化
されたライブラリーの設計を助けることができ、それにより顕著な時間およびコストの節
約をもたらすことができる。例えば、本発明者らがin vitroで飽和変異誘発ステ
ップを行わなければならない場合、少なくともさらなる800種のバリアントをスクリー
ニングする必要がある。
上記は、明確さおよび理解の目的で幾分詳細に記載されたが、形式および詳細の様々な
変更を本開示の真の射程から逸脱することなく行うことができることが、本開示を読むこ
とによって当業者に明らかとなるであろう。例えば、上述したすべての技法および装置は
、様々な組合せで使用され得る。本願で引用したすべての刊行物、特許、特許出願、また
は他の文書は、各個々の刊行物、特許、特許出願、または他の文献が、すべての目的に関
して参照により組み込まれるように個々に示されているのと同じ程度に、すべての目的に
関してその全体が参照により組み込まれている。

Claims (1)

  1. 本明細書に記載の発明。
JP2018237169A 2013-09-27 2018-12-19 酵素バリアントの自動スクリーニング Withdrawn JP2019083025A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021089944A JP2021131901A (ja) 2013-09-27 2021-05-28 酵素バリアントの自動スクリーニング

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361883838P 2013-09-27 2013-09-27
US61/883,838 2013-09-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016516874A Division JP6857029B2 (ja) 2013-09-27 2014-09-26 酵素バリアントの自動スクリーニング

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021089944A Division JP2021131901A (ja) 2013-09-27 2021-05-28 酵素バリアントの自動スクリーニング

Publications (1)

Publication Number Publication Date
JP2019083025A true JP2019083025A (ja) 2019-05-30

Family

ID=51662390

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2016516874A Active JP6857029B2 (ja) 2013-09-27 2014-09-26 酵素バリアントの自動スクリーニング
JP2018237169A Withdrawn JP2019083025A (ja) 2013-09-27 2018-12-19 酵素バリアントの自動スクリーニング
JP2021089944A Pending JP2021131901A (ja) 2013-09-27 2021-05-28 酵素バリアントの自動スクリーニング

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016516874A Active JP6857029B2 (ja) 2013-09-27 2014-09-26 酵素バリアントの自動スクリーニング

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021089944A Pending JP2021131901A (ja) 2013-09-27 2021-05-28 酵素バリアントの自動スクリーニング

Country Status (15)

Country Link
US (3) US10696964B2 (ja)
EP (2) EP3049973B1 (ja)
JP (3) JP6857029B2 (ja)
KR (1) KR102342205B1 (ja)
CN (1) CN105765592B (ja)
AU (1) AU2014324669B2 (ja)
BR (1) BR112016006285B1 (ja)
CA (1) CA2923755C (ja)
DK (2) DK3049973T3 (ja)
ES (2) ES2693150T3 (ja)
HU (2) HUE039618T2 (ja)
IL (1) IL244457B (ja)
RU (2) RU2016116253A (ja)
SG (1) SG11201601695WA (ja)
WO (1) WO2015048572A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3049973B1 (en) 2013-09-27 2018-08-08 Codexis, Inc. Automated screening of enzyme variants
NZ717647A (en) 2013-09-27 2020-06-26 Codexis Inc Structure based predictive modeling
JP6667447B2 (ja) * 2013-11-15 2020-03-18 ヒンジ セラピューティクス,インコーポレイテッド 治療設計のためのコンピュータ支援モデル化
SG11201703258PA (en) 2014-11-25 2017-05-30 Codexis Inc Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
WO2016105889A1 (en) 2014-12-22 2016-06-30 Codexis, Inc. Human alpha-galactosidase variants
US10542961B2 (en) 2015-06-15 2020-01-28 The Research Foundation For The State University Of New York System and method for infrasonic cardiac monitoring
WO2017155945A1 (en) * 2016-03-09 2017-09-14 President And Fellows Of Harvard College Methods and systems of cell-free enzyme discovery and optimization
AU2018217495B2 (en) 2017-02-13 2021-03-04 Codexis, Inc. Engineered phenylalanine ammonia lyase polypeptides
JP6917050B2 (ja) * 2017-03-06 2021-08-11 学校法人早稲田大学 最適特性を有する非天然型タンパク質の製造方法
CA3061133A1 (en) * 2017-04-27 2018-11-01 Codexis, Inc. Ketoreductase polypeptides and polynucleotides
SG11201909957TA (en) * 2017-05-08 2019-11-28 Codexis Inc Engineered ligase variants
EP3404567A1 (en) * 2017-05-19 2018-11-21 Fujitsu Limited A system and a method for discovery of predicted site-specific protein phosphorylation candidates
BR112019027179A2 (pt) * 2017-06-19 2020-06-30 Jungla Llc interpretação de variantes genéticas e genômicas por meio de uma estrutura de aprendizagem profunda de mutação computacional e experimental integrada
EP3645711A4 (en) 2017-06-30 2021-04-21 Codexis, Inc. T7 RNA POLYMERASE VARIANTS
CN111417724A (zh) 2017-06-30 2020-07-14 科德克希思公司 T7 rna聚合酶变体
EP3652328A1 (en) * 2017-07-14 2020-05-20 c-LEcta GmbH Ketoreductases
CN107832577B (zh) * 2017-10-30 2021-07-13 中国农业大学 一种筛选几丁质酶OfChtⅠ抑制剂的方法
CN107974484A (zh) * 2017-11-10 2018-05-01 嘉兴欣贝莱生物科技有限公司 根皮素生物合成过程中查尔酮合成酶建模方法
US12100485B2 (en) * 2018-03-05 2024-09-24 The Board Of Trustees Of The Leland Stanford Junior University Machine learning and molecular simulation based methods for enhancing binding and activity prediction
EP3613855A1 (en) * 2018-08-23 2020-02-26 Clariant Produkte (Deutschland) GmbH Method for the production of a nucleic acid library
CN112739712A (zh) 2018-09-11 2021-04-30 格罗宁根大学 具有可调孔径的生物纳米孔及其作为分析工具的用途
EP3640864A1 (en) * 2018-10-18 2020-04-22 Fujitsu Limited A computer-implemented method and apparatus for inferring a property of a biomedical entity
BR112021008186A2 (pt) 2018-10-29 2021-08-17 Codexis, Inc. dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase.
EP3893860A4 (en) 2018-12-14 2023-03-29 Codexis, Inc. ENGINEERED TYROSINE AMMONIA LYASE
AU2019403323A1 (en) 2018-12-20 2021-07-01 Codexis, Inc. Human alpha-galactosidase variants
CN109841263B (zh) * 2019-02-22 2023-08-15 成都分迪科技有限公司 蛋白降解药物分子库及其构建方法
JP7344509B2 (ja) * 2019-09-20 2023-09-14 公立大学法人 富山県立大学 光学活性フルオロアルコールおよび光学活性クロロフルオロアルコールの製造方法
US20230227797A1 (en) * 2019-10-28 2023-07-20 Asymchem Laboratories (Tianjin) Co., Ltd. Transaminase mutant and use thereof
US11970722B2 (en) 2019-12-20 2024-04-30 Codexis, Inc. Engineered acid alpha-glucosidase variants
CN111681703A (zh) * 2020-05-09 2020-09-18 北京纽伦智能科技有限公司 一种蛋白结构的对接方法及分布式蛋白结构对接系统
CN114822717A (zh) * 2021-01-28 2022-07-29 腾讯科技(深圳)有限公司 基于人工智能的药物分子处理方法、装置、设备及存储介质
WO2023022783A1 (en) * 2021-08-17 2023-02-23 University Of Southern California System and method for computational enzyme design based on maximum entropy
CN113921082B (zh) * 2021-10-27 2023-04-07 云舟生物科技(广州)股份有限公司 基因搜索权重调整方法、计算机存储介质及电子设备
CN117511725B (zh) * 2023-12-21 2024-09-20 北京康润诚业生物科技有限公司 一种酶分子定向进化生物信息分析装置及方法

Family Cites Families (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
JPH04179495A (ja) 1990-11-14 1992-06-26 M D Res Kk 融合蛋白質、およびペプチド又は蛋白質の製造方法
US5426039A (en) 1993-09-08 1995-06-20 Bio-Rad Laboratories, Inc. Direct molecular cloning of primer extended DNA containing an alkane diol
US6165793A (en) 1996-03-25 2000-12-26 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5928905A (en) 1995-04-18 1999-07-27 Glaxo Group Limited End-complementary polymerase reaction
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US20060257890A1 (en) 1996-05-20 2006-11-16 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6995017B1 (en) 1994-02-17 2006-02-07 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6309883B1 (en) 1994-02-17 2001-10-30 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6406855B1 (en) 1994-02-17 2002-06-18 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6506602B1 (en) 1996-03-25 2003-01-14 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US7148054B2 (en) 1997-01-17 2006-12-12 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
DK1717322T3 (da) 1997-01-17 2012-10-22 Codexis Mayflower Holdings Llc Udvikling af hele celler og organismer ved rekursiv sekvensrekombination
US5914245A (en) 1998-04-20 1999-06-22 Kairos Scientific Inc. Solid phase enzyme kinetics screening in microcolonies
US6365408B1 (en) 1998-06-19 2002-04-02 Maxygen, Inc. Methods of evolving a polynucleotides by mutagenesis and recombination
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6917882B2 (en) 1999-01-19 2005-07-12 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
WO2000042559A1 (en) 1999-01-18 2000-07-20 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
EP1062614A1 (en) 1999-01-19 2000-12-27 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US20070065838A1 (en) 1999-01-19 2007-03-22 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US7702464B1 (en) 2001-08-21 2010-04-20 Maxygen, Inc. Method and apparatus for codon determining
US6961664B2 (en) 1999-01-19 2005-11-01 Maxygen Methods of populating data structures for use in evolutionary simulations
US6365377B1 (en) 1999-03-05 2002-04-02 Maxygen, Inc. Recombination of insertion modified nucleic acids
US6969763B1 (en) * 1999-05-12 2005-11-29 Isis Pharmaceuticals, Inc. Molecular interaction sites of interleukin-2 RNA and methods of modulating the same
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
US6519065B1 (en) 1999-11-05 2003-02-11 Jds Fitel Inc. Chromatic dispersion compensation device
AU2001250955A1 (en) 2000-03-23 2001-10-03 California Institute Of Technology Method and apparatus for predicting ligand binding interactions
EP1272967A2 (en) 2000-03-30 2003-01-08 Maxygen, Inc. In silico cross-over site selection
US20020133297A1 (en) 2001-01-17 2002-09-19 Jinn-Moon Yang Ligand docking method using evolutionary algorithm
US7465567B2 (en) 2001-04-16 2008-12-16 California Institute Of Technology Peroxide-driven cytochrome P450 oxygenase variants
WO2003008563A2 (en) 2001-07-20 2003-01-30 California Institute Of Technology Improved cytochrome p450 oxygenases
DK1493027T3 (en) 2002-03-01 2014-11-17 Codexis Mayflower Holdings Llc Methods, systems and software for identifying functional biomolecules
US7747391B2 (en) 2002-03-01 2010-06-29 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
AU2003213846A1 (en) 2002-03-09 2003-09-29 Maxygen, Inc. Optimization of crossover points for directed evolution
US20060099667A1 (en) * 2002-10-28 2006-05-11 Francois Andre Method for performing restrained dynamics docking of one or multiple substrates on multi-specific enzymes
US20060121455A1 (en) 2003-04-14 2006-06-08 California Institute Of Technology COP protein design tool
CN1468959A (zh) * 2003-06-02 2004-01-21 复旦大学 非典型性肺炎冠状病毒蛋白质空间构象模型及其应用
US7524664B2 (en) 2003-06-17 2009-04-28 California Institute Of Technology Regio- and enantioselective alkane hydroxylation with modified cytochrome P450
US8005620B2 (en) 2003-08-01 2011-08-23 Dna Twopointo Inc. Systems and methods for biopolymer engineering
WO2005017116A2 (en) 2003-08-11 2005-02-24 California Institute Of Technology Thermostable peroxide-driven cytochrome p450 oxygenase variants and methods of use
JP2005309877A (ja) 2004-04-22 2005-11-04 National Institute Of Advanced Industrial & Technology 機能性生体分子の配列解析方法
US20060136139A1 (en) 2004-10-12 2006-06-22 Elcock Adrian H Rapid computational identification of targets
WO2006121455A1 (en) 2005-05-10 2006-11-16 The Salk Institute For Biological Studies Dynamic signal processing
CN101415415A (zh) 2006-01-23 2009-04-22 约瑟夫·P·埃里科 定向药物开发的方法和组合物
RU2008140858A (ru) 2006-03-15 2010-04-20 Ксир (Za) Способ скрининга соединений, обладающих активностью ингибитора глутамин синтетазы
US8685687B2 (en) 2006-07-05 2014-04-01 The Scripps Research Institute Chimeric zinc finger recombinases optimized for catalysis by directed evolution
US7814234B2 (en) 2006-10-30 2010-10-12 Microsoft Corporation Offline execution of web based applications
JP2010517574A (ja) 2007-02-08 2010-05-27 コデクシス, インコーポレイテッド ケトレダクターゼおよびその使用
WO2009008908A2 (en) 2007-02-12 2009-01-15 Codexis, Inc. Structure-activity relationships
US7977078B2 (en) 2007-08-24 2011-07-12 Codexis, Inc. Ketoreductase polypeptides for the production of (R)-3-hydroxythiolane
US8748143B2 (en) 2007-09-13 2014-06-10 Codexis, Inc. Ketoreductase polypeptides for the reduction of acetophenones
CN101889081B (zh) 2007-09-28 2014-06-18 科德克希思公司 酮还原酶多肽及其用途
JP5646328B2 (ja) 2007-10-01 2014-12-24 コデクシス, インコーポレイテッド アゼチジノンの生産のためのケトレダクターゼポリペプチド
JP2010539991A (ja) 2007-10-04 2010-12-24 ハルシオン モレキュラー 電子顕微鏡を用いた核酸ポリマーの配列決定
EP2216429A4 (en) 2007-11-12 2011-06-15 In Silico Sciences Inc SILICO SCREENING SYSTEM AND SILICO SCREENING METHOD
US8383346B2 (en) 2008-06-13 2013-02-26 Codexis, Inc. Combined automated parallel synthesis of polynucleotide variants
DK3023494T3 (en) 2008-06-13 2019-02-25 Codexis Inc PROCEDURE FOR SYNTHESIS OF POLYNUCLEOTIDE VARIETIES
US8178333B2 (en) 2008-06-24 2012-05-15 Codexis, Inc. Biocatalytic processes for the preparation of substantially stereomerically pure fused bicyclic proline compounds
AU2009273130B2 (en) 2008-07-25 2014-10-16 Glaxo Group Limited Novel compositions and methods
WO2010025238A2 (en) 2008-08-27 2010-03-04 Codexis, Inc. Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
US8247192B2 (en) 2008-11-10 2012-08-21 Codexis, Inc. Penicillin-G acylases
US8688427B2 (en) * 2008-11-19 2014-04-01 University Of Washington Enzyme catalysts for diels-alder reactions
EP2379713A4 (en) 2008-12-18 2013-07-10 Codexis Inc RECOMBINANT HALOHYDRIN DEHALOGENASE POLYPEPTIDES
EP2382308B1 (en) 2008-12-25 2015-03-04 Codexis, Inc. Enone reductases
SG172891A1 (en) 2009-01-08 2011-08-29 Codexis Inc Transaminase polypeptides
JP5707344B2 (ja) 2009-02-26 2015-04-30 コデクシス, インコーポレイテッド トランスアミナーゼ生体触媒
US8614081B2 (en) 2009-07-23 2013-12-24 Codexis, Inc. Nitrilase biocatalysts
SI2510089T1 (sl) 2009-12-08 2015-12-31 Codexis, Inc. Sinteza prazolnih spojin
CA2793596A1 (en) 2009-12-30 2011-07-07 Pioneer Hi-Bred International, Inc. Methods and compositions for targeted polynucleotide modification
EP2649187B1 (en) 2010-12-08 2017-11-22 Codexis, Inc. Biocatalysts and methods for the synthesis of armodafinil
CN102156823B (zh) * 2011-02-18 2015-04-22 复旦大学 一种靶向作用于蛋白激酶非活性构象的化合物筛选方法
NZ703347A (en) 2012-06-29 2016-05-27 Wisconsin Alumni Res Found Use of 2-methylene-19-nor-(20s)-1α,25-dihydroxyvitamin d3 to treat secondary hyperparathyroidism
US20140303952A1 (en) 2013-04-08 2014-10-09 City University Of Hong Kong Protein-ligand docking
CN103265635A (zh) * 2013-04-28 2013-08-28 中山大学附属第一医院 一种通用的靶向蛋白嵌合型分子化合物的构建方法
CN103324861B (zh) * 2013-07-10 2016-07-20 南京大学 基于分子动力学模拟的核受体介导内分泌干扰物质的虚拟筛选方法
NZ717647A (en) 2013-09-27 2020-06-26 Codexis Inc Structure based predictive modeling
EP3049973B1 (en) 2013-09-27 2018-08-08 Codexis, Inc. Automated screening of enzyme variants

Also Published As

Publication number Publication date
RU2019140645A (ru) 2020-01-27
DK3049973T3 (en) 2018-10-22
DK3418929T3 (da) 2021-02-01
CA2923755C (en) 2023-03-14
JP6857029B2 (ja) 2021-04-14
HUE053049T2 (hu) 2021-06-28
AU2014324669A1 (en) 2016-03-24
EP3049973B1 (en) 2018-08-08
RU2016116253A (ru) 2017-11-01
NZ717658A (en) 2020-11-27
IL244457A0 (en) 2016-04-21
KR20160057482A (ko) 2016-05-23
CN105765592B (zh) 2019-12-17
US20150133307A1 (en) 2015-05-14
JP2021131901A (ja) 2021-09-09
IL244457B (en) 2021-05-31
US11535845B2 (en) 2022-12-27
EP3418929A1 (en) 2018-12-26
JP2016537700A (ja) 2016-12-01
US20200277597A1 (en) 2020-09-03
EP3418929B1 (en) 2020-12-09
AU2014324669B2 (en) 2020-06-04
ES2693150T3 (es) 2018-12-07
CA2923755A1 (en) 2015-04-02
EP3049973A1 (en) 2016-08-03
KR102342205B1 (ko) 2021-12-21
CN105765592A (zh) 2016-07-13
US20230048421A1 (en) 2023-02-16
BR112016006285A2 (pt) 2017-08-01
BR112016006285B1 (pt) 2022-09-06
HUE039618T2 (hu) 2019-01-28
WO2015048572A1 (en) 2015-04-02
SG11201601695WA (en) 2016-04-28
ES2857711T3 (es) 2021-09-29
US10696964B2 (en) 2020-06-30

Similar Documents

Publication Publication Date Title
US11535845B2 (en) Automated screening of enzyme variants
US11342046B2 (en) Methods and systems for engineering biomolecules
KR20210005325A (ko) 상호작용 성분을 이용하여 생체분자를 확인하기 위한 방법, 시스템, 및 소프트웨어
Appel et al. uPIC–M: efficient and scalable preparation of clonal single mutant libraries for high-throughput protein biochemistry
NZ717658B2 (en) Automated screening of enzyme variants
Bozkurt et al. Accelerating enzyme discovery and engineering with high-throughput screening

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210528

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210528

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210607

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210608

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20210609