本明細書において提供される説明について、単数形の使用は、別段具体的に述べられない限り、複数形を含む(逆もまた同様である)。例えば、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈上明らかに別の意味を示さない限り、複数の指示物を含む。同様に、「含む(comprise)」、「含む(comprises)」、「含む(comprising)」、「含む(include)」、「含む(includes)」、および「含む(including)」は、交換可能であり、制限することを意図されない。
様々な実施形態の説明が、用語「含むこと(comprising)」を使用する場合、一部の具体的な場合では、実施形態は、その代わりに語句「から本質的になる」または「からなる」を使用して記載され得ることを当業者が理解することが、さらに理解されるべきである。
図面を含む前述の一般的な説明と以下の詳細な説明の両方は、例示的であり、単なる説明にすぎず、本発明を制限するものではない。さらに、本明細書において使用される節の表題は、構成目的のみのためであり、記載される主題を制限するものと解釈されるべきではない。
定義
本明細書において使用される場合、以下の用語は、以下の意味を有することが意図される。本発明に関して、本明細書における説明において使用される技術用語および科学用語は、別段具体的に定義されない限り、当業者により一般的に理解される意味を有する。したがって、以下の用語は、以下の意味を有することが意図される。加えて、本明細書において言及される、全ての特許および刊行物において開示される全ての配列を含む、かかる特許および刊行物は、参照により明白に組み込まれる。
別段示されない限り、本発明の実施は、分子生物学、発酵、微生物学、および関連する分野において一般的に使用される従来の技術を含み、これらは、当業者に公知である。本明細書において別段定義されない限り、本明細書において使用される全ての技術用語および科学用語は、本発明が属する技術分野における当業者により一般的に理解されるのと同じ意味を有する。本明細書において記載されるものと同様または同等な任意の方法および物質を、本発明の実施または試験において使用することができるが、好ましい方法および物質が記載される。実際に、本明細書において記載される特定の方法論、プロトコール、および試薬は、これらが使用される状況に応じて変動し得るので、本発明は、その特定の方法論、プロトコール、および試薬に限定されないことが、意図される。本明細書において提供される表題は、全体として本明細書を参照し得る、本発明の様々な態様または実施形態の制限ではない。したがって、以下で定義される用語は、全体として本明細書を参照してより完全に定義される。
それでもなお、本発明の理解を促進するために、多数の用語が以下で定義される。数値範囲は、範囲を定義する数を含む。したがって、本明細書において開示される各数値範囲は、かかるより広い数値範囲内にあるあらゆるより狭い数値範囲を、かかるより狭い数値範囲が、本明細書において全て明確に書かれているかのように包含することが意図される。本明細書において開示される最大(または最小)の各数値制限は、より小さい(またはより大きい)各数値制限を、かかるより小さい(またはより大きい)数値制限が、本明細書において明確に書かれているかのように、含むことも意図される。
本明細書において使用される場合、用語「含む(comprising)」およびその類似語は、包括的な意味(すなわち、用語「含む(including)」およびその対応する類似語の同等物)で使用される。
本明細書および添付の特許請求の範囲において使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈が別段明確に示さない限り、複数の指示物を含む。したがって、例えば、「宿主細胞(a host cell)」への言及は、複数のかかる宿主細胞を含む。
別段示されない限り、それぞれ、核酸は、左から右に5’から3’の向きで書かれ、アミノ酸配列は、左から右にアミノからカルボキシの向きで書かれる。
本明細書において使用される場合、用語「タンパク質」、「ポリペプチド」および「ペプチド」を本明細書において互換的に使用して、長さまたは翻訳後修飾(例えば、グリコシル化、リン酸化、脂質化、ミリスチル化(myristilation)、ユビキチン化など)に拘わらず、アミド結合により共有結合によって連結された少なくとも2つのアミノ酸のポリマーを示す。この定義内に、D-およびL-アミノ酸、ならびにD-およびL-アミノ酸の混合物が含まれる。
遺伝子でコードされるアミノ酸について使用される略語は、従来通りであり、以下の通りである。
3文字の略語が使用されるとき、具体的に先に「L」もしくは「D」がない限り、または略語が使用される文脈から明らかでない限り、アミノ酸は、α-炭素(Cα)についてLまたはD配置のいずれかであり得る。例えば、「Ala」は、α炭素についての配置を特定することなくアラニンを示す一方、「D-Ala」および「L-Ala」は、それぞれ、D-アラニンおよびL-アラニンを示す。1文字の略語が使用されるとき、大文字は、α-炭素についてL配置のアミノ酸を示し、小文字は、α-炭素についてD配置のアミノ酸を示す。例えば、「A」は、L-アラニンを示し、「a」は、D-アラニンを示す。ポリペプチド配列が、1文字もしくは3文字の略語(またはその混合)の連続として示されるとき、配列は、一般的な慣習に従いアミノ(N)からカルボキシ(C)の向きで示される。
本明細書において使用される場合、「親水性アミノ酸または残基」は、Eisenbergら(Eisenbergら、J. Mol. Biol., 179:125-142[1984])の正規化コンセンサス疎水性スケールに従い、ゼロ未満の疎水性を示す側鎖を有するアミノ酸または残基を指す。遺伝子でコードされる親水性アミノ酸は、L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)およびL-Arg(R)を含む。
本明細書において使用される場合、「酸性アミノ酸または残基」は、当該アミノ酸が、ペプチドまたはポリペプチドにおいて含まれるとき、約6未満のpK値を示す側鎖を有する親水性アミノ酸または残基を指す。酸性アミノ酸は、典型的には、水素イオンの喪失に起因して、生理学的pHにて負に荷電した側鎖を有する。遺伝子でコードされる酸性アミノ酸は、L-Glu(E)およびL-Asp(D)を含む。
本明細書において使用される場合、「塩基性アミノ酸または残基」は、当該アミノ酸が、ペプチドまたはポリペプチドにおいて含まれるとき、約6より大きいpK値を示す側鎖を有する親水性アミノ酸または残基を指す。塩基性アミノ酸は、典型的には、ヒドロニウムイオンとの会合に起因して、生理学的pHにて正に荷電した側鎖を有する。遺伝子でコードされる塩基性アミノ酸は、L-Arg(R)およびL-Lys(K)を含む。
本明細書において使用される場合、「極性アミノ酸または残基」は、生理学的pHにて荷電していないが、2つの原子により共同で共有される1対の電子が、原子の1つにより、より密接に保持される、少なくとも1つの結合を有する側鎖を有する親水性アミノ酸または残基を指す。遺伝子でコードされる極性アミノ酸は、L-Asn(N)、L-Gln(Q)、L-Ser(S)およびL-Thr(T)を含む。
本明細書において使用される場合、「疎水性アミノ酸または残基」は、Eisenbergら(Eisenbergら、J. Mol. Biol., 179:125-142[1984])の正規化コンセンサス疎水性スケールに従い、ゼロより大きい疎水性を示す側鎖を有するアミノ酸または残基を指す。遺伝子でコードされる疎水性アミノ酸は、L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)およびL-Tyr(Y)を含む。
本明細書において使用される場合、「芳香族アミノ酸または残基」は、少なくとも1つの芳香族環もしくはヘテロ芳香族環を含む側鎖を有する親水性または疎水性アミノ酸もしくは残基を指す。遺伝子でコードされる芳香族アミノ酸は、L-Phe(F)、L-Tyr(Y)およびL-Trp(W)を含む。この側鎖はヘテロ芳香族環を含むので、このヘテロ芳香族窒素原子L-His(H)のpKaのために、これは、時に、塩基性残基として、または芳香族残基として分類されるが、本明細書において、ヒスチジンは、親水性残基としてまたは「拘束された(constrained)残基」(以下を参照)として分類される。
本明細書において使用される場合、「拘束されたアミノ酸または残基」は、拘束された幾何学形状を有するアミノ酸または残基を指す。ここでは、拘束された残基は、L-Pro(P)およびL-His(H)を含む。ヒスチジンは、比較的小さいイミダゾール環を有するので、拘束された幾何学形状を有する。プロリンは、これもまた5員環を有するので、拘束された幾何学形状を有する。
本明細書において使用される場合、「非極性アミノ酸または残基」は、生理学的pHにて荷電していないが、2つの原子により共同で共有される1対の電子が、一般に、2つの原子のそれぞれにより均等に保持される結合を有する側鎖を有する疎水性アミノ酸または残基を指す(すなわち、側鎖は極性ではない)。遺伝子でコードされる非極性アミノ酸は、L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)およびL-Ala(A)を含む。
本明細書において使用される場合、「脂肪族アミノ酸または残基」は、脂肪族炭化水素側鎖を有する疎水性アミノ酸または残基を指す。遺伝子でコードされる脂肪族アミノ酸は、L-Ala(A)、L-Val(V)、L-Leu(L)およびL-Ile(I)を含む。システイン(または「L-Cys」または「[C]」)は、他のL-Cys(C)アミノ酸または他のスルファニルもしくはスルフヒドリル含有アミノ酸とジスルフィド架橋を形成し得るという点が独特であることに留意されたい。「システイン様残基」は、システインと、ジスルフィド架橋の形成のため利用可能であるスルフヒドリル部分を含有する他のアミノ酸とを含む。L-Cys(C)(および-SH含有側鎖を有する他のアミノ酸)が、還元した遊離の-SHまたは酸化ジスルフィド架橋結合した形態のいずれかのペプチドに存在する能力は、L-Cys(C)が、正味の疎水性または親水性特徴をペプチドに付与するかどうかに影響する。L-Cys(C)が、Eisenbergら(Eisenbergら、1984、上)の正規化コンセンサススケールに従い、0.29の疎水性を示す一方、本発明の目的のため、L-Cys(C)が、これ自体の固有の群に分類されることは理解されるべきである。
本明細書において使用される場合、「小さいアミノ酸または残基」は、計3個もしくはそれより少ない炭素および/またはヘテロ原子(α炭素および水素を除く)で構成される側鎖を有するアミノ酸または残基を指す。小さいアミノ酸または残基は、上の定義に従い、脂肪族、非極性、極性もしくは酸性の小さいアミノ酸または残基としてさらに分類されてもよい。遺伝子でコードされる小さいアミノ酸は、L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)およびL-Asp(D)を含む。
本明細書において使用される場合、「ヒドロキシル含有アミノ酸または残基」は、ヒドロキシル(-OH)部分を含有するアミノ酸を指す。遺伝子でコードされるヒドロキシル含有アミノ酸は、L-Ser(S) L-Thr(T)およびL-Tyr(Y)を含む。
本明細書において使用される場合、「アミノ酸の違い」および「残基の違い」は、参照配列における対応する位置のアミノ酸残基と比べて、ポリペプチド配列の位置のアミノ酸残基の違いを指す。アミノ酸の違いの位置は、一般に、本明細書において「Xn」(式中、nは、残基の違いが基づく参照配列における対応する位置を指す)と称する。例えば、「配列番号2と比較した位置X40における残基の違い」は、配列番号2の位置40に対応するポリペプチド位置におけるアミノ酸残基の違いを指す。したがって、配列番号2の参照ポリペプチドが、位置40にてヒスチジンを有するなら、「配列番号2と比較した位置X40における残基の違い」は、配列番号2の位置40に対応するポリペプチドの位置におけるヒスチジン以外の任意の残基のアミノ酸置換を指す。本明細書における大抵の場合は、位置における具体的なアミノ酸残基の違いは、「XnY」(式中、「Xn」は、上に記載された通り、対応する位置を特定し、「Y」は、操作されたポリペプチドにおいて見られるアミノ酸(すなわち、参照ポリペプチドにおけるものと異なる残基)の1文字識別子である)として示される。一部の場合では、本発明はまた、慣習的な表記法「AnB」(式中、Aは、参照配列における残基の1文字識別子であり、「n」は、参照配列における残基位置の数であり、Bは、操作されたポリペプチドの配列における残基置換の1文字識別子である)により示される具体的なアミノ酸の違いを提供する。一部の場合では、本発明のポリペプチドは、参照配列と比べて1つまたは複数のアミノ酸残基の違いを含むことができ、これは、残基の違いが、参照配列と比べて存在する具体的な位置のリストにより示される。一部の実施形態において、1つより多くのアミノ酸が、ポリペプチドの具体的な残基位置において使用され得る場合、使用され得る様々なアミノ酸残基は、「/」により分けられる(例えば、X192A/G)。複数の置換を有するバリアントが存在する一部の実施形態において、置換は、セミコロン(;)またはスラッシュ(/)のいずれかにより分けられる(例えば、Y17V;I259T;E347KまたはY17V/I259T/E347K)。
本発明は、保存的と非保存的アミノ酸置換のいずれか/もしくは両方を含む1つまたは複数のアミノ酸の違いを含む操作されたポリペプチド配列を含む。本発明の配列表において含まれる具体的な組換え炭酸脱水酵素ポリペプチドのアミノ酸配列は、開始メチオニン(M)残基(すなわち、Mは、残基位置1を表す)を含む。しかしながら、当業者は、この開始メチオニン残基を、宿主細胞におけるまたはin vitro翻訳系におけるような、生物学的プロセシング機構により除去して、開始メチオニン残基を欠いているが、その他の点で酵素の特性を保持している成熟タンパク質を生じ得ることを理解する。結果として、本明細書において使用される場合、用語「位置Xnにおける配列番号2と比べたアミノ酸残基の違い」は、出発メチオニンを欠くようプロセシングされた、参照配列における位置「Xn」または対応する位置(例えば、位置(X-1)n)を指してもよい。
本明細書において使用される場合、語句「保存的アミノ酸置換」は、類似の側鎖を有する残基の交換可能性を指し、したがって、典型的には、ポリペプチドにおけるアミノ酸が、同じまたは類似の定義されたクラスのアミノ酸内のアミノ酸で置換されることを含む。一例であり限定するものではないが、一部の実施形態において、脂肪族側鎖を有するアミノ酸は、別の脂肪族アミノ酸(例えば、アラニン、バリン、ロイシン、およびイソロイシン)で置換され;ヒドロキシル側鎖を有するアミノ酸は、ヒドロキシル側鎖を有する別のアミノ酸(例えば、セリンおよびスレオニン)で置換され;芳香族側鎖を有するアミノ酸は、芳香族側鎖を有する別のアミノ酸(例えば、フェニルアラニン、チロシン、トリプトファン、およびヒスチジン)で置換され;塩基性側鎖を有するアミノ酸は、塩基性側鎖を有する別のアミノ酸(例えば、リシンおよびアルギニン)で置換され;酸性側鎖を有するアミノ酸は、酸性側鎖を有する別のアミノ酸(例えば、アスパラギン酸またはグルタミン酸)で置換され;ならびに/または疎水性もしくは親水性アミノ酸は、それぞれ、別の疎水性または親水性アミノ酸で置き換えられる。例示的な保存的置換が、表1において提供される。
本明細書において使用される場合、語句「非保存的置換」は、ポリペプチドにおけるアミノ酸が、著しく異なる側鎖特性を有するアミノ酸で置換されることを指す。非保存的置換は、定義される群内ではなく群間のアミノ酸を使用し得、(a)置換のエリアにおけるペプチド骨格の構造(例えば、グリシンの代わりにプロリン)、(b)荷電もしくは疎水性、または(c)側鎖の嵩高さに影響する。例示および限定でない目的で、例示的な非保存的置換は、塩基性または脂肪族アミノ酸で置換された酸性アミノ酸;小さいアミノ酸で置換された芳香族アミノ酸;および疎水性アミノ酸で置換された親水性アミノ酸であり得る。
本明細書において使用される場合、「欠失」は、1つまたは複数のアミノ酸の参照ポリペプチドからの除去によるポリペプチドの修飾を指す。欠失は、酵素活性を保持し、および/または操作された酵素の改善された特性を保持しながら、1つもしくはそれより多いアミノ酸、2つもしくはそれより多いアミノ酸、5つもしくはそれより多いアミノ酸、10もしくはそれより多いアミノ酸、15もしくはそれより多いアミノ酸、または20もしくはそれより多いアミノ酸、ポリペプチドをなすアミノ酸の総数の最大10%、またはアミノ酸の総数の最大20%の除去を含み得る。欠失は、ポリペプチドの内部および/または末端部分に指示され得る。様々な実施形態において、欠失は、連続セグメントを含み得るか、または不連続であり得る。
本明細書において使用される場合、「挿入」は、参照ポリペプチドへの1つまたは複数のアミノ酸の付加によるポリペプチドの修飾を指す。一部の実施形態において、改善された操作されたトランスアミナーゼ酵素は、天然に存在するトランスアミナーゼポリペプチドへの1つまたは複数のアミノ酸の挿入および操作されたトランスアミナーゼポリペプチドへの1つまたは複数のアミノ酸の挿入を含む。挿入は、ポリペプチドの内部であるか、またはカルボキシもしくはアミノ末端に対して起こり得る。本明細書において使用される場合の挿入は、当技術分野において公知の融合タンパク質を含む。挿入は、天然に存在するポリペプチドにおけるアミノ酸の連続セグメントであってもよく、またはアミノ酸の1つもしくは複数によって分離したものであってもよい。
用語「アミノ酸置換セット」または「置換セット」は、参照配列と比較した、ポリペプチド配列におけるアミノ酸置換の群を指す。置換セットは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個、またはそれより多いアミノ酸置換を有し得る。一部の実施形態において、置換セットは、実施例において提供される表に列挙されるバリアントトランスアミナーゼのいずれかに存在するアミノ酸置換のセットを指す。用語「置換セット」はまた、参照配列と比較した、ポリヌクレオチド配列におけるヌクレオチド置換の群に関して使用される。
本明細書において使用される場合、「断片」は、アミノ末端および/またはカルボキシ末端の欠失を有するが、残りのアミノ酸配列は、配列における対応する位置と同一である、ポリペプチドを指す。断片は、典型的には、全長トランスアミナーゼポリペプチド、例えば、配列番号2のポリペプチドの約80%、約90%、約95%、約98%、または約99%を有し得る。一部の実施形態において、断片は、「生物学的に活性」である(すなわち、全長配列と同じ酵素活性を示す)。
本明細書において使用される場合、「単離されたポリペプチド」は、自然に付随する他の混入物(例えば、タンパク質、脂質、およびポリヌクレオチド)から実質的に分離されたポリペプチドを指す。用語は、それらの天然に存在する環境または発現系(例えば、宿主細胞もしくはin vitro合成)から取り出されているか、または精製されているポリペプチドを包含する。改善されたトランスアミナーゼ酵素は、細胞内に存在するか、細胞培地に存在するか、または溶解物もしくは単離された調製物のような、様々な形態で調製されてもよい。したがって、一部の実施形態において、本発明の操作されたトランスアミナーゼポリペプチドは、単離されたポリペプチドであり得る。
本明細書において使用される場合、「実質的に純粋なポリペプチド」は、当該ポリペプチド種が、優勢的に存在する種である(すなわち、モル濃度または重量基準で、組成物における任意の他の個々の高分子種より豊富である)組成物を指し、対象の種が、モルまたは重量%で、存在する高分子種の少なくとも約50パーセントを構成するとき、一般に、実質的に精製された組成物である。一般に、実質的に純粋な操作されたトランスアミナーゼポリペプチド組成物は、モルまたは重量%で、組成物に存在する全ての高分子種の約60%もしくはそれを超えるパーセンテージ、約70%もしくはそれを超えるパーセンテージ、約80%もしくはそれを超えるパーセンテージ、約90%もしくはそれを超えるパーセンテージ、約91%もしくはそれを超えるパーセンテージ、約92%もしくはそれを超えるパーセンテージ、約93%もしくはそれを超えるパーセンテージ、約94%もしくはそれを超えるパーセンテージ、約95%もしくはそれを超えるパーセンテージ、約96%もしくはそれを超えるパーセンテージ、約97%もしくはそれを超えるパーセンテージ、約98%もしくはそれを超えるパーセンテージ、または約99%を構成する。溶媒種、小分子(<500ダルトン)、および元素イオン種は、高分子種とみなされない。一部の実施形態において、単離された改善されたトランスアミナーゼポリペプチドは、実質的に純粋なポリペプチド組成物である。
本明細書において使用される場合、「実質的に純粋なポリヌクレオチド」は、当該ポリヌクレオチド種が、優勢的に存在する種である(すなわち、モル濃度または重量基準で、組成物における任意の他の個々の高分子種より豊富である)組成物を指し、対象の種が、モルまたは重量%で、存在する高分子種の少なくとも約50パーセントを構成するとき、一般に、実質的に精製された組成物である。一般に、実質的に純粋な操作されたトランスアミナーゼポリヌクレオチド組成物は、モルまたは重量%で、組成物に存在する全ての高分子種の約60%もしくはそれを超えるパーセンテージ、約70%もしくはそれを超えるパーセンテージ、約80%もしくはそれを超えるパーセンテージ、約90%もしくはそれを超えるパーセンテージ、約91%もしくはそれを超えるパーセンテージ、約92%もしくはそれを超えるパーセンテージ、約93%もしくはそれを超えるパーセンテージ、約94%もしくはそれを超えるパーセンテージ、約95%もしくはそれを超えるパーセンテージ、約96%もしくはそれを超えるパーセンテージ、約97%もしくはそれを超えるパーセンテージ、約98%もしくはそれを超えるパーセンテージ、または約99%を構成する。一部の実施形態において、単離された改善されたトランスアミナーゼポリペプチドは、実質的に純粋なポリヌクレオチド組成物である。
本明細書において使用される場合、「ポリヌクレオチド」および「核酸」は、共有結合によって互いに連結されている2つまたはそれより多いヌクレオシドを指す。ポリヌクレオチドは、リボヌクレオシド(すなわち、RNA)で全体が構成されていても、2’デオキシリボヌクレオチド(すなわち、DNA)で全体が構成されていてもよく、またはリボヌクレオシドと2’デオキシリボヌクレオシドの混合物で全体が構成されていてもよい。ヌクレオシドが、典型的には、標準的ホスホジエステル連結を介して互いに連結されるが、ポリヌクレオチドは、1つまたは複数の非標準的な連結を含んでもよい。ポリヌクレオチドは、1本鎖もしくは2本鎖であってもよいか、または1本鎖領域と2本鎖領域の両方を含んでもよい。さらに、ポリヌクレオチドは、典型的には、天然に存在するコード核酸塩基(すなわち、アデニン、グアニン、ウラシル、チミン、およびシトシン)からなるが、1つもしくは複数の修飾および/または合成核酸塩基(例えば、イノシン、キサンチン、ヒポキサンチンなど)を含んでもよい。好ましくは、かかる修飾または合成核酸塩基は、コード核酸塩基である。
遺伝子コードヌクレオシドのため使用される略語は、慣習的であり、次の:アデノシン(A);グアノシン(G);シチジン(C);チミジン(T);およびウリジン(U)である。具体的に描写されない限り、省略されたヌクレオチドは、リボヌクレオシドまたは2’-デオキシリボヌクレオシドのいずれかであってもよい。ヌクレオシドは、個々の基準でもしくは集合体の基準でリボヌクレオシドまたは2’-デオキシリボヌクレオシドのいずれかとして特定してもよい。核酸配列が、1文字の略語の連続として提示されるとき、配列は、一般的な慣習に従い5’から3’の向きで提示され、ホスフェートは示されない。
本明細書において使用される場合、「ハイブリダイゼーションストリンジェンシー」は、核酸のハイブリダイゼーションにおける、洗浄条件のような、ハイブリダイゼーション条件に関する。一般に、ハイブリダイゼーション反応は、より低いストリンジェンシーの条件下で行われ、続いて、変動するが、より高いストリンジェンシーの洗浄が行われる。用語「中程度にストリンジェントなハイブリダイゼーション」は、標的DNAが、標的ポリヌクレオチドに対して約90%より高い同一性で、標的DNAに対して約60%の同一性、好ましくは、約75%の同一性、約85%の同一性を有する相補核酸に結合するのを可能にする条件を指す。例示的な中程度にストリンジェントな条件は、50%ホルムアミド、5×デンハート(Denhart’s)液、5×SSPE、0.2%SDS中、42℃におけるハイブリダイゼーション、続いて、0.2×SSPE、0.2%SDS、42℃での洗浄と同等な条件である。「高ストリンジェンシーのハイブリダイゼーション」は、一般に、定義されたポリヌクレオチド配列について溶液条件下で決定された熱融解温度Tmから約10℃またはそれより低い条件を指す。一部の実施形態において、高ストリンジェンシーの条件は、0.018MのNaCl中、65℃にて安定なハイブリッドを形成する核酸配列だけのハイブリダイゼーションを可能にする条件を指す(すなわち、ハイブリッドが、0.018MのNaCl中、65℃にて安定でないなら、それは、本明細書において考えられる、高ストリンジェンシーの条件下で安定ではないことになる)。高ストリンジェンシーの条件は、例えば、50%ホルムアミド、5×デンハート液、5×SSPE、0.2%SDS中、42℃におけるのと同等な条件におけるハイブリダイゼーション、続いて、0.1×SSPE、および0.1%SDS、65℃での洗浄により提供され得る。別の高ストリンジェンシーの条件は、0.1%(w:v)SDSを含有する5×SSC中、65℃でのハイブリダイゼーションおよび0.1%SDSを含有する0.1×SSC中、65℃での洗浄と同等な条件におけるハイブリダイゼーションである。他の高ストリンジェンシーのハイブリダイゼーション条件、および中程度にストリンジェントな条件は、当業者に公知である。
本明細書において使用される場合、「コード配列」は、タンパク質のアミノ酸配列をコードする核酸(例えば、遺伝子)の部分を指す。
本明細書において使用される場合、「コドン最適化されている」は、コードされるタンパク質が、目的の生物において効率的に発現されるように、タンパク質をコードするポリヌクレオチドのコドンが特定の生物において優先的に使用されるコドンに変更されることを指す。一部の実施形態において、トランスアミナーゼ酵素をコードするポリヌクレオチドは、発現のため選択された宿主生物からの最適な生成についてコドン最適化されていてもよい。遺伝子コードは、大抵のアミノ酸が、「異名」または「同義」コドンと呼ばれる、いくつかのコドンにより表される点で縮重であるが、特定の生物によるコドン使用頻度は無作為ではなく、特定のコドントリプレットに偏ることは、周知である。このコドン使用頻度の偏りは、所定の遺伝子、共通の機能または先祖起源の遺伝子、低コピー数のタンパク質に対して高度に発現されたタンパク質、および生物のゲノムの凝集タンパク質コード領域に関してより大きくてもよい。一部の実施形態において、トランスアミナーゼ酵素をコードするポリヌクレオチドは、発現のため選択された宿主生物からの最適な生成についてコドン最適化されていてもよい。
本明細書において使用される場合、「好ましい最適な高コドン使用頻度バイアスコドン」は、同じアミノ酸をコードする他のコドンよりタンパク質コード領域においてより高い頻度で使用されるコドンを互換的に指す。好ましいコドンは、単一遺伝子、共通の機能もしくは起源の遺伝子のセット、高度に発現された遺伝子、全生物の凝集タンパク質コード領域のコドン頻度、関連する生物の凝集タンパク質コード領域のコドン頻度、またはこれらの組み合わせにおけるコドン使用頻度に関して決定されてもよい。頻度が遺伝子発現のレベルに伴い増大するコドンは、典型的には、発現に最適なコドンである。例えば、クラスター解析またはコレスポンデンス解析を使用した多変量解析を含む、特定の生物におけるコドン頻度(例えば、コドン使用頻度、相対的同義コドン使用頻度)およびコドン優先度(codon preference)、ならびに遺伝子において使用されるコドンの有効な数を決定する様々な方法が、公知である(例えば、GCG CodonPreference、Genetics Computer Group Wisconsin Package;CodonW、John Peden、University of Nottingham;McInerney、Bioinform., 14:372-73[1998];Stenicoら、Nucleic Acids Res., 222:437-46[1994];およびWright、Gene, 87:23-29[1990]を参照)。コドン使用頻度表について、拡大中の生物のリストが利用可能である(例えば、Wadaら、Nucleic Acids Res., 20:2111-2118[1992];Nakamuraら、Nucl. Acids Res., 28:292[2000];Duretら、上記;Henaut and Danchin, ”Escherichia coli and Salmonella”, Neidhardt, et al.,(eds.), ASM Press, Washington D.C.,[1996], p.2047-2066を参照。コドン使用頻度を得るためのデータ供給源は、タンパク質をコードする能力がある任意の利用可能なヌクレオチド配列を使用してもよい。これらのデータセットは、発現されたタンパク質(例えば、完全タンパク質コード配列-CDS)、発現配列タグ(EST)、またはゲノム配列の推定コード領域をコードすることが実際に公知の核酸配列を含む(例えば、Uberbacher, Meth. Enzymol., 266:259-281[1996];Tiwariら、Comput. Appl. Biosci., 13:263-270[1997]を参照)。
本明細書において使用される場合、「調節配列」は、本発明のポリヌクレオチドおよび/もしくはポリペプチドの発現に必須または有利である全ての成分を含むことが、本明細書において定義される。それぞれの調節配列は、目的のポリヌクレオチドにとって生来(native)のものまたは外来のものであってもよい。かかる調節配列は、これらに限定されないが、リーダー、ポリアデニル化配列、プロペプチド配列、プロモーター、シグナルペプチド配列、および転写ターミネーターを含む。
本明細書において使用される場合、「作動可能に連結されている」は、調節配列が、目的のポリヌクレオチドおよび/もしくはポリペプチドの発現を誘導するか、または制御するように、調節配列が、目的のポリヌクレオチドと関連する位置に適切に位置する(すなわち、機能的な関係で)構成として本明細書において定義される。
本明細書において使用される場合、「プロモーター配列」は、コード配列のような、目的のポリヌクレオチドの発現のための宿主細胞により認識される核酸配列を指す。調節配列は、適切なプロモーター配列を含んでもよい。プロモーター配列は、転写調節配列を含有し、目的のポリヌクレオチドの発現を媒介する。プロモーターは、変異体、切断、およびハイブリッドプロモーターを含む、選択した宿主において転写活性を示す任意の核酸配列であってもよく、宿主細胞にとって同種もしくは異種のいずれかの細胞外または細胞内ポリペプチドをコードする遺伝子から得られてもよい。
本明細書において使用される場合、「天然に存在する」および「野生型」は、天然でみられる形態を指す。例えば、天然に存在するまたは野生型ポリペプチドもしくはポリヌクレオチド配列は、ヒトの操作により意図的に修飾されていない、天然で供給源から単離され得る、生物に存在する配列である。
本明細書において使用される場合、(例えば、細胞、核酸、またはポリペプチド)に関して本発明において使用されるときの、「天然に存在しない」、「操作された」および「組換え」は、そうでなければ天然に存在しない様式で修飾されている、物質、または物質の天然もしくは生来の形態に対応する物質を指す。一部の実施形態において、物質は、天然に存在する物質と同一であるが、合成物質からおよび/もしくは組換え技術を使用した操作により、生成されるか、またはもたらされる。非限定的な例は、数ある中でも、細胞の生来の(非組換え)形態内で見られないか、またはそうでなければ異なるレベルで発現される生来の遺伝子を発現する遺伝子を発現する組換え細胞を含む。
本明細書において使用される場合、「配列同一性のパーセンテージ」、「パーセント同一性」および「パーセント同一である」は、ポリヌクレオチド配列またはポリペプチド配列間での比較を指し、2つの最適にアライメントさせた配列を比較ウィンドウにわたり比較することにより決定され、比較ウィンドウにおけるポリヌクレオチドまたはポリペプチド配列の部分は、2つの配列の最適なアライメントについて参照配列と比較して、付加または欠失(すなわち、ギャップ)を含んでもよい。パーセンテージは、両方の配列において同一の核酸塩基もしくはアミノ酸残基が存在するか、または核酸塩基もしくはアミノ酸残基がギャップありでアライメントする位置の数を決定して、一致した位置の数を得、一致した位置の数を比較ウィンドウにおける位置の総数で割り、結果に100を掛けて、配列同一性のパーセンテージを得ることにより、計算される。最適なアライメントおよびパーセント配列同一性の決定は、BLASTおよびBLAST2.0アルゴリズム(例えば、Altschulら、J. Mol. Biol., 215:403-410[1990];およびAltschulら、Nucl. Acids Res., 25:3389-3402[1977]を参照)を使用して行われる。BLAST解析を行うためのソフトウエアは、National Center for Biotechnology Informationのウェブサイトを通じて公的に入手可能である。
簡単に言うと、BLAST解析は、短いワードの長さWinをクエリー配列と同定することにより高いスコア配列対(HSP)をまず同定することを含み、これは、データベース配列において同じ長さのワードを用いてアライメントさせたとき、一部の正の値の閾値スコアTと一致するか、または満たすかのいずれかである。Tは、近隣ワードスコア閾値と称する(Altschulら、上記)。これらの最初の近隣ワードヒットは、それらを含有するより長いHSPを見出すための検索を始めるためのシードとして働く。次に、ワードヒットは、累積アライメントスコアが増大し得る限り、それぞれの配列に沿って両方の方向に延長する。累積スコアは、ヌクレオチド配列について、パラメーターM(1対の一致する残基についてのリワードスコア;常に>0)およびN(不一致の残基のペナルティースコア;常に<0)を使用して計算される。アミノ酸配列について、スコアリングマトリクスを使用して、累積スコアを計算する。それぞれの方向のワードヒットの延長は、累積アライメントスコアが、その最大の達成される値から量Xだけ低下したとき;累積スコアが、1つもしくは複数の負のスコアの残基アライメントの蓄積に起因して、ゼロもしくはそれより下になるとき;またはいずれかの配列の末端に達するとき、止まる。BLASTアルゴリズムパラメーターW、T、およびXは、アライメントの感度および速度を決定する。BLASTNプログラム(ヌクレオチド配列について)は、デフォルトとして、ワード長(W)11、期待値(E)10、M=5、N=-4、および両方の鎖の比較を使用する。アミノ酸配列について、BLASTPプログラムは、デフォルトとして、ワード長(W)3、期待値(E)10、およびBLOSUM62スコアリングマトリクスを使用する(例えば、Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA, 89:10915[1989]を参照)。
2つの配列についてのパーセント同一性の提供においてBLASTに類似して機能する多数の他のアルゴリズムが利用可能であり、当技術分野において公知である。比較のための配列の最適なアライメントは、当技術分野において公知の任意の適切な方法を使用して(例えば、Smith and Waterman, Adv. Appl. Math., 2:482[1981]の局所相同性アルゴリズムにより;Needleman and Wunsch, J. Mol. Biol., 48:443[1970]の相同性アライメントアルゴリズムにより;Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444[1988]の類似性についての検索方法により;および/もしくはこれらのアルゴリズムのコンピューター実装により[GCGウィスコンシンソフトウエアパッケージ]におけるGAP、BESTFIT、FASTA、およびTFASTA)、または当技術分野において一般的に公知の方法を使用した目視検査により、行うことができる。加えて、配列アライメントおよびパーセント配列同一性の決定は、提供されるデフォルトパラメーターを使用して、GCGウィスコンシンソフトウエアパッケージ(Accelrys、Madison WI)中のBESTFITまたはGAPプログラムを利用することができる。
本明細書において使用される場合、「実質的な同一性」は、少なくとも20の残基位置の比較ウィンドウにわたり、頻繁には少なくとも30~50の残基の比較ウィンドウにわたり参照配列と比較して、少なくとも80パーセントの配列同一性、少なくとも85パーセントの同一性および89~95パーセントの配列同一性、より通常には、少なくとも99パーセントの配列同一性を有するポリヌクレオチドまたはポリペプチド配列を指し、配列同一性のパーセンテージは、比較ウィンドウにわたり参照配列の計20パーセントもしくはそれより低い欠失または付加を含む配列に対して参照配列を比較することにより計算される。ポリペプチドに適用される具体的な実施形態において、用語「実質的な同一性」は、2つのポリペプチド配列が、例えば、デフォルトギャップウェイトを使用した、プログラムGAPまたはBESTFITにより、最適にアライメントさせたとき、少なくとも80パーセントの配列同一性、好ましくは、少なくとも89パーセントの配列同一性、少なくとも95パーセントの配列同一性またはそれより高い(例えば、99パーセント配列同一性)を共有することを意味する。一部の好ましい実施形態において、同一でない残基位置は、保存的アミノ酸置換により異なる。
本明細書において使用される場合、「参照配列」は、別の配列が比較される規定の配列を指す。参照配列は、より長い配列のサブセット、例えば、全長遺伝子またはポリペプチド配列のセグメントであってもよい。一般に、参照配列は、少なくとも20ヌクレオチドもしくはアミノ酸残基長、少なくとも25残基長、少なくとも50残基長、または核酸もしくはポリペプチドの全長である。2つのポリヌクレオチドまたはポリペプチドは、それぞれ(1)2つの配列間で類似である配列(すなわち、完全な配列の部分)を含んでもよく、(2)2つの配列間で異なる配列をさらに含んでもよく、2つの(もしくはそれより多い)ポリヌクレオチドまたはポリペプチド間の配列比較が、典型的には、配列類似性の局所領域を同定し、比較するための比較ウィンドウにわたり2つのポリヌクレオチドの配列を比較することにより行われる。用語「参照配列」は、野生型配列に制限されることは意図されず、操作されたまたは変更した配列を含むことができる。例えば、一部の実施形態において、「参照配列」は、既に操作されたまたは変更したアミノ酸配列であることができる。
本明細書において使用される場合、「比較ウィンドウ」は、少なくとも約20の連続ヌクレオチド位置またはアミノ酸残基の概念的なセグメントを指し、配列は、少なくとも20の連続ヌクレオチドまたはアミノ酸の参照配列に比較されてもよく、比較ウィンドウにおける配列の部分は、2つの配列の最適なアライメントのため参照配列(付加も欠失も含まない)に比較されると、20パーセントもしくはそれより低い付加または欠失(すなわち、ギャップ)を含んでもよい。比較ウィンドウは、20より長い連続残基であることができ、必要に応じて、30、40、50、100、またはそれより長いウィンドウを含む。
本明細書において使用される場合、「に対応する」、「に関して」および「と比べて」は、所定のアミノ酸またはポリヌクレオチド配列のナンバリングの文脈において、所定のアミノ酸またはポリヌクレオチド配列が、参照配列と比較されるとき、特定された参照配列の残基のナンバリングを指す。言い換えると、所定のポリマーの残基番号または残基位置は、所定のアミノ酸またはポリヌクレオチド配列内の残基の実際の数での位置ではなく参照配列に関して指定される。例えば、操作されたトランスアミナーゼのもののような、所定のアミノ酸配列は、2つの配列間の残基一致を最適化するためのギャップを導入することにより、参照配列に対してアライメントさせることができる。これらの場合において、ギャップが存在するが、所定のアミノ酸またはポリヌクレオチド配列における残基のナンバリングは、それがアライメントされている参照配列に関してなされる。本明細書において使用される場合、以下でさらに記載される「Xn」のような、残基位置に対する参照は、別段具体的に示されない限り、「に対応する残基」を指すものとして解釈されるべきである。したがって、例えば、「X94」は、ポリペプチド配列における位置94の任意のアミノ酸を指す。
本明細書において使用される場合、核酸またはポリペプチドに関して使用されるとき、用語「異種」は、生物(例えば、野生型生物)により通常は発現されず、分泌されない配列を指す。一部の実施形態において、用語は、天然で通常見られる互いに同じ関係で見られないか、あるいはその発現レベル、または細胞における他の核酸もしくは他の分子との物理的関係、または構造が、天然で通常見られないように、組換え操作される、2つまたはそれより多くの部分配列を含む配列を包含する。例えば、天然で見られない様式で配置された無関連の遺伝子(例えば、ベクターのような、発現カセットに挿入されたプロモーター配列に作動可能に連結された本発明の核酸オープンリーディングフレーム(ORF))由来の2つまたはそれより多い配列を有する、異種核酸が、典型的には、組換え生成される。一部の実施形態において、「異種ポリヌクレオチド」は、実験室の技術により宿主細胞に導入される任意のポリヌクレオチドを指し、宿主細胞から除去され、実験室の操作の対象にされ、その後宿主細胞に再導入されるポリヌクレオチドを含む。
本明細書において使用される場合、「改善された酵素特性」は、参照トランスアミナーゼと比較して、何らかの酵素特性の改善を示すトランスアミナーゼを指す。本明細書において記載される操作されたトランスアミナーゼポリペプチドについて、一部の実施形態において、参照トランスアミナーゼは、別の改善された操作されたトランスアミナーゼであり得るが、比較は、一般に、野生型トランスアミナーゼ酵素に対してなされる。改善が望ましい酵素特性は、これらに限定されないが、酵素活性(特定した量のトランスアミナーゼを使用した特定した反応時間での基質の変換パーセントに関して表すことができる)、化学選択性、熱安定性、溶媒安定性、pH活性プロファイル、補助因子要件、阻害剤に対する不応性(例えば、生成物阻害)、立体特異性、および立体選択性(エナンチオ選択性を含む)を含む。
本明細書において使用される場合、「増大した酵素活性」は、操作されたトランスアミナーゼポリペプチドの改善された特性を指し、参照トランスアミナーゼ酵素と比較して、比活性(例えば、生成された生成物/時間/タンパク質重量)における増大、または基質から生成物への変換パーセント(例えば、特定した量のトランスアミナーゼを使用する、特定した時間での、開始量の基質から生成物への変換パーセント)における増大により表すことができる。酵素活性を決定する例示的な方法は、実施例において提供される。増大した酵素活性を導き得る変化である、Km、Vmaxまたはkcatの古典的酵素特性を含む、酵素活性に関連する任意の特性が、影響されてもよい。酵素活性の改善は、対応する野生型トランスアミナーゼ酵素の約1.5倍の酵素活性から2倍と同じ大きさの酵素活性であり得る。天然に存在するトランスアミナーゼまたはトランスアミナーゼポリペプチドがもたらされた別の操作されたトランスアミナーゼより5倍、10倍、20倍、25倍、50倍、75倍、100倍、またはそれより高い酵素活性。一部の実施形態において、操作されたトランスアミナーゼ酵素は、親トランスアミナーゼ酵素のものより1.5~50倍、1.5~100倍高い範囲の改善された酵素活性を示す。任意の酵素の活性は、触媒のターンオーバー速度が、任意の要求される補助因子を含む、基質の拡散速度を超え得ないように、拡散により制限されるものであることは、当業者により理解される。拡散限界、またはkcat/Kmの理論上の最大値は、一般に、約108~109(M-1s-1)である。ゆえに、トランスアミナーゼの酵素活性における任意の改善は、トランスアミナーゼ酵素により作用される基質の拡散速度に関連する上限を有することになる。酵素活性の比較は、本明細書においてさらに詳細に記載される、酵素の規定の調製、設定条件下での規定のアッセイ、および1つまたは複数の規定の基質を使用してなされる。一般に、溶解物が比較されるとき、アッセイされる細胞の数およびタンパク質の量が決定され、ならびに宿主細胞により生成され、溶解物に存在する酵素の量における変動を最小にする同一の発現系および同一の宿主細胞の使用が決定される。
本明細書において使用される場合、「増大した酵素活性」および「増大した活性」は、操作された酵素の改善された特性を指し、本明細書において記載される参照酵素と比較して、比活性(例えば、生成された生成物/時間/タンパク質重量)における増大、または基質から生成物への変換パーセント(例えば、特定した量のトランスアミナーゼを使用する、特定した時間での、開始量の基質から生成物への変換パーセント)における増大により表すことができる。増大した酵素活性を導き得る変化である、Km、Vmaxまたはkcatの古典的酵素特性を含む、酵素活性に関連する任意の特性が、影響されてもよい。酵素活性の比較は、本明細書においてさらに詳細に記載される、酵素の規定の調製、設定条件下での規定のアッセイ、および1つまたは複数の規定の基質を使用してなされる。一般に、細胞溶解物における酵素が比較されるとき、アッセイされる細胞の数およびタンパク質の量が決定され、ならびに宿主細胞により生成され、溶解物に存在する酵素の量における変動を最小にする同一の発現系および同一の宿主細胞の使用が決定される。
本明細書において使用される、「変換」は、基質から対応する生成物への酵素的転換を指す。
本明細書において使用される場合、「変換パーセント」は、特定した条件下で一定時間内に生成物に変換される基質のパーセントを指す。したがって、例えば、トランスアミナーゼポリペプチドの「酵素活性」または「活性」は、基質から生成物への「変換パーセント」として表すことができる。
本明細書において使用される場合、「化学選択性」は、化学または酵素反応においてある生成物が別の生成物よりも優先的に形成されることを指す。
本明細書において使用される場合、「耐熱性の」および「熱安定性の」を互換的に使用して、処理されていない酵素と比較して、一定時間(例えば、0.5~24時間)にわたり温度条件(例えば、40~80℃)のセットに曝露されたとき、不活性化に抵抗性であり、したがって、上昇した温度への曝露後に、ある特定のレベルの残存活性(例えば、60%超~80%)を保持しているポリペプチドを指す。
本明細書において使用される場合、「溶媒安定な」は、処理されていない酵素と比較して、一定時間(例えば、0.5~24時間)にわたり変動する濃度(例えば、5~99%)の溶媒(例えば、イソプロピルアルコール、テトラヒドロフラン、2-メチルテトラヒドロフラン、アセトン、トルエン、酢酸ブチル、メチルtert-ブチルエーテルなど)への曝露後、類似の活性(例えば、60%超~80%)を維持するポリペプチドの能力を指す。
本明細書において使用される場合、「pH安定な」は、処理されていない酵素と比較して、一定時間(例えば、0.5~24時間)にわたり高いまたは低いpH(例えば、4.5~6もしくは8~12)への曝露後、類似の活性(例えば、60%~80%より高い)を維持するトランスアミナーゼポリペプチドを指す。
本明細書において使用される場合、「熱および溶媒安定な」は、耐熱性と溶媒安定の両方であるトランスアミナーゼポリペプチドを指す。
本明細書において使用される場合、「適切な反応条件」は、本発明のトランスアミナーゼポリペプチドが、アミノ基転移の能力がある、生体触媒反応溶液における条件(例えば、酵素負荷量、基質負荷量、補助因子負荷量、温度、pH、緩衝液、共溶媒などの範囲)を指す。例示的な「適切な反応条件」は、本発明において提供され、実施例により説明される。
本明細書において使用される場合、「化合物負荷量」、「酵素負荷量」または「補助因子負荷量」におけるような「負荷量」は、反応の開始時における反応混合物における成分の濃度または量を指す。
本明細書において使用される場合、「基質」は、生体触媒により媒介されるプロセスの文脈において、生体触媒により作用される化合物または分子を指す。
本明細書において使用される場合、「生成物」は、生体触媒により媒介されるプロセスの文脈において、生体触媒の作用から生じる化合物または分子を指す。
本明細書において使用される場合、本明細書において使用される「平衡」は、化学もしくは酵素反応の順方向の速度定数および逆方向の速度定数により決定される、立体異性体の相互変換を含む、化学または酵素反応(例えば、2つの種AおよびBの相互変換)における化学種の定常濃度を生じるプロセスを指す。
「トランスアミナーゼ」または「アミノトランスフェラーゼ」を本明細書において互換的に使用して、アミノ基(-NH2)、1対の電子、およびアミンドナー化合物の第一級アミン由来のプロトンを、アミンアクセプター化合物のカルボニル基(C=O)に転移し、これにより、アミンドナー化合物をその対応するカルボニル化合物に、およびカルボニルアクセプター化合物をその対応する第一級アミン化合物に変換する酵素能を有するポリペプチドを指す(例えば、スキーム1を参照)。本明細書において使用される場合、トランスアミナーゼは、天然に存在する(野生型)トランスアミナーゼおよびヒト操作により生じた天然に存在しない操作されたポリペプチドを含む。
「アミノ基ドナー」または「アミノドナー」を本明細書において互換的に使用して、アミノ基をアクセプターカルボニル化合物(すなわち、アミノ基アクセプター)に供与し、これにより、カルボニル副生成物となる能力がある、アミノ基含有化合物を指す。アミノ基ドナーは、一般構造式
(式中、R
1、およびR
2のそれぞれは、独立して使用されるとき、置換されていないか、または1つもしくは複数の酵素的に阻害しない基で置換されているアルキル、アルキルアリール基、あるいはアリール基である)を有する。R
1は、構造またはキラリティーにおいてR
2と同じであるか、または異なり得る。一緒に使用される、基R
1およびR
2は、置換されていないか、置換されているか、または他の環に縮合されている環を形成してもよい。典型的なアミノ基ドナーは、キラルおよびアキラルアミノ酸、ならびにキラルおよびアキラルアミンを含む。
「キラルアミン」は、一般構造式
(式中、R
1、およびR
2のそれぞれは、独立して使用されるとき、置換されていないか、または1つもしくは複数の基で置換されているアルキル、アルキルアリール基、あるいはアリール基である)を有するアミノ基含有化合物を指す。R
1は、構造においてR
2と異なり、アミノ基(
*を用いて示される)を有する炭素をステレオジェン中心にする。一緒に使用される、基R
1およびR
2は、置換されていないか、置換されているか、または他の環に縮合されているが、そうでなければ、対称でない環を形成してもよい。
「カルボニル副生成物」は、アミノ基ドナー上のアミノ基が、アミノ基転移反応においてアミノ基アクセプターに転移されるとき、アミノ基ドナーから形成されるカルボニル化合物を指す。カルボニル副生成物は、一般構造式
(式中、R
1およびR
2は、アミノ基ドナーについて上で定義されている)を有する。
「アミノアクセプター」および「アミンアクセプター」、「ケト基質」を本明細書において互換的に使用して、トランスアミナーゼにより媒介される反応において、アミノ基ドナーからアミノ基を受け取るカルボニル基含有化合物を指す(例えば、スキーム1を参照)。本発明の文脈において、トランスアミナーゼについてのアミノアクセプター化合物は、数ある中でも、化合物(2)を含み得る。
本明細書において使用される場合、「補助因子」は、反応の触媒において酵素と組み合わせて動作する非タンパク質化合物を指す。本明細書において使用される場合、「補助因子」は、ビタミンB6ファミリー化合物PLP、PN、PL、PM、PNP、およびPMPを包含することが意図され、ときおり補酵素とも称する。
「リン酸ピリドキサール」、「PLP」、「ピリドキサール-5’-ホスフェート」、「PYP」および「P5P」を本明細書において互換的に使用して、トランスアミナーゼ反応において補助因子として作用する化合物を指す。一部の実施形態において、リン酸ピリドキサールは、構造1-(4’-ホルミル-3’-ヒドロキシ-2’-メチル-5’-ピリジル)メトキシホスホン酸、CAS番号[54-47-7]により定義される。ピリドキサール-5’-ホスフェートは、ピリドキサール(ビタミンB6としても公知)のリン酸化および酸化によりin vivoで生成され得る。トランスアミナーゼ酵素を使用したアミノ基転移反応において、アミノドナーのアミン基を補助因子に転移させて、ケト副生成物を生成し、一方、ピリドキサール-5’-ホスフェートは、リン酸ピリドキサミンに変換される。ピリドキサール-5’-ホスフェートは、異なるケト化合物(アミノアクセプター)との反応により再生される。リン酸ピリドキサミンからアミノアクセプターへのアミン基の転移は、アミンを生成し、補助因子を再生する。一部の実施形態において、ピリドキサール-5’-ホスフェートは、ピリドキシン(PN)、ピリドキサール(PL)、ピリドキサミン(PM)、およびそれらのリン酸化相対物;リン酸ピリドキシン(PNP)、およびリン酸ピリドキサミン(PMP)を含む、ビタミンB6ファミリーの他のメンバーにより置き換えることができる。
「アルキル」は、直鎖または分岐のいずれかの、1~18個の炭素原子、特に、1~8個の炭素原子、およびより詳細には、1~6個の炭素原子の基を指す。具体的に示した数の炭素原子を有するアルキルは、丸括弧内に示される(例えば、(C1~C4)アルキルは、1~4個の炭素原子のアルキルを指す)。
「アルケニル」は、少なくとも1つの二重結合を含有するが、必要に応じて、1つより多くの二重結合を含有する直鎖または分岐のいずれかの、2~12個の炭素原子の基を指す。
「アルキニル」は、少なくとも1つの三重結合を含有するが、必要に応じて、1つより多くの三重結合を含有し、必要に応じて、1つもしくは複数の二重結合した部分を含有する直鎖または分岐のいずれかの、2~12個の炭素原子の基を指す。
「アリール」は、単環(例えば、フェニル)または複数の縮合環(例えば、ナフチルもしくはアントリル)を有する5~14個の炭素原子の不飽和芳香族炭素環式基を指す。複数の縮合環について、環の少なくとも1つは、芳香族である。代表的なアリールは、フェニル、ピリジル、ナフチルなどを含む。
「アリールアルキル」は、アリール部分で置換されているアルキルを指す。代表的なアリールアルキル基は、ベンジル、フェネチルなどを含む。
「アリールアルケニル」は、アリール基で置換されている、本明細書において定義されるアルケニルを指す。
「アリールアルキニル」は、アリール基で置換されている、本明細書において定義されるアルキニルを指す。
「ヘテロアリール」は、環内の酸素、窒素および硫黄から選択される1~4個の環のヘテロ原子を含有する5~14個の環原子の芳香族複素環基を指す。ヘテロアリール基は、単環(例えば、ピリジルもしくはフリル)または複数の縮合環(例えば、インドリジニルもしくはベンゾチエニル)を有し得る。複数の縮合環について、環の少なくとも1つは、芳香族である。
「ヘテロアリールアルキル」は、本明細書において定義されるヘテロアリール部分で置換されているアルキルを指す。
「ヘテロアリールアルケニル」は、本明細書において定義されるヘテロアリール基で置換されているアルケニルを指す。
「ヘテロアリールアルキニル」は、本明細書において定義されるヘテロアリール部分で置換されているアルキニルを指す。
「シクロアルキル」は、単環の環または複数の縮合環を有する3~12個の炭素原子の環状アルキル基を指す。代表的なシクロアルキル基は、例示の目的で、シクロプロピル、シクロブチル、シクロペンチル、シクロオクチル、1-メチルシクロプロピル、2-メチルシクロペンチル、2-メチルシクロオクチルなどのような単環構造、またはアダマンチルなどのような、架橋結合した環系を含む、複数の環構造を含む。
「複素環」および互換的な「ヘテロシクロアルキル」は、環内の窒素、硫黄もしくは酸素から選択される1~4個のヘテロ原子を有する3~14個の環原子の、単環または複数の縮合環を有する飽和あるいは不飽和基を指す。複素環基は、単環(例えば、ピペリジニルもしくはテトラヒドロフリル)または複数の縮合環(例えば、インドリニル、ジヒドロベンゾフランもしくはキヌクリジニル)を有し得る。代表的な複素環およびヘテロアリールは、これらに限定されないが、フラン、チオフェン、チアゾール、オキサゾール、ピロール、イミダゾール、ピラゾール、ピリジン、ピラジン、ピリミジン、ピリダジン、インドリジン、イソインドール、インドール、インダゾール、プリン、キノリジン、イソキノリン、キノリン、フタラジン、ナフチルピリジン、キノキサリン、キナゾリン、シンノリン、プテリジン、カルバゾール、カルボリン、フェナントリジン、アクリジン、フェナントロリン、イソチアゾール、フェナジン、イソオキサゾール、フェノキサジン、フェノチアジン、イミダゾリジン、イミダゾリン、ピペリジン、ピペラジン、ピロリジン、インドリンなどを含む。
「シクロアルキルアルキル」は、本明細書において定義されるシクロアルキル部分で置換されているアルキルを指す。
「シクロアルキルアルケニル」は、本明細書において定義されるシクロアルキル部分で置換されているアルケニルを指す。
「シクロアルキルアルキニル」は、本明細書において定義されるシクロアルキル部分で置換されているアルキニルを指す。
「ヘテロシクロアルキルアルキル」は、本明細書において定義されるヘテロシクロアルキル部分で置換されているアルキルを指す。
「ヘテロシクロアルキルアルケニル(Heterocycoalkenyl)」は、本明細書において定義されるヘテロシクロアルキル部分で置換されているアルケニルを指す。
「ヘテロシクロアルキルアルキニル」は、本明細書において定義されるヘテロシクロアルキル部分で置換されているアルキニルを指す。
「アルコキシ」または「アルキルオキシ」は、基アルキル-O-を指し、アルキル基は、上で定義された通りであり、必要に応じて、上で定義された置換されたアルキル基を含む。
「アミノ」は、基-NH2を指す。置換されたアミノは、基-NHR’、NR’R’、およびNR’R’R’を指し、それぞれのR’は、互いに独立して、置換されたまたは置換されていないアルキル、シクロアルキル、ヘテロシクロアルキル、シクロアルキルアルキル、ヘテロシクロアルキルアルキル、アルキルオキシ、アリール、ヘテロアリール、アリールアルキル、ヘテロアリールアルキル、アシル、アルキルオキシカルボニル、スルファニル、スルフィニル、スルホニルなどから選択される。典型的なアミノ基は、これらに限定されないが、ジメチルアミノ、ジエチルアミノ、トリメチルアンモニウム、トリエチルアンモニウム、メチルスルホニルアミノ、フラニル-オキシ-スルファミノなどを含む。
「カルボキシ」は、-COOHを指す。
「カルボニル」は、-C(O)-を指し、酸、酸ハロゲン化物、アルデヒド、アミド、エステル、およびケトンを含む異なるカルボニル基を形成するための様々な置換基を有してもよい。
「ヒドロキシ」は、-OHを指す。
「シアノ」は、-CNを指す。
「ハロゲン」または「ハロ」は、フルオロ、クロロ、ブロモおよびヨードを指す。
「スルホニル」は、-SO2-を指す。置換されたスルホニルは、-SO2R’(式中、R’は、以下で記載される通り、適切な置換基である)を指す。
縮合されたアリールもしくは縮合されたヘテロアリールにおけるような「縮合された」または「縮合環」は、それらが、共同で少なくとも2つの環原子を有するように、結合された2つまたはそれより多い環を指す。縮合されたアリールは、環の少なくとも1つがアリールである、縮合環を指す。縮合されたヘテロアリールは、環の少なくとも1つがヘテロアリールである、縮合環を指す。
別段具体的に示さない限り、「置換された」は、非限定的に、ヒドロキシ、オキソ、ニトロ、メトキシ、エトキシ、アルキルオキシ、置換されたアルキルオキシ、トリフルオロメトキシ、ハロアルキルオキシ、フルオロ、クロロ、ブロモ、ヨード、ハロ、メチル、エチル、プロピル、ブチル、アルキル、アルケニル、アルキニル、置換されたアルキル、トリフルオロメチル、ハロアルキル、ヒドロキシアルキル、アルキルオキシアルキル、チオ、アルキルチオ、アシル、カルボキシ、アルキルオキシカルボニル、カルボキサミド、置換されたカルボキサミド、アルキルスルホニル、アルキルスルフィニル、アルキルスルホニルアミノ、スルホンアミド、置換されたスルホンアミド、シアノ、アミノ、置換されたアミノ、アルキルアミノ、ジアルキルアミノ、アミノアルキル、アシルアミノ、アミジノ、アミドキシモ、ヒドロキサモイル、フェニル、アリール、置換されたアリール、アリールオキシ、アリールアルキル、アリールアルケニル、アリールアルキニル、ピリジル、イミダゾリル、ヘテロアリール、置換されたヘテロアリール、ヘテロアリールオキシ、ヘテロアリールアルキル、ヘテロアリールアルケニル、ヘテロアリールアルキニル、シクロプロピル、シクロブチル、シクロペンチル、シクロヘキシル、シクロアルキル、シクロアルケニル、シクロアルキルアルキル、置換されたシクロアルキル、シクロアルキルオキシ、ピロリジニル、ピペリジニル、モルホリノ、複素環、(複素環)オキシ、および(複素環)アルキルにより例示される置換基での、前述の基における水素により占められた位置の置換えを指し、好ましいヘテロ原子は、酸素、窒素、および硫黄である。開放原子価が、これらの置換基上に存在する場合、それらは、アルキル、シクロアルキル、アリール、ヘテロアリール、および/または複素環基でさらに置換され得ること、これらの開放原子価が、炭素上に存在する場合、それらは、ハロゲンにより、および酸素、窒素、または硫黄で結合した置換基によりさらに置換され得ること、ならびに複数のかかる開放原子価が存在する場合、これらの基は、新たなヘテロ原子、好ましくは、酸素、窒素、もしくは硫黄への直接的な結合の形成または複数の結合の形成のいずれかにより、環を形成するよう結合され得ることが、理解される。水素の置換基での置換えが、許容されない不安定性を本発明の分子に導入せず、また他の点で化学的に合理的であるという条件で、上記の置換がなされ得ることは、さらに理解される。
「必要に応じた」または「必要に応じて」は、続いて記載される事象または状況が、生じ得るか、または生じ得ないこと、記載が、前記事象または状況が生じる場合、およびそれが生じない場合を含むことを意味する。当業者は、1つまたは複数の必要に応じた置換基を含有するとして記載される任意の分子に関して、立体上実用的および/または合成で実行可能な化合物のみが、含まれることを意味することを理解するであろう。「必要に応じて置換された」は、用語または一連の化学基における全ての後続の修飾語句を指す。例えば、用語「必要に応じて置換されたアリールアルキル」において、分子の「アルキル」部分および「アリール」部分は、置換されても、置換されなくてもよく、一連の「必要に応じて置換されたアルキル、シクロアルキル、アリールおよびヘテロアリール」について、アルキル、シクロアルキル、アリール、およびヘテロアリール基は、互いに独立して、置換されても、置換されなくてもよい。
「保護基」は、分子中の反応性官能基に結合したとき、官能基の反応性をマスクするか、低減するか、または妨げる原子基を指す。典型的には、保護基は、合成経過中に、望まれる通り、選択的に除去され得る。保護基の例は、当技術分野において公知である(例えば、Wuts and Greene, ”Greene’s Protective Groups in Organic Synthesis”, 4th Ed., Wiley Interscience,[2006]、およびHarrisonら、Compendium of Synthetic Organic Methods, Vols. 1-8, John Wiley & Sons, NY,[1971-1976])。保護基を有し得る官能基は、これらに限定されないが、ヒドロキシ、アミノ、およびカルボキシ基を含む。代表的なアミノ保護基は、これらに限定されないが、ホルミル、アセチル、トリフルオロアセチル、ベンジル、ベンジルオキシカルボニル(「CBZ」)、tert-ブトキシカルボニル(「Boc」)、トリメチルシリル(「TMS」)、2-トリメチルシリル-エタンスルホニル(「SES」)、トリチルおよび置換されたトリチル基、アリルオキシカルボニル、9-フルオレニルメチルオキシカルボニル(「FMOC」)、ニトロ-ベラトリルオキシカルボニル(「NVOC」)などを含む。代表的なヒドロキシル保護基は、これらに限定されないが、ヒドロキシル基が、アシル化されている(例えば、メチルおよびエチルエステル、アセテートもしくはプロピオネート基もしくはグリコールエステル)か、またはベンジルおよびトリチルエーテル、ならびにアルキルエーテル、テトラヒドロピラニルエーテル、トリアルキルシリルエーテル(例えば、TMSもしくはTIPPS基)およびアリルエーテルのような、アルキル化されているものを含む。他の保護基は、本明細書において示される参考文献において見ることができる。
「脱離基」は、一般に、化学反応における別の原子もしくは部分により取って代わられる能力がある任意の原子または部分を指す。より具体的には、脱離基は、求核試薬(例えば、アミン、チオール、アルコール、もしくはシアン化物)により容易に取って代わられるか、または置換される原子あるいは部分を指す。かかる脱離基は、周知であり、カルボキシレート、N-ヒドロキシスクシンイミド(「NHS」)、N-ヒドロキシベンゾトリアゾール、ハロゲン(フッ素、塩素、臭素、またはヨウ素)、およびアルキルオキシ基を含む。脱離基の非限定的な特徴および例は、当技術分野において公知であり、様々な化学テキストにおいて記載される。
操作されたトランスアミナーゼポリペプチド
本発明は、アミノアクセプター基質化合物がキラルアミン生成物を生成する選択的なアミノ基転移に有用なトランスアミナーゼ活性を有する操作されたポリペプチド(本明細書において「操作されたトランスアミナーゼポリペプチド」とも称する)を提供し、これは、一部の実施形態において、化合物(1)を含み得る。したがって、1つの態様において、本発明は、スキーム2において示される、基質化合物(2)を生成物化合物(1)に変換する能力があるトランスアミナーゼ活性を有する操作されたポリペプチドを提供する。さらに、本発明は、操作されたポリペプチドをコードするポリヌクレオチド、ポリヌクレオチドを含む関連するベクターおよび宿主細胞、操作されたポリペプチドを製造する方法、ならびに適切な反応条件を含む、操作されたポリペプチドを使用する方法を提供する。
本発明の操作されたポリペプチドは、Vibrio fluvialis JS17(GenBank受託番号AEA39183.1、GI:327207066;配列番号2)の野生型トランスアミナーゼポリペプチドと比較して、および配列番号4の参照の操作されたトランスアミナーゼポリペプチドとも比較して、改善された酵素特性(例えば、増大した立体選択性)を有するよう操作された天然に存在しないトランスアミナーゼであり、これは、本発明の操作されたポリペプチドの指向性進化のため出発骨格配列として使用された。配列番号4の参照の操作されたトランスアミナーゼポリペプチドは、Vibrio fluvialis JS17の野生型トランスアミナーゼ(配列番号2)と比べて次の28のアミノ酸の違い:A9T、N45H、L56A、W57L、A74T、F86S、V153A、K163F、V177L、R211K、N286S、M294V、A323T、S324G、A383V、T391A、およびD394Gを有する。
本発明の操作されたトランスアミナーゼポリペプチドは、ある特定の産業上関連する条件下での化合物(2)から化合物(1)への効率的な変換のための配列番号4の指向性進化により生じたものであり、参照の操作されたトランスアミナーゼポリペプチドと比較して、1つまたは複数の残基の違いを有する。これらの残基の違いは、様々な酵素特性の改善、特に、増大した活性、増大した立体選択性、増大した安定性、ならびに増大した基質および/または生成物濃度の許容範囲(例えば、減少した生成物阻害)と関連する。したがって、一部の実施形態において、トランスアミナーゼ活性を有する操作されたポリペプチドは、適切な反応条件下で、基質化合物(2)を、参照ポリペプチド(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)の活性と比べて、少なくとも約1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、100倍、200倍、500倍、1000倍、10,000倍、20,000倍、30,000倍、40,000倍、50,000倍、60,000倍、70,000倍、80,000倍、90,000倍、95,000倍、またはそれより高い倍率で増大する活性で、化合物(1)に変換する能力がある。一部の実施形態において、トランスアミナーゼ活性を有する操作されたポリペプチドは、化合物(2)の基質を化合物(1)に、約48時間、約36時間、約24時間、もしくはそれよりさらに短い長さの時間の反応時間で、適切な反応条件下、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、または少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の変換パーセントで変換する能力がある。一部の実施形態において、トランスアミナーゼ活性を有する操作されたポリペプチドは、適切な反応条件下で、化合物(2)を化合物(1)に、少なくとも90%、95%、97%、98%、99%、またはそれより大きいジアステレオマー過剰率で変換する能力がある。
本発明は、配列番号6~172の偶数番号の配列識別子のアミノ酸配列を含む多数の例示的な操作されたトランスアミナーゼポリペプチドを提供する。これらの例示的な操作されたトランスアミナーゼポリペプチドは、参照配列(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)と比較して、化合物(2)から化合物(1)への変換のため改善された特性と関連する次の残基の違いの1つまたは複数を含むアミノ酸配列を含む。
一部の場合において、例示的な操作されたポリペプチドは、参照配列(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)と比較して、1つまたは複数の残基の違いをさらに含むアミノ酸配列を有する。一部の場合において、例示的な操作されたポリペプチドは、参照配列(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)と比較して、1つまたは複数の残基の違いをさらに含むアミノ酸配列を有する。
一部の実施形態において、操作されたポリペプチドは、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156から選択される参照配列と、少なくとも約80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれより高く同一であるアミノ酸配列を含み、ポリペプチドは、トランスアミナーゼ活性および本明細書において記載される改善された特性の1つまたは複数、例えば、化合物(2)を、参照配列(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156のポリペプチド)と比較して増大した活性で、生成物化合物(1)に変換する能力を有する。一部の実施形態において、参照配列は、配列番号4である。一部の実施形態において、参照配列は、配列番号18である。一部の実施形態において、参照配列は、配列番号20である。一部の実施形態において、参照配列は、配列番号30である。一部の実施形態において、参照配列は、配列番号48である。一部の実施形態において、参照配列は、配列番号66である。一部の実施形態において、参照配列は、配列番号70である。一部の実施形態において、参照配列は、配列番号88である。一部の実施形態において、参照配列は、配列番号110である。一部の実施形態において、参照配列は、配列番号112である。一部の実施形態において、参照配列は、配列番号120である。一部の実施形態において、参照配列は、配列番号138である。一部の実施形態において、参照配列は、配列番号156である。
一部の実施形態において、アミノ酸配列を含む操作されたトランスアミナーゼポリペプチドは、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156と比較して、1つまたは複数のアミノ酸残基の違いを有する。一部の実施形態において、本発明は、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156の参照配列に対して少なくとも80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれより高い配列同一性ならびに(a)本明細書において提供される置換から選択される少なくとも1つのアミノ酸残基の違い(例えば、表6.1、7.1、8.1、9.1、10.1、11.1、12.1、13.1、13.2、14.1、15.1、16.1、17.1、および18.1を参照)を有するアミノ酸配列を含むトランスアミナーゼ活性を有する操作されたポリペプチドを提供する。
一部の実施形態において、本発明は、17、17/259/347、20、45/48/78/81/92、57、57/319、85、86、157、158、161、203/416、314、316、319、375/416、404、415、416、417、420、421、422、および424から選択される、配列番号4と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号4に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換17V/259T/347K、17W、20R、45R/48L/78C/81V/92H、57I、57T/319E、85G、85S、85V、86A、86G、157C、157G、157P、157T、158S、161G、203H/416G、203H/416S、314R、316K、316L、316M、316S、319G、319L、319V、375L/416F、404T、404V、415V、416C、416G、416S、416Y、417G、417M、417P、420G、421I、422A、422G、422R、424A、および424Rを含み、位置は、配列番号4に関して番号付けされている。一部のさらなる実施形態において、アミノ酸の違いは、置換Y17V/I259T/E347K、Y17W、T20R、H45R/R48L/R78C/G81V/Q92H、L57I、L57T/H319E、F85G、F85S、F85V、S86A、S86G、S157C、S157G、S157P、S157T、A158S、T161G、R203H/P416G、R203H/P416S、I314R、E316K、E316L、E316M、E316S、H319G、H319L、H319V、I375L/P416F、A404T、A404V、R415V、P416C、P416G、P416S、P416Y、L417G、L417M、L417P、S420G、V421I、V422A、V422G、V422R、C424A、およびC424Rを含み、位置は、配列番号4に関して番号付けされている。
一部の実施形態において、本発明は、5/17/86/157/259/314/316/422、17/86/157/203/259/314/316/422、17/86/157/314/316/347/422、17/86/157/316/422、85/86、86/157/314/316/347/416/422、86/157/416、86/203/316/416、86/203/316/422、86/316/416、139/221/310/316、157/316、195/316、207/316、227/422、280/381/416/445、314、314/316、316、416、417、および422から選択される、配列番号18と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号18に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換5H/17V/86G/157G/259T/314R/316S/422R、17V/86A/157G/316M/422A、17V/86G/157G/203H/259T/314R/316L/422R、17V/86G/157G/316M/422R、17V/86G/157T/316M/422R、17W/86A/157T/314R/316M/347K/422R、85F/86G、86A/157G/314R/316S/347K/416C/422A、86A/203H/316M/416G、86A/203H/316M/422G、86A/316S/416C、86G/157T/416G、139H/221I/310E/316G、157T/316M、195K/316S、207K/316T、227F/422G、280E/381V/416G/445R、314R、314R/316M、316C、316F、316G、316M、316S、316W、316Y、416A、416G、416S、417M、および422Cを含み、位置は、配列番号18に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Q5H/Y17V/S86G/S157G/I259T/I314R/E316S/V422R、Y17V/S86A/S157G/E316M/V422A、Y17V/S86G/S157G/R203H/I259T/I314R/E316L/V422R、Y17V/S86G/S157G/E316M/V422R、Y17V/S86G/S157T/E316M/V422R、Y17W/S86A/S157T/I314R/E316M/E347K/V422R、V85F/S86G、S86A/S157G/I314R/E316S/E347K/P416C/V422A、S86A/R203H/E316M/P416G、S86A/R203H/E316M/V422G、S86A/E316S/P416C、S86G/S157T/P416G、Q139H/F221I/A310E/E316G、S157T/E316M、E195K/E316S、E207K/E316T、G227F/V422G、A280E/L381V/P416G/L445R、I314R、I314R/E316M、E316C、E316F、E316G、E316M、E316S、E316W、E316Y、P416A、P416G、P416S、L417M、およびV422Cを含み、位置は、配列番号18に関して番号付けされている。
一部の実施形態において、本発明は、17/139/314/416/417/422、17/195/316/414/416/422、17/314/316/414/416、17/314/316/414/416/417/422、20、31、54、57、83、86、86/194、121、139/195/227/314/316/416、139/202/207/227/314/316/416/422、139/207/227/314/414/416/422、139/227/310/414/416/417、139/316/414/416/417/422、146/157、164/207/213/227/310/316/416、166、178/314/316/416、190/195/207/213/244/314/414/416/417/422、194/213/310/314/316/422、195/227/314/316/416、195/227/314/416/417、195/227/314/422、195/227/414/416、195/227/414/416/422、195/227/416/417、195/316/416/417/422、207/208/220/241/291/314/316、226、227、227/416、228、258、259、271/310/316/416/422、282、310/314/316/414/416/417/422、314/316/414/416/422、314/316/416、314/316/416/422、316、319、320、322、および417から選択される、配列番号20と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号20に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換17V/139H/314R/416A/417M/422A、17V/195K/316W/414V/416S/422C、17V/314R/316S/414V/416C、17V/314R/316W/414V/416S/417M/422A、20K、20L、20V、31A、31C、31D、31E、31G、31Q、54C、57A、57C、83G、86G、86G/194K、86K、121A、121C、121G、121H、121L、121S、121V、139H/195K/227F/314R/316W/416C、139H/202G/207K/227F/314R/316F/416S/422C、139H/207K/227F/314R/414V/416C/422G、139H/227F/310E/414V/416C/417M、139H/316S/414V/416S/417M/422A、146K/157G、146V/157G、164Q/207K/213S/227F/310E/316F/416A、166T、178L/314A/316W/416S、190K/195K/207K/213S/244A/314R/414V/416S/417M/422G、194D/213C/310E/314R/316W/422C、195K/227F/314R/316W/416A、195K/227F/314R/416A/417M、195K/227F/314R/422C、195K/227F/414V/416A/422G、195K/227F/414V/416C、195K/227F/416S/417M、195K/316W/416S/417M/422A、207K/208N/220Y/241V/291S/314R/316S、226A、226E、226T、227F/416C、227V、228G、258L、259V、271R/310E/316W/416S/422A、282L、310E/314R/316S/414V/416A/417M/422A、314A/316W/416A、314R/316W/414V/416A/422A、314R/316W/416C/422C、316A、316E、316G、316H、316K、316Q、316R、316S、316T、316W、316Y、319V、320W、322S、および417Sを含み、位置は、配列番号20に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Y17V/Q139H/I314R/G416A/L417M/V422A、Y17V/E195K/M316W/C414V/G416S/V422C、Y17V/I314R/M316S/C414V/G416C、Y17V/I314R/M316W/C414V/G416S/L417M/V422A、T20K、T20L、T20V、V31A、V31C、V31D、V31E、V31G、V31Q、S54C、L57A、L57C、H83G、A86G、A86G/E194K、A86K、N121A、N121C、N121G、N121H、N121L、N121S、N121V、Q139H/E195K/G227F/I314R/M316W/G416C、Q139H/A202G/E207K/G227F/I314R/M316F/G416S/V422C、Q139H/E207K/G227F/I314R/C414V/G416C/V422G、Q139H/G227F/A310E/C414V/G416C/L417M、Q139H/M316S/C414V/G416S/L417M/V422A、R146K/S157G、R146V/S157G、P164Q/E207K/G213S/G227F/A310E/M316F/G416A、N166T、H178L/I314A/M316W/G416S、E190K/E195K/E207K/G213S/P244A/I314R/C414V/G416S/L417M/V422G、E194D/G213C/A310E/I314R/M316W/V422C、E195K/G227F/I314R/M316W/G416A、E195K/G227F/I314R/G416A/L417M、E195K/G227F/I314R/V422C、E195K/G227F/C414V/G416A/V422G、E195K/G227F/C414V/G416C、E195K/G227F/G416S/L417M、E195K/M316W/G416S/L417M/V422A、E207K/T208N/F220Y/A241V/F291S/I314R/M316S、M226A、M226E、M226T、G227F/G416C、G227V、A228G、V258L、I259V、C271R/A310E/M316W/G416S/V422A、I282L、A310E/I314R/M316S/C414V/G416A/L417M/V422A、I314A/M316W/G416A、I314R/M316W/C414V/G416A/V422A、I314R/M316W/G416C/V422C、M316A、M316E、M316G、M316H、M316K、M316Q、M316R、M316S、M316T、M316W、M316Y、H319V、G320W、T322S、およびL417Sを含み、位置は、配列番号20に関して番号付けされている。
一部の実施形態において、本発明は、21、21/23/53/146/162/395、21/23/53/146/162/395/432、21/23/53/162/395/432、21/23/53/395/432、21/23/395、21/53/159/395、21/53/163/395/432、23/53/146/159/395/431、23/53/146/159/395/432、23/53/146/162/395/432、23/53/146/163、23/146/163/432、23/162、53/146/159/395、53/146/162/395、53/146/162/432、53/146/163/395、53/146/395/432、53/162/163/395/432、53/162/395、53/162/395/432、53/163/395/432、53/395、57/86、57/86/121/146/157、57/86/121/157/226/259/282/332、57/86/121/332、57/86/157/259、57/86/157/282/332、57/86/332、57/121/417/422、57/146/226/259、57/146/226/259/282、57/259、86、86/157、86/226、121、121/146/157/226/332、121/208/316/417/422、121/226/332、121/316/422、121/332、121/416/417/422、121/417/422、146、146/162/395/432、157、162/432、226/282/332、227、227/417、259、282、282/332、316/417/422、332、395/432、416、416/422、417、および422から選択される、配列番号30と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号30に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換21P、21P/23S/53C/146H/162D/395D、21P/23S/53C/146H/162D/395D/432V、21P/23S/53C/162D/395D/432V、21P/23S/53C/395D/432V、21P/23S/395D、21P/53C/159T/395D、21P/53C/163K/395D/432V、23S/53C/146H/159T/395D/431V、23S/53C/146H/159T/395D/432V、23S/53C/146H/162D/395D/432V、23S/53C/146H/163K、23S/146H/163K/432V、23S/162D、53C/146H/159T/395D、53C/146H/162D/395D、53C/146H/162D/432V、53C/146H/163K/395D、53C/146H/395D/432V、53C/162D/163K/395D/432V、53C/162D/395D、53C/162D/395D/432V、53C/163K/395D/432V、53C/395D、57A/86K、57A/86K/121A/332T、57A/86K/121C/146K/157G、57A/86K/157G/259V、57A/86K/157G/282L/332T、57A/146K/226T/259V、57A/146V/226T/259V/282L、57A/259V、57C/86K/121A/157G/226T/259V/282L/332T、57C/86K/332T、57C/121A/417M/422V、86K、86K/157G、86K/226T、121A、121A/208N/316S/417M/422V、121A/316F/422C、121A/416S/417M/422C、121A/417M/422C、121A/417M/422V、121C/146K/157G/226A/332T、121C/226A/332T、121C/332T、146H、146H/162D/395D/432V、157G、162D/432V、226A/282L/332T、227A、227F、227F/417V、227V、259V、282L、282L/332T、316S/417M/422V、332T、395D/432V、416S、416S/422C、417F、および422Cを含み、位置は、配列番号30に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換D21P、D21P/P23S/N53C/R146H/G162D/G395D、D21P/P23S/N53C/R146H/G162D/G395D/A432V、D21P/P23S/N53C/G162D/G395D/A432V、D21P/P23S/N53C/G395D/A432V、D21P/P23S/G395D、D21P/N53C/S159T/G395D、D21P/N53C/F163K/G395D/A432V、P23S/N53C/R146H/S159T/G395D/E431V、P23S/N53C/R146H/S159T/G395D/A432V、P23S/N53C/R146H/G162D/G395D/A432V、P23S/N53C/R146H/F163K、P23S/R146H/F163K/A432V、P23S/G162D、N53C/R146H/S159T/G395D、N53C/R146H/G162D/G395D、N53C/R146H/G162D/A432V、N53C/R146H/F163K/G395D、N53C/R146H/G395D/A432V、N53C/G162D/F163K/G395D/A432V、N53C/G162D/G395D、N53C/G162D/G395D/A432V、N53C/F163K/G395D/A432V、N53C/G395D、L57A/A86K、L57A/A86K/N121A/I332T、L57A/A86K/N121C/R146K/S157G、L57A/A86K/S157G/I259V、L57A/A86K/S157G/I282L/I332T、L57A/R146K/M226T/I259V、L57A/R146V/M226T/I259V/I282L、L57A/I259V、L57C/A86K/N121A/S157G/M226T/I259V/I282L/I332T、L57C/A86K/I332T、L57C/N121A/L417M/A422V、A86K、A86K/S157G、A86K/M226T、N121A、N121A/T208N/W316S/L417M/A422V、N121A/W316F/A422C、N121A/A416S/L417M/A422C、N121A/L417M/A422C、N121A/L417M/A422V、N121C/R146K/S157G/M226A/I332T、N121C/M226A/I332T、N121C/I332T、R146H、R146H/G162D/G395D/A432V、S157G、G162D/A432V、M226A/I282L/I332T、G227A、G227F、G227F/L417V、G227V、I259V、I282L、I282L/I332T、W316S/L417M/A422V、I332T、G395D/A432V、A416S、A416S/A422C、L417F、およびA422Cを含み、位置は、配列番号30に関して番号付けされている。
一部の実施形態において、本発明は、107、141、161、174、245、281、293、432、および453から選択される、配列番号66と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号66に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換107G、107V、141L、161S、174Q、245L、281S、293A、432D、432E、432V、453G、および453Tを含み、位置は、配列番号66に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換D107G、D107V、R141L、T161S、P174Q、I245L、I281S、P293A、A432D、A432E、A432V、A453G、およびA453Tを含み、位置は、配列番号66に関して番号付けされている。
一部の実施形態において、本発明は、2、4、5、5/38/56/346、13、17、17/31、19、31、57、74、79、86、121、155、161、161/174/432、163/167、164、190/291、195、195/408、203/207/219、205/419、207、207/235/419、214/228/251、222、223、226/228/230/231/311、228、233、246、247/271/293、259、282、284、309、327、346、359、362、375、404、408、419、420、422、および443から選択される、配列番号70と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号70に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換2I、4A、4C、4D、4R、5E、5H/38C/56T/346G、13E、17A、17G/31T、17H、17I、17M、17S、17V、19Y、31C、31F、31L、57A、57G、74M、79L、86C、86E、86G、86N、121C、155C、161S、161S/174Q/432V、163E/167I、164V、190K/291C、195K、195Q/408E、203R/207K/219R、205M/419S、207I、207K/235P/419S、214T/228G/251T、222T、223G、226D/228C/230R/231C/311R、228G、233V、246V、247A/271G/293P、259V、282L、284A、309R、327E、346N、359G、362Q、375R、404V、408A、408E、408L、408S、408V、419D、419S、420T、422C、443A、および443Iを含み、位置は、配列番号66に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換N2I、P4A、P4C、P4D、P4R、Q5E、Q5H/G38C/A56T/A346G、T13E、Y17A、Y17G/V31T、Y17H、Y17I、Y17M、Y17S、Y17V、F19Y、V31C、V31F、V31L、L57A、L57G、T74M、F79L、A86C、A86E、A86G、A86N、N121C、A155C、T161S、T161S/P174Q/A432V、K163E/S167I、P164V、E190K/F291C、E195K、E195Q/T408E、H203R/E207K/G219R、L205M/Q419S、E207I、E207K/A235P/Q419S、A214T/A228G/I251T、A222T、E223G、M226D/A228C/G230R/V231C/I311R、A228G、P233V、L246V、R247A/C271G/A293P、I259V、I282L、S284A、T309R、P327E、A346N、R359G、H362Q、I375R、A404V、T408A、T408E、T408L、T408S、T408V、Q419D、Q419S、S420T、A422C、K443A、およびK443Iを含み、位置は、配列番号70に関して番号付けされている。
一部の実施形態において、本発明は、21/23/53/163/293、21/23/53/163/293/395、21/53/146、21/53/146/163/293/395/432、21/53/163/293/395、21/53/293/432、23/53/146/163、23/53/146/163/293/432、23/53/146/293/432、23/53/163、23/53/163/293/395、23/53/163/293/432、23/53/163/395、23/53/293、23/53/293/395/432、23/53/293/432、23/146/293、53/146/163/293/395/432、53/146/163/395/432、53/146/163/432、53/146/293、53/163、53/163/293/395、53/163/293/395/432、53/163/293/432、53/163/432、53/293、53/293/395、53/395、53/432、146、および293から選択される、配列番号48と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号48に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換21P/23S/53C/163K/293A、21P/23S/53C/163K/293A/395D、21P/53C/146H、21P/53C/146H/163K/293A/395D/432V、21P/53C/163K/293A/395D、21P/53C/293A/432V、23S/53C/146H/163K、23S/53C/146H/163K/293A/432V、23S/53C/146H/293A/432V、23S/53C/163K、23S/53C/163K/293A/395D、23S/53C/163K/293A/432V、23S/53C/163K/395D、23S/53C/293A、23S/53C/293A/395D/432V、23S/53C/293A/432V、23S/146H/293A、53C/146H/163K/293A/395D/432V、53C/146H/163K/395D/432V、53C/146H/163K/432V、53C/146H/293A、53C/163K、53C/163K/293A/395D、53C/163K/293A/395D/432V、53C/163K/293A/432V、53C/163K/432V、53C/293A、53C/293A/395D、53C/395D、53C/432V、146H、および293Aを含み、位置は、配列番号48に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換D21P/P23S/N53C/F163K/P293A、D21P/P23S/N53C/F163K/P293A/G395D、D21P/N53C/R146H、D21P/N53C/R146H/F163K/P293A/G395D/A432V、D21P/N53C/F163K/P293A/G395D、D21P/N53C/P293A/A432V、P23S/N53C/R146H/F163K、P23S/N53C/R146H/F163K/P293A/A432V、P23S/N53C/R146H/P293A/A432V、P23S/N53C/F163K、P23S/N53C/F163K/P293A/G395D、P23S/N53C/F163K/P293A/A432V、P23S/N53C/F163K/G395D、P23S/N53C/P293A、P23S/N53C/P293A/G395D/A432V、P23S/N53C/P293A/A432V、P23S/R146H/P293A、N53C/R146H/F163K/P293A/G395D/A432V、N53C/R146H/F163K/G395D/A432V、N53C/R146H/F163K/A432V、N53C/R146H/P293A、N53C/F163K、N53C/F163K/P293A/G395D、N53C/F163K/P293A/G395D/A432V、N53C/F163K/P293A/A432V、N53C/F163K/A432V、N53C/P293A、N53C/P293A/G395D、N53C/G395D、N53C/A432V、R146H、およびP293Aを含み、位置は、配列番号48に関して番号付けされている。
一部の実施形態において、本発明は、157、163、163/164、284、および332から選択される、配列番号88と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号88に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換157A、157C、163K、163K/164G、163M、284A、および332Vを含み、位置は、配列番号88に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換S157A、S157C、F163K、F163K/P164G、F163M、S284A、およびI332Vを含み、位置は、配列番号88に関して番号付けされている。
一部の実施形態において、本発明は、31、86、149、191/208/211/286、192/294、195/207/208/286、208/294、260、284、286、294、313、395/396、および424から選択される、配列番号88と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号88に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換31M、86A、149S、191S/208P/211R/286A、192G/294A、195D/207R/208N/286G、208N/294S、208N/294T、260T、284A、286G、294A、294S、313L、313V、395D/396K、および424Aを含み、位置は、配列番号88に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換V31M、K86A、A149S、G191S/T208P/K211R/S286A、E192G/V294A、E195D/E207R/T208N/S286G、T208N/V294S、T208N/V294T、C260T、S284A、S286G、V294A、V294S、A313L、A313V、G395D/N396K、およびC424Aを含み、位置は、配列番号88に関して番号付けされている。
一部の実施形態において、本発明は、14/31/208/260/286/294/424、14/31/260/286/294/424、31、31/208、31/208/241/286/294、31/208/260/286/294、31/208/260/286/294/313/424、31/208/260/286/294/424、31/208/260/286/313/424、31/208/260/294/313/424、31/208/260/294/424、31/208/286/294、31/208/286/294/313、31/208/286/294/313/424、31/208/286/294/424、31/208/286/313/424、31/208/286/424、31/208/294、31/208/294/313/424、31/208/294/424、31/260/286、31/260/286/294/313、31/260/286/294/313/424、31/260/286/313/424、31/260/286/424、31/260/294、31/260/294/313、31/286/294、31/286/294/313、31/286/294/424、31/294/313/424、31/294/424、208/260/286/294/313/424、208/260/286/294/424、208/260/286/424、208/260/294、208/260/294/313/424、208/286/294/424、260/286/294/424、260/286/424、286/294/313/424、および286/313/424から選択される、配列番号110と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号110に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換14N/31M/208N/260T/286G/294A/424A、14N/31M/260T/286G/294A/424A、31M、31M/208N、31M/208N/241V/286G/294A、31M/208N/260T/286G/294A、31M/208N/260T/286G/294A/313E/424A、31M/208N/260T/286G/294A/313L/424A、31M/208N/260T/286G/294A/424A、31M/208N/260T/286G/313L/424A、31M/208N/260T/294A/313L/424A、31M/208N/260T/294A/424A、31M/208N/286G/294A、31M/208N/286G/294A/313L、31M/208N/286G/294A/313L/424A、31M/208N/286G/294A/424A、31M/208N/286G/313L/424A、31M/208N/286G/313V/424A、31M/208N/286G/424A、31M/208N/294A、31M/208N/294A/313L/424A、31M/208N/294A/424A、31M/260T/286G、31M/260T/286G/294A/313L、31M/260T/286G/294A/313L/424A、31M/260T/286G/313L/424A、31M/260T/286G/424A、31M/260T/294A、31M/260T/294A/313L、31M/286G/294A、31M/286G/294A/313L、31M/286G/294A/424A、31M/294A/313L/424A、31M/294A/424A、208N/260T/286G/294A/313L/424A、208N/260T/286G/294A/424A、208N/260T/286G/424A、208N/260T/294A、208N/260T/294A/313L/424A、208N/286G/294A/424A、260T/286G/294A/424A、260T/286G/424A、286G/294A/313L/424A、および286G/313L/424Aを含み、位置は、配列番号110に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Y14N/V31M/T208N/C260T/S286G/V294A/C424A、Y14N/V31M/C260T/S286G/V294A/C424A、V31M、V31M/T208N、V31M/T208N/A241V/S286G/V294A、V31M/T208N/C260T/S286G/V294A、V31M/T208N/C260T/S286G/V294A/A313E/C424A、V31M/T208N/C260T/S286G/V294A/A313L/C424A、V31M/T208N/C260T/S286G/V294A/C424A、V31M/T208N/C260T/S286G/A313L/C424A、V31M/T208N/C260T/V294A/A313L/C424A、V31M/T208N/C260T/V294A/C424A、V31M/T208N/S286G/V294A、V31M/T208N/S286G/V294A/A313L、V31M/T208N/S286G/V294A/A313L/C424A、V31M/T208N/S286G/V294A/C424A、V31M/T208N/S286G/A313L/C424A、V31M/T208N/S286G/A313V/C424A、V31M/T208N/S286G/C424A、V31M/T208N/V294A、V31M/T208N/V294A/A313L/C424A、V31M/T208N/V294A/C424A、V31M/C260T/S286G、V31M/C260T/S286G/V294A/A313L、V31M/C260T/S286G/V294A/A313L/C424A、V31M/C260T/S286G/A313L/C424A、V31M/C260T/S286G/C424A、V31M/C260T/V294A、V31M/C260T/V294A/A313L、V31M/S286G/V294A、V31M/S286G/V294A/A313L、V31M/S286G/V294A/C424A、V31M/V294A/A313L/C424A、V31M/V294A/C424A、T208N/C260T/S286G/V294A/A313L/C424A、T208N/C260T/S286G/V294A/C424A、T208N/C260T/S286G/C424A、T208N/C260T/V294A、T208N/C260T/V294A/A313L/C424A、T208N/S286G/V294A/C424A、C260T/S286G/V294A/C424A、C260T/S286G/C424A、S286G/V294A/A313L/C424A、およびS286G/A313L/C424Aを含み、位置は、配列番号110に関して番号付けされている。
一部の実施形態において、本発明は、16/272、17、19/86、19/86/321、20、21、22、22/255、22/255/362/421、22/294、22/362、24/255/362、31、41、42/187/294、66、66/190、66/394、84、114、153、157、161、163、164、164/397、221、222、272、294、320、320/435、および394から選択される、配列番号112と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号112に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換16F/272E、17M、19H/86N、19Y/86N/321Y、20A、21E、22L、22L/255A、22L/255A/362R/421I、22L/294M、22L/362R、24T/255A/362R、31T、41L、42F/187F/294M、66P、66P/190P、66P/394P、84N、84S、114A、153S、157G、157P、161R、163P、164G、164R/397P、221I、222T、272E、294M、320A、320A/435N、および394Pを含み、位置は、配列番号112に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換L16F/V272E、Y17M、F19H/K86N、F19Y/K86N/F321Y、T20A、D21E、M22L、M22L/S255A、M22L/S255A/H362R/V421I、M22L/V294M、M22L/H362R、S24T/S255A/H362R、M31T、I41L、V42F/Y187F/V294M、K66P、K66P/E190P、K66P/G394P、A84N、A84S、T114A、A153S、S157G、S157P、T161R、F163P、P164G、P164R/L397P、F221I、A222T、V272E、V294M、G320A、G320A/D435N、およびG394Pを含み、位置は、配列番号112に関して番号付けされている。
一部の実施形態において、本発明は、17、17/21、17/21/22、17/22、17/22/272、17/22/272/320、17/31/320/397、17/84/164、17/157/164、17/157/320/397、17/221/320、17/272/320、17/320、17/397、19/22/42/320/394、19/42、20/320、25/320、66/187/320、66/272、66/320、66/394、164/320/321、165、255、272、272/320、および320から選択される、配列番号120と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号120に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換17M、17M/21E、17M/21E/22L、17M/22L、17M/22L/272E、17M/22L/272E/320A、17M/31T/320A/397P、17M/84S/164R、17M/157G/164R、17M/157G/320A/397P、17M/221I/320A、17M/272E/320A、17M/320A、17M/397P、19Y/22L/42F/320A/394P、19Y/42F、20A/320A、25V/320A、66P/187F/320A、66P/272E、66P/320A、66P/394P、164R/320A/321Y、165W、255A、272E、272E/320A、および320Aを含み、位置は、配列番号120に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Y17M、Y17M/D21E、Y17M/D21E/M22L、Y17M/M22L、Y17M/M22L/V272E、Y17M/M22L/V272E/G320A、Y17M/M31T/G320A/L397P、Y17M/A84S/P164R、Y17M/S157G/P164R、Y17M/S157G/G320A/L397P、Y17M/F221I/G320A、Y17M/V272E/G320A、Y17M/G320A、Y17M/L397P、H19Y/M22L/V42F/G320A/G394P、H19Y/V42F、T20A/G320A、L25V/G320A、K66P/Y187F/G320A、K66P/V272E、K66P/G320A、K66P/G394P、P164R/G320A/F321Y、Y165W、S255A、V272E、V272E/G320A、およびG320Aを含み、位置は、配列番号120に関して番号付けされている。
一部の実施形態において、本発明は、24、24/25、24/110/167、25、25/147/167、27/190/207/389/396、27/190/207/396、41/42/66/165、42、42/66/165/394、42/165/272/394、66/164、66/164/272、66/165、66/394、163、164、164/165/394、165、165/272、165/394、166、167、190、190/207、190/207/210、190/207/210/385/389、190/207/385、190/210、190/385/396、190/389、207、207/210/243/250/385/389、207/214/396、207/243、207/389、210、210/385、214、214/396、272/394、283、385、385/389、389、389/396、および394から選択される、配列番号138と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号138に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換24T、24T/25V、24T/110L/167E、25V、25V/147V/167E、27D/190P/207D/389T/396S、27D/190P/207D/396S、41L/42F/66P/165W、42F、42F/66P/165W/394P、42F/165W/272E/394P、66P/164R、66P/164R/272E、66P/165W、66P/394P、163L、164N、164R/165W/394P、164S、165W、165W/272E、165W/394P、166A、166L、166T、167E、190P、190P/207D、190P/207D/210A、190P/207D/210A/385A/389T、190P/207D/385A、190P/210A、190P/385A/396S、190P/389T、207D、207D/210A/243Q/250G/385A/389T、207D/214P/396S、207D/243Q、207D/389T、210A、210A/385A、214P、214P/396S、272E/394P、283C、385A、385A/389T、389T、389T/396S、および394Pを含み、位置は、配列番号138に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換S24T、S24T/L25V、S24T/R110L/S167E、L25V、L25V/W147V/S167E、Q27D/E190P/E207D/S389T/N396S、Q27D/E190P/E207D/N396S、I41L/V42F/K66P/Y165W、V42F、V42F/K66P/Y165W/G394P、V42F/Y165W/V272E/G394P、K66P/P164R、K66P/P164R/V272E、K66P/Y165W、K66P/G394P、F163L、P164N、P164R/Y165W/G394P、P164S、Y165W、Y165W/V272E、Y165W/G394P、N166A、N166L、N166T、S167E、E190P、E190P/E207D、E190P/E207D/Q210A、E190P/E207D/Q210A/K385A/S389T、E190P/E207D/K385A、E190P/Q210A、E190P/K385A/N396S、E190P/S389T、E207D、E207D/Q210A/L243Q/D250G/K385A/S389T、E207D/A214P/N396S、E207D/L243Q、E207D/S389T、Q210A、Q210A/K385A、A214P、A214P/N396S、V272E/G394P、S283C、K385A、K385A/S389T、S389T、S389T/N396S、およびG394Pを含み、位置は、配列番号138に関して番号付けされている。
一部の実施形態において、本発明は、12/26/30/291、12/26/73/77/291、13/45/107/236/277/346/351/410/429、22/25/110/291/304、24/147/164/166/167/243/389、24/166、24/166/190、24/166/207、26/30、26/30/168/291、30/77/291、30/291、70/77/108/177/196/247/291/309/361/366、70/77/168/291、70/177/291/361/366、70/177/291/372、70/186、70/247/291/309/372、70/291、70/291/304/361、74、74/211、77/110/291/308、77/291/361/366、107/277/346/410/429、107/346、110/235/391、147/164/166/167、147/164/166/243/272/283/385/389、147/164/166/272、163、166、166/167/272/389、166/190、166/190/207、166/207、177/195/196/291/304/309/366、177/196/247/304/309/361/366、177/291/309/361、196/291/304/361、196/291/309/361、198/235/391、207、247/304/309/366、253/391、277、291、291/304/309、および291/309から選択される、配列番号156と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドであって、位置は、配列番号156に関して番号付けされている、操作されたトランスアミナーゼポリペプチドを提供する。一部の実施形態において、アミノ酸の違いは、置換12D/26K/30P/291Y、12D/26R/73C/77R/291Y、13A/45N/107E/236E/277V/346L/351A/410H/429M、22L/25V/110K/291Y/304A、24T/147V/164S/166A/167E/243Q/389T、24T/166A、24T/166A/190P、24T/166A/207D、24T/166L、26K/30P/168E/291Y、26R/30P、30P/77R/291Y、30P/291Y、70E/77D/108R/177I/196E/247K/291Y/309A/361A/366H、70E/77R/168E/291Y、70E/177I/291Y/361A/366H、70E/177I/291Y/372W、70E/186C、70E/247K/291Y/309A/372W、70E/291Y、70E/291Y/304A/361A、74A、74A/211R、77D/110K/291Y/308Q、77D/291Y/361A/366H、107E/277V/346L/410H/429M、107E/346L、110K/235S/391T、147V/164R/166A/167E、147V/164R/166A/243Q/272E/283C/385A/389T、147V/164R/166A/272E、163Y、166A、166A/167E/272E/389T、166A/190P、166A/190P/207D、166A/207D、166G、166S、166S/207D、166V、177I/195A/196E/291Y/304A/309A/366H、177I/196E/247K/304A/309A/361A/366H、177I/291Y/309A/361A、196E/291Y/304A/361A、196E/291Y/309A/361A、198T/235S/391T、207D、247K/304A/309A/366H、253L/391T、277V、291Y、291Y/304A/309A、および291Y/309Aを含み、位置は、配列番号156に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換E12D/H26K/T30P/F291Y、E12D/H26R/K73C/E77R/F291Y、T13A/H45N/D107E/K236E/T277V/A346L/R351A/L410H/L429M、M22L/L25V/R110K/F291Y/S304A、S24T/W147V/P164S/N166A/S167E/L243Q/S389T、S24T/N166A、S24T/N166A/E190P、S24T/N166A/E207D、S24T/N166L、H26K/T30P/V168E/F291Y、H26R/T30P、T30P/E77R/F291Y、T30P/F291Y、D70E/E77D/S108R/L177I/Q196E/R247K/F291Y/T309A/K361A/R366H、D70E/E77R/V168E/F291Y、D70E/L177I/F291Y/K361A/R366H、D70E/L177I/F291Y/Y372W、D70E/R186C、D70E/R247K/F291Y/T309A/Y372W、D70E/F291Y、D70E/F291Y/S304A/K361A、T74A、T74A/K211R、E77D/R110K/F291Y/E308Q、E77D/F291Y/K361A/R366H、D107E/T277V/A346L/L410H/L429M、D107E/A346L、R110K/A235S/A391T、W147V/P164R/N166A/S167E、W147V/P164R/N166A/L243Q/V272E/S283C/K385A/S389T、W147V/P164R/N166A/V272E、F163Y、N166A、N166A/S167E/V272E/S389T、N166A/E190P、N166A/E190P/E207D、N166A/E207D、N166G、N166S、N166S/E207D、N166V、L177I/E195A/Q196E/F291Y/S304A/T309A/R366H、L177I/Q196E/R247K/S304A/T309A/K361A/R366H、L177I/F291Y/T309A/K361A、Q196E/F291Y/S304A/K361A、Q196E/F291Y/T309A/K361A、V198T/A235S/A391T、E207D、R247K/S304A/T309A/R366H、V253L/A391T、T277V、F291Y、F291Y/S304A/T309A、およびF291Y/T309Aを含み、位置は、配列番号156に関して番号付けされている。
一部の実施形態において、トランスアミナーゼ活性を有する操作されたポリペプチドは、適切な反応条件下で、化合物(2)を化合物(1)に、参照ポリペプチド(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)の基質許容範囲と比べて、基質の存在について増大した許容範囲で、変換する能力がある。したがって、一部の実施形態において、操作されたポリペプチドは、少なくとも約1g/L、5g/L、10g/L、20g/L、約30g/L、約40g/L、約50g/L、約70g/L、約75g/L、約100g/Lの基質負荷量濃度の存在下で、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約94%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の変換パーセントで、約72時間、約48時間、約36時間、約24時間、またはさらにそれより短い時間の反応時間で、適切な反応条件下で、化合物(2)の基質を化合物(1)に変換する能力がある。
操作されたポリペプチドの上記の改善された特性が、ポリペプチドの濃度または量、基質、アミンドナー、補助因子、緩衝液、共溶媒、pHに関して決定され得る一部の適切な反応条件、ならびに/または温度および反応時間を含む条件が、本明細書において提供される。一部の実施形態において、適切な反応条件は、以下および実施例において記載されるHTP、SFP、またはDSPアッセイ条件を含む。
当業者にとって明らかである通り、前述の残基位置およびそれぞれの残基位置についての具体的なアミノ酸残基を、個別にまたは様々な組み合わせで使用して、増大した温度、溶媒、および/またはpHのような、様々な条件下で、数ある中でも、酵素活性、基質/生成物の優先度、立体選択性、基質/生成物許容範囲、および安定性を含む、所望の改善された特性を有するトランスアミナーゼポリペプチドを合成することができる。
一部の実施形態において、本発明はまた、機能的トランスアミナーゼ活性および/または操作されたトランスアミナーゼポリペプチドの改善された特性を保持する、本明細書において記載される操作されたトランスアミナーゼポリペプチドのいずれかの断片を含む操作されたトランスアミナーゼポリペプチドを提供する。したがって、一部の実施形態において、本発明は、トランスアミナーゼ活性(例えば、適切な反応条件下で、化合物(2)を化合物(1)に変換する能力がある)を有するポリペプチド断片であって、断片が、配列番号6~172の偶数番号の配列識別子を有する例示的な操作されたポリペプチドのような、本発明の操作されたポリペプチドの全長アミノ酸配列の少なくとも約80%、90%、95%、98%、または99%を含む、ポリペプチド断片を提供する。
一部の実施形態において、本発明の操作されたトランスアミナーゼポリペプチドは、配列番号6~172の偶数番号の配列識別子を有する例示的な操作されたポリペプチド配列のような、本明細書において記載される操作されたトランスアミナーゼポリペプチド配列のいずれか1つと比較して、欠失を含むアミノ酸配列を含む。したがって、本発明の操作されたトランスアミナーゼポリペプチドのそれぞれおよび全ての実施形態について、アミノ酸配列は、1つもしくは複数のアミノ酸、2つもしくはそれより多いアミノ酸、3つもしくはそれより多いアミノ酸、4つもしくはそれより多いアミノ酸、5つもしくはそれより多いアミノ酸、6つもしくはそれより多いアミノ酸、8つもしくはそれより多いアミノ酸、10もしくはそれより多いアミノ酸、15もしくはそれより多いアミノ酸、または20もしくはそれより多いアミノ酸、トランスアミナーゼポリペプチドのアミノ酸の総数の最大10%、アミノ酸の総数の最大10%、アミノ酸の総数の最大20%、またはアミノ酸の総数の最大30%の欠失を含むことができ、本明細書において記載される操作されたトランスアミナーゼの関連する機能的活性および/または改善された特性は、維持される。一部の実施形態において、欠失は、1~2、1~3、1~4、1~5、1~6、1~7、1~8、1~9、1~10、1~15、1~20、1~21、1~22、1~23、1~24、1~25、1~30、1~35、1~40、1~45、1~50、1~55、または1~60個のアミノ酸残基を含み得る。一部の実施形態において、欠失の数は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45、50、55、または60個のアミノ酸残基であり得る。一部の実施形態において、欠失は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、20、21、22、23、24、25または30個のアミノ酸残基の欠失を含み得る。
一部の実施形態において、本発明は、配列番号6~172の偶数番号の配列識別子を有する例示的な操作されたポリペプチド配列のような、本明細書において記載される操作されたトランスアミナーゼポリペプチド配列のいずれか1つと比較して、挿入を含むアミノ酸配列を有する操作されたトランスアミナーゼポリペプチドを提供する。したがって、本発明のトランスアミナーゼポリペプチドのそれぞれおよび全ての実施形態について、挿入は、1つもしくは複数のアミノ酸、2つもしくはそれより多いアミノ酸、3つもしくはそれより多いアミノ酸、4つもしくはそれより多いアミノ酸、5つもしくはそれより多いアミノ酸、6つもしくはそれより多いアミノ酸、8つもしくはそれより多いアミノ酸、10もしくはそれより多いアミノ酸、15もしくはそれより多いアミノ酸、または20もしくはそれより多いアミノ酸を含むことができ、本明細書において記載される操作されたトランスアミナーゼの関連する機能的活性および/または改善された特性は、維持される。挿入は、トランスアミナーゼポリペプチドのアミノもしくはカルボキシ末端、または内部にあり得る。
一部の実施形態において、本発明のポリペプチドは、融合ポリペプチドの形態であり、操作されたポリペプチドは、例示および限定でない目的で、抗体タグ(例えば、mycエピトープ)、精製配列(例えば、金属への結合のためのHisタグ)、および細胞局在化シグナル(例えば、分泌シグナル)のような、他のポリペプチドに融合される。したがって、他のポリペプチドへの融合を含む、または含まない、本明細書において記載される操作されたポリペプチドが、使用され得る。
本明細書において記載される操作されたトランスアミナーゼポリペプチドは、遺伝子でコードされるアミノ酸に制限されない。したがって、遺伝子でコードされるアミノ酸に加えて、本明細書において記載されるポリペプチドは、天然に存在するおよび/もしくは合成の非コードアミノ酸から、全体または一部のいずれかで構成され得る。本明細書において記載されるポリペプチドを構成し得る、ある特定の一般的に遭遇するコードされないアミノ酸は、これらに限定されないが、遺伝子でコードされるアミノ酸のD-立体異性体;2,3-ジアミノプロピオン酸(Dpr);α-アミノイソ酪酸(Aib);ε-アミノヘキサン酸(Aha);δ-アミノ吉草酸(Ava);N-メチルグリシンまたはサルコシン(MeGlyまたはSar);オルニチン(Orn);シトルリン(Cit);t-ブチルアラニン(Bua);t-ブチルグリシン(Bug);N-メチルイソロイシン(MeIle);フェニルグリシン(Phg);シクロヘキシルアラニン(Cha);ノルロイシン(Nle);ナフチルアラニン(Nal);2-クロロフェニルアラニン(Ocf);3-クロロフェニルアラニン(Mcf);4-クロロフェニルアラニン(Pcf);2-フルオロフェニルアラニン(Off);3-フルオロフェニルアラニン(Mff);4-フルオロフェニルアラニン(Pff);2-ブロモフェニルアラニン(Obf);3-ブロモフェニルアラニン(Mbf);4-ブロモフェニルアラニン(Pbf);2-メチルフェニルアラニン(Omf);3-メチルフェニルアラニン(Mmf);4-メチルフェニルアラニン(Pmf);2-ニトロフェニルアラニン(Onf);3-ニトロフェニルアラニン(Mnf);4-ニトロフェニルアラニン(Pnf);2-シアノフェニルアラニン(Ocf);3-シアノフェニルアラニン(Mcf);4-シアノフェニルアラニン(Pcf);2-トリフルオロメチルフェニルアラニン(Otf);3-トリフルオロメチルフェニルアラニン(Mtf);4-トリフルオロメチルフェニルアラニン(Ptf);4-アミノフェニルアラニン(Paf);4-ヨードフェニルアラニン(Pif);4-アミノメチルフェニルアラニン(Pamf);2,4-ジクロロフェニルアラニン(Opef);3,4-ジクロロフェニルアラニン(Mpcf);2,4-ジフルオロフェニルアラニン(Opff);3,4-ジフルオロフェニルアラニン(Mpff);ピリド-2-イルアラニン(2pAla);ピリド-3-イルアラニン(3pAla);ピリド-4-イルアラニン(4pAla);ナフト-1-イルアラニン(1nAla);ナフト-2-イルアラニン(2nAla);チアゾリルアラニン(taAla);ベンゾチエニルアラニン(bAla);チエニルアラニン(tAla);フリルアラニン(fAla);ホモフェニルアラニン(hPhe);ホモチロシン(hTyr);ホモトリプトファン(hTrp);ペンタフルオロフェニルアラニン(5ff);スチリルカラニン(sAla);アウトリルアラニン(aAla);3,3-ジフェニルアラニン(Dfa);3-アミノ-5-フェニペンタン酸(Afp);ペニシラミン(Pen);1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸(Tic);β-2-チエニルアラニン(Thi);メチオニンスルホキシド(Mso);N(w)-ニトロアルギニン(nArg);ホモリシン(hLys);ホスホノメチルフェニルアラニン(pmPhe);ホスホセリン(pSer);ホスホスレオニン(pThr);ホモアスパラギン酸(hAsp);ホモグルタミン酸(hGlu);1-アミノシクロペンタ-(2または3)-エン-4カルボン酸;ピペコリン酸(PA)、アゼチジン-3-カルボン酸(ACA);1-アミノシクロペンタン-3-カルボン酸;アリルグリシン(aOly);プロパルギルグリシン(pgGly);ホモアラニン(hAla);ノルバリン(nVal);ホモロイシン(hLeu)、ホモバリン(hVal);ホモイソロイシン(hIle);ホモアルギニン(hArg);N-アセチルリシン(AcLys);2,4-ジアミノ酪酸(Dbu);2,3-ジアミノ酪酸(Dab);N-メチルバリン(MeVal);ホモシステイン(hCys);ホモセリン(hSer);ヒドロキシプロリン(Hyp)およびホモプロリン(hPro)を含む。本明細書において記載されるポリペプチドを構成し得る、追加のコードされないアミノ酸は、当業者に明らかであろう。これらのアミノ酸は、LまたはD配置のいずれかであり得る。
当業者は、側鎖保護基を有するアミノ酸または残基がまた、本明細書において記載されるポリペプチドを構成し得ることを理解するであろう。かかる保護されたアミノ酸の非限定的な例は、芳香族のカテゴリーに属するこの場合において、これらに限定されないが、Arg(tos)、Cys(メチルベンジル)、Cys(ニトロピリジンスルフェニル)、Glu(δ-ベンジルエステル)、Gln(キサンチル)、Asn(N-δ-キサンチル)、His(bom)、His(ベンジル)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-ベンジル)、Thr(O-ベンジル)およびTyr(O-ベンジル)を含む(保護基が丸括弧内に列挙される)。
本明細書において記載されるポリペプチドを構成し得る、コンフォメーション上拘束された非コードアミノ酸は、これらに限定されないが、N-メチルアミノ酸(L-配置);1-アミノシクロペンタ-(2または3)-エン-4-カルボン酸;ピペコリン酸;アゼチジン-3-カルボン酸;ホモプロリン(hPro);および1-アミノシクロペンタン-3-カルボン酸を含む。
一部の実施形態において、操作されたポリペプチドは、膜、樹脂、固体担体、または他の固相物質のような固体支持体上で提供され得る。固体支持体は、ポリスチレン、ポリエチレン、ポリプロピレン、ポリフルオロエチレン、ポリエチレンオキシ、およびポリアクリルアミド、ならびにそれらのコポリマーおよびグラフトのような有機ポリマーで構成され得る。固体支持体はまた、無機、例えば、ガラス、シリカ、制御孔質ガラス(controlled pore glass)(CPG)、逆相シリカまたは金属、例えば、金または白金であり得る。固体支持体の構成は、ビーズ、球、粒子、顆粒、ゲル、膜または表面の形態であり得る。表面は、平面、実質的に平面、または非平面であり得る。固体支持体は、多孔性または非多孔性であり得、膨張または非膨張特徴を有し得る。固体支持体は、ウェル、くぼみ、または他の容器、器、特色、または場所の形態で構成され得る。
一部の実施形態において、トランスアミナーゼ活性を有する操作されたポリペプチドは、それらが、参照ポリペプチド(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)と比べて、それらの改善された活性、エナンチオ選択性、立体選択性、および/または他の改善された特性を保持するように、固体支持体上に結合されるか、または固定される。かかる実施形態において、固定されたポリペプチドは、基質化合物から所望の生成物への生体触媒性変換を促進し得、反応が完了した後、容易に保持され(例えば、ポリペプチドが固定されているビーズを保持することにより)、次に、続く反応において再使用されるか、または再利用される。かかる固定された酵素プロセスは、さらなる効率化およびコストの低減を可能にする。したがって、本発明の操作されたトランスアミナーゼポリペプチドを使用する方法のいずれかは、固体支持体上に結合されたか、または固定された同じトランスアミナーゼポリペプチドを使用して行われ得ることが、さらに考慮される。
操作されたトランスアミナーゼポリペプチドは、非共有結合されるか、または共有結合され得る。酵素を固体支持体(例えば、樹脂、膜、ビーズ、ガラスなど)にコンジュゲートし、固定化する様々な方法は、当技術分野において周知である。特に、PCT公開である国際公開第2012/177527A1号は、化合物(2)を化合物(1)に変換する能力がある固定化された操作されたトランスアミナーゼポリペプチド、および固定化されたポリペプチドを調製する方法を開示しており、ポリペプチドが、疎水性相互作用または共有結合のいずれかにより、樹脂に物理的に結合され、少なくとも最大100%の有機溶媒を含む溶媒系において安定である。酵素を固体支持体(例えば、樹脂、膜、ビーズ、ガラスなど)にコンジュゲートし、固定化する他の方法は、当技術分野において周知である(例えば、Yiら、Proc. Biochem., 42:895-898[2007];Martinら、Appl. Microbiol. Biotechnol., 76:843-851[2007];Koszelewskiら、J. Mol. Cat. B: Enz., 63:39-44[2010];Truppoら、Org. Proc. Res. Develop.、dx.doi.org/10.1021/op200157cにて公開;およびMateoら、Biotechnol. Prog., 18:629-34[2002]などを参照)。
本発明の操作されたトランスアミナーゼポリペプチドを固定化するのに有用な固体支持体は、これらに限定されないが、エポキシド官能基を有するポリメタクリレート、アミノエポキシド官能基を有するポリメタクリレート、スチレン/DVBコポリマーもしくはオクタデシル官能基を有するポリメタクリレートを含むビーズまたは樹脂を含む。本発明の操作されたトランスアミナーゼを固定化するのに有用な例示的な固体支持体は、これらに限定されないが、キトサンビーズ、Eupergit C、ならびに次の異なるタイプのSEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119およびEXE120を含む、SEPABEAD(Mitsubishi)を含む。
一部の実施形態において、操作されたトランスアミナーゼポリペプチドは、ポリペプチドが、位置が別個になった場所に配置されているアレイの形態で提供され得る。一部の実施形態において、位置が別個になった場所は、96ウェルプレートのような固体支持体におけるウェルである。複数の支持体は、アレイ上、試薬のロボットデリバリーのためアドレス指定可能な、または検出方法および/もしくは装置により様々な場所で構成され得る。かかるアレイを使用して、ポリペプチドによる変換のための様々な基質化合物を試験することができる。
一部の実施形態において、本明細書において記載される操作されたポリペプチドは、キットの形態で提供することができる。キット中のポリペプチドは、個別に、または複数のポリペプチドとして存在してもよい。キットは、酵素反応を行うための試薬、ポリペプチドの活性を評価するための基質、および生成物を検出するための試薬をさらに含み得る。キットはまた、試薬ディスペンサおよびキットの使用のための指示を含むことができる。一部の実施形態において、本発明のキットは、複数の異なる操作されたトランスアミナーゼポリペプチドを異なるアドレス指定可能な位置において含むアレイを含み、異なるポリペプチドは、少なくとも1つの異なる改善された酵素特性をそれぞれ有する参照配列の異なるバリアントである。複数の操作されたポリペプチドを含むかかるアレイおよびその使用方法は、公知である(例えば、国際公開第2009/008908A2号を参照)。
操作されたトランスアミナーゼポリペプチドの調製に有用なポリヌクレオチド、調節配列、発現ベクター、および宿主細胞
別の態様において、本発明は、本明細書において記載されるトランスアミナーゼ活性を有する操作されたポリペプチドをコードするポリヌクレオチドを提供する。ポリヌクレオチドは、ポリペプチドを発現する能力がある組換えポリヌクレオチドを得るために遺伝子発現を制御する1つまたは複数の異種制御配列に作動可能に連結されていてもよい。操作されたトランスアミナーゼをコードする異種ポリヌクレオチドを含有する発現構築物を適切な宿主細胞に導入して、対応する操作されたトランスアミナーゼポリペプチドを発現させることができる。
一部の実施形態において、改善されたトランスアミナーゼポリペプチドをコードする単離されたポリヌクレオチドを、様々な方法で操作して、ポリペプチドの改善された活性および/または発現がもたらされる。単離されたポリヌクレオチドの操作が、発現ベクターに依存して、ベクターへのその挿入に先立ち、望ましいか、または必要であり得る。組換えDNA方法を利用するポリヌクレオチドおよび核酸配列を修飾するための技術は、当技術分野において周知である。
当業者は、遺伝子コードの縮重に起因して、本発明のバリアントトランスアミナーゼアシラーゼポリペプチドをコードする多数のヌクレオチド配列が存在することを理解する。例えば、コドンAGA、AGG、CGA、CGC、CGG、およびCGUは全て、アミノ酸のアルギニンをコードする。したがって、アルギニンがコドンにより指定される、本発明の核酸における各位置において、コドンは、コードされるポリペプチドを変更することなく、上で記載された対応するコドンのいずれかに変更することができる。RNA配列における「U」は、DNA配列における「T」に対応することが、理解される。本発明は、可能性のあるコドン選択に基づき組み合わせを選択することによりなされ得る本発明のポリペプチドをコードする核酸配列のそれぞれおよび全ての可能性のあるバリエーションを考慮し、提供する。
上で示された通り、トランスアミナーゼをコードするDNA配列はまた、高コドン使用頻度バイアスコドン(同じアミノ酸をコードする他のコドンより、タンパク質コード領域において高い頻度で使用されるコドン)について設計されてもよい。好ましいコドンは、単一遺伝子、共通の機能もしくは起源の遺伝子のセット、高度に発現される遺伝子、全生物の凝集タンパク質コード領域のコドン頻度、関連する生物の凝集タンパク質コード領域のコドン頻度、またはそれらの組み合わせにおけるコドン使用頻度に関して決定されてもよい。頻度が遺伝子発現のレベルに伴い増大するコドンは、典型的には、発現に最適なコドンである。特に、DNA配列は、特定の宿主生物における発現のため最適化することができる。多変量解析(例えば、クラスター解析またはコレスポンデンス解析を使用する)および遺伝子において使用される有効な数のコドンを含む、コドン頻度(例えば、同義コドン使用頻度と比べた、コドン使用頻度)ならびに特定の生物におけるコドン優先度を決定するための様々な方法が、当技術分野において周知である。コドン使用頻度を得るためのデータ供給源は、タンパク質をコードする能力がある任意の利用可能なヌクレオチド配列に頼ってもよい。これらのデータセットは、当技術分野において周知である、発現されたタンパク質をコードすることが実際に公知の核酸配列(例えば、完全なタンパク質コード配列-CDS)、発現された配列タグ(EST)、またはゲノム配列の予想コード領域を含む。バリアントトランスアミナーゼをコードするポリヌクレオチドは、当技術分野において公知の任意の適切な方法を使用して調製することができる。典型的には、オリゴヌクレオチドは、個別に合成され、次に、結合させて(例えば、酵素もしくは化学ライゲーション方法、またはポリメラーゼにより媒介される方法)、本質的に任意の所望の連続配列を形成させる。一部の実施形態において、本発明のポリヌクレオチドは、自動合成方法を含むが、これに限定されない、当技術分野において公知の任意の適切な方法を使用する化学合成により調製される。例えば、ホスホルアミダイト方法において、オリゴヌクレオチドが、合成され(例えば、自動DNA合成装置において)、精製され、アニーリングされ、ライゲーションされ、適切なベクターにおいてクローニングされる。一部の実施形態において、次に、2本鎖DNA断片は、相補鎖を合成し、適切な条件下で一緒に鎖をアニーリングさせる、または適切なプライマー配列を用いてDNAポリメラーゼを使用して相補鎖を加える、のいずれかにより、得られる。当業者に周知の、本発明において有用な方法を提供する多数の一般的および標準的なテキストが存在する。
例えば、変異誘発および指向性進化法をポリヌクレオチドに容易に適用して、発現され、スクリーニングされ、アッセイされ得るバリアントライブラリーを得ることができる。変異誘発および指向性進化法は、当技術分野において周知である(例えば、これらの全てが参照により本明細書に組み込まれる、米国特許第5,605,793号、同第5,811,238号、同第5,830,721号、同第5,834,252号、同第5,837,458号、同第5,928,905号、同第6,096,548号、同第6,117,679号、同第6,132,970号、同第6,165,793号、同第6,180,406号、同第6,251,674号、同第6,265,201号、同第6,277,638号、同第6,287,861号、同第6,287,862号、同第6,291,242号、同第6,297,053号、同第6,303,344号、同第6,309,883号、同第6,319,713号、同第6,319,714号、同第6,323,030号、同第6,326,204号、同第6,335,160号、同第6,335,198号、同第6,344,356号、同第6,352,859号、同第6,355,484号、同第6,358,740号、同第6,358,742号、同第6,365,377号、同第6,365,408号、同第6,368,861号、同第6,372,497号、同第6,337,186号、同第6,376,246号、同第6,379,964号、同第6,387,702号、同第6,391,552号、同第6,391,640号、同第6,395,547号、同第6,406,855号、同第6,406,910号、同第6,413,745号、同第6,413,774号、同第6,420,175号、同第6,423,542号、同第6,426,224号、同第6,436,675号、同第6,444,468号、同第6,455,253号、同第6,479,652号、同第6,482,647号、同第6,483,011号、同第6,484,105号、同第6,489,146号、同第6,500,617号、同第6,500,639号、同第6,506,602号、同第6,506,603号、同第6,518,065号、同第6,519,065号、同第6,521,453号、同第6,528,311号、同第6,537,746号、同第6,573,098号、同第6,576,467号、同第6,579,678号、同第6,586,182号、同第6,602,986号、同第6,605,430号、同第6,613,514号、同第6,653,072号、同第6,686,515号、同第6,703,240号、同第6,716,631号、同第6,825,001号、同第6,902,922号、同第6,917,882号、同第6,946,296号、同第6,961,664号、同第6,995,017号、同第7,024,312号、同第7,058,515号、同第7,105,297号、同第7,148,054号、同第7,220,566号、同第7,288,375号、同第7,384,387号、同第7,421,347号、同第7,430,477号、同第7,462,469号、同第7,534,564号、同第7,620,500号、同第7,620,502号、同第7,629,170号、同第7,702,464号、同第7,747,391号、同第7,747,393号、同第7,751,986号、同第7,776,598号、同第7,783,428号、同第7,795,030号、同第7,853,410号、同第7,868,138号、同第7,783,428号、同第7,873,477号、同第7,873,499号、同第7,904,249号、同第7,957,912号、同第7,981,614号、同第8,014,961号、同第8,029,988号、同第8,048,674号、同第8,058,001号、同第8,076,138号、同第8,108,150号、同第8,170,806号、同第8,224,580号、同第8,377,681号、同第8,383,346号、同第8,457,903号、同第8,504,498号、同第8,589,085号、同第8,762,066号、同第8,768,871号、第同9,593,326号、および全ての関連する米国以外の対応物;Lingら、Anal. Biochem., 254(2):157-78[1997];Daleら、Meth. Mol. Biol., 57:369-74[1996]、;Smith、Ann. Rev. Genet., 19:423-462[1985];Botsteinら、Science, 229:1193-1201[1985];Carter, Biochem. J., 237:1-7[1986];Kramerら、Cell, 38:879-887[1984];Wellsら、Gene, 34:315-323[1985];Minshullら、Curr. Op. Chem. Biol., 3:284-290[1999];Christiansら、Nat. Biotechnol., 17:259-264[1999];Crameriら、Nature, 391:288-291[1998];Crameriら、Nat. Biotechnol., 15:436-438[1997];Zhangら、Proc. Nat. Acad. Sci. U.S.A., 94:4504-4509[1997];Crameriら、Nat. Biotechnol., 14:315-319[1996];Stemmer, Nature, 370:389-391[1994];Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751[1994];国際公開第95/22625号;国際公開第97/0078号;国際公開第97/35966号;国際公開第98/27230号;国際公開第00/42651号;国際公開第01/75767号;および国際公開第2009/152336号を参照)。
一部の実施形態において、ポリヌクレオチドは、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156の偶数番号の配列識別子から選択される参照配列に対して少なくとも約80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれより高く同一であるアミノ酸配列を含むトランスアミナーゼポリペプチドをコードし、ポリペプチドは、トランスアミナーゼ活性および本明細書において記載される改善された特性の1つまたは複数、例えば、化合物(2)を、参照配列(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156のポリペプチド)と比較して増大した活性で、生成物化合物(1)に変換する能力を有する。一部の実施形態において、参照配列は、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156から選択される。一部の実施形態において、参照配列は、配列番号4である。一部の実施形態において、参照配列は、配列番号18である。一部の実施形態において、参照配列は、配列番号20である。一部の実施形態において、参照配列は、配列番号30である。一部の実施形態において、参照配列は、配列番号48である。一部の実施形態において、参照配列は、配列番号66である。一部の実施形態において、参照配列は、配列番号70である。一部の実施形態において、参照配列は、配列番号88である。一部の実施形態において、参照配列は、配列番号110である。一部の実施形態において、参照配列は、配列番号112である。一部の実施形態において、参照配列は、配列番号120である。一部の実施形態において、参照配列は、配列番号138である。一部の実施形態において、参照配列は、配列番号156である。
一部の実施形態において、ポリヌクレオチドは、上で記載されたパーセント同一性を有し、(a)配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードする。一部の実施形態において、本発明は、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156の参照配列に対して少なくとも80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれより高い配列同一性ならびに(a)本明細書において提供される置換から選択される少なくとも1つのアミノ酸残基の違い(例えば、表6.1、7.1、8.1、9.1、10.1、11.1、12.1、13.1、13.2、14.1、15.1、16.1、17.1、および18.1を参照)を有するアミノ酸配列を含むトランスアミナーゼ活性を有する操作されたポリペプチドを提供する。
一部の実施形態において、操作されたトランスアミナーゼポリペプチドをコードするポリヌクレオチドは、配列番号5~171の奇数番号の配列識別子から選択される配列を含む。一部の実施形態において、ポリヌクレオチド配列は、配列番号3、17、19、29、47、65、69、87、109、111、119、137、および155から選択される。一部の実施形態において、本発明は、トランスアミナーゼ活性を有するポリペプチドをコードする操作されたポリヌクレオチドを提供し、操作されたポリペプチドは、配列番号3、17、19、29、47、65、69、87、109、111、119、137、および155から選択される少なくとも1つの参照配列に対して少なくとも80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれより高い配列同一性を有する。
一部の実施形態において、本発明は、中程度にストリンジェントまたは高度にストリンジェントな条件のような、規定の条件下で、本発明の操作されたトランスアミナーゼをコードするポリヌクレオチド配列(またはその相補体)にハイブリダイズするポリヌクレオチドを提供する。一部の実施形態において、ポリヌクレオチドは、高度にストリンジェントな条件下で、配列番号5~171の奇数番号の配列識別子を有する配列から選択されるポリヌクレオチド、またはその相補体にハイブリダイズする能力があり、本明細書において記載される改善された特性の1つまたは複数を有するトランスアミナーゼ活性を有するポリペプチドをコードする。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、17、17/259/347、20、45/48/78/81/92、57、57/319、85、86、157、158、161、203/416、314、316、319、375/416、404、415、416、417、420、421、422、および424から選択される、配列番号4と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号4に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換17V/259T/347K、17W、20R、45R/48L/78C/81V/92H、57I、57T/319E、85G、85S、85V、86A、86G、157C、157G、157P、157T、158S、161G、203H/416G、203H/416S、314R、316K、316L、316M、316S、319G、319L、319V、375L/416F、404T、404V、415V、416C、416G、416S、416Y、417G、417M、417P、420G、421I、422A、422G、422R、424A、および424Rを含み、位置は、配列番号4に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Y17V/I259T/E347K、Y17W、T20R、H45R/R48L/R78C/G81V/Q92H、L57I、L57T/H319E、F85G、F85S、F85V、S86A、S86G、S157C、S157G、S157P、S157T、A158S、T161G、R203H/P416G、R203H/P416S、I314R、E316K、E316L、E316M、E316S、H319G、H319L、H319V、I375L/P416F、A404T、A404V、R415V、P416C、P416G、P416S、P416Y、L417G、L417M、L417P、S420G、V421I、V422A、V422G、V422R、C424A、およびC424Rを含み、位置は、配列番号4に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、5/17/86/157/259/314/316/422、17/86/157/203/259/314/316/422、17/86/157/314/316/347/422、17/86/157/316/422、85/86、86/157/314/316/347/416/422、86/157/416、86/203/316/416、86/203/316/422、86/316/416、139/221/310/316、157/316、195/316、207/316、227/422、280/381/416/445、314、314/316、316、416、417、および422から選択される、配列番号18と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号18に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換5H/17V/86G/157G/259T/314R/316S/422R、17V/86A/157G/316M/422A、17V/86G/157G/203H/259T/314R/316L/422R、17V/86G/157G/316M/422R、17V/86G/157T/316M/422R、17W/86A/157T/314R/316M/347K/422R、85F/86G、86A/157G/314R/316S/347K/416C/422A、86A/203H/316M/416G、86A/203H/316M/422G、86A/316S/416C、86G/157T/416G、139H/221I/310E/316G、157T/316M、195K/316S、207K/316T、227F/422G、280E/381V/416G/445R、314R、314R/316M、316C、316F、316G、316M、316S、316W、316Y、416A、416G、416S、417M、および422Cを含み、位置は、配列番号18に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Q5H/Y17V/S86G/S157G/I259T/I314R/E316S/V422R、Y17V/S86A/S157G/E316M/V422A、Y17V/S86G/S157G/R203H/I259T/I314R/E316L/V422R、Y17V/S86G/S157G/E316M/V422R、Y17V/S86G/S157T/E316M/V422R、Y17W/S86A/S157T/I314R/E316M/E347K/V422R、V85F/S86G、S86A/S157G/I314R/E316S/E347K/P416C/V422A、S86A/R203H/E316M/P416G、S86A/R203H/E316M/V422G、S86A/E316S/P416C、S86G/S157T/P416G、Q139H/F221I/A310E/E316G、S157T/E316M、E195K/E316S、E207K/E316T、G227F/V422G、A280E/L381V/P416G/L445R、I314R、I314R/E316M、E316C、E316F、E316G、E316M、E316S、E316W、E316Y、P416A、P416G、P416S、L417M、およびV422Cを含み、位置は、配列番号18に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、17/139/314/416/417/422、17/195/316/414/416/422、17/314/316/414/416、17/314/316/414/416/417/422、20、31、54、57、83、86、86/194、121、139/195/227/314/316/416、139/202/207/227/314/316/416/422、139/207/227/314/414/416/422、139/227/310/414/416/417、139/316/414/416/417/422、146/157、164/207/213/227/310/316/416、166、178/314/316/416、190/195/207/213/244/314/414/416/417/422、194/213/310/314/316/422、195/227/314/316/416、195/227/314/416/417、195/227/314/422、195/227/414/416、195/227/414/416/422、195/227/416/417、195/316/416/417/422、207/208/220/241/291/314/316、226、227、227/416、228、258、259、271/310/316/416/422、282、310/314/316/414/416/417/422、314/316/414/416/422、314/316/416、314/316/416/422、316、319、320、322、および417から選択される、配列番号20と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号20に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換17V/139H/314R/416A/417M/422A、17V/195K/316W/414V/416S/422C、17V/314R/316S/414V/416C、17V/314R/316W/414V/416S/417M/422A、20K、20L、20V、31A、31C、31D、31E、31G、31Q、54C、57A、57C、83G、86G、86G/194K、86K、121A、121C、121G、121H、121L、121S、121V、139H/195K/227F/314R/316W/416C、139H/202G/207K/227F/314R/316F/416S/422C、139H/207K/227F/314R/414V/416C/422G、139H/227F/310E/414V/416C/417M、139H/316S/414V/416S/417M/422A、146K/157G、146V/157G、164Q/207K/213S/227F/310E/316F/416A、166T、178L/314A/316W/416S、190K/195K/207K/213S/244A/314R/414V/416S/417M/422G、194D/213C/310E/314R/316W/422C、195K/227F/314R/316W/416A、195K/227F/314R/416A/417M、195K/227F/314R/422C、195K/227F/414V/416A/422G、195K/227F/414V/416C、195K/227F/416S/417M、195K/316W/416S/417M/422A、207K/208N/220Y/241V/291S/314R/316S、226A、226E、226T、227F/416C、227V、228G、258L、259V、271R/310E/316W/416S/422A、282L、310E/314R/316S/414V/416A/417M/422A、314A/316W/416A、314R/316W/414V/416A/422A、314R/316W/416C/422C、316A、316E、316G、316H、316K、316Q、316R、316S、316T、316W、316Y、319V、320W、322S、および417Sを含み、位置は、配列番号20に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Y17V/Q139H/I314R/G416A/L417M/V422A、Y17V/E195K/M316W/C414V/G416S/V422C、Y17V/I314R/M316S/C414V/G416C、Y17V/I314R/M316W/C414V/G416S/L417M/V422A、T20K、T20L、T20V、V31A、V31C、V31D、V31E、V31G、V31Q、S54C、L57A、L57C、H83G、A86G、A86G/E194K、A86K、N121A、N121C、N121G、N121H、N121L、N121S、N121V、Q139H/E195K/G227F/I314R/M316W/G416C、Q139H/A202G/E207K/G227F/I314R/M316F/G416S/V422C、Q139H/E207K/G227F/I314R/C414V/G416C/V422G、Q139H/G227F/A310E/C414V/G416C/L417M、Q139H/M316S/C414V/G416S/L417M/V422A、R146K/S157G、R146V/S157G、P164Q/E207K/G213S/G227F/A310E/M316F/G416A、N166T、H178L/I314A/M316W/G416S、E190K/E195K/E207K/G213S/P244A/I314R/C414V/G416S/L417M/V422G、E194D/G213C/A310E/I314R/M316W/V422C、E195K/G227F/I314R/M316W/G416A、E195K/G227F/I314R/G416A/L417M、E195K/G227F/I314R/V422C、E195K/G227F/C414V/G416A/V422G、E195K/G227F/C414V/G416C、E195K/G227F/G416S/L417M、E195K/M316W/G416S/L417M/V422A、E207K/T208N/F220Y/A241V/F291S/I314R/M316S、M226A、M226E、M226T、G227F/G416C、G227V、A228G、V258L、I259V、C271R/A310E/M316W/G416S/V422A、I282L、A310E/I314R/M316S/C414V/G416A/L417M/V422A、I314A/M316W/G416A、I314R/M316W/C414V/G416A/V422A、I314R/M316W/G416C/V422C、M316A、M316E、M316G、M316H、M316K、M316Q、M316R、M316S、M316T、M316W、M316Y、H319V、G320W、T322S、およびL417Sを含み、位置は、配列番号20に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、21、21/23/53/146/162/395、21/23/53/146/162/395/432、21/23/53/162/395/432、21/23/53/395/432、21/23/395、21/53/159/395、21/53/163/395/432、23/53/146/159/395/431、23/53/146/159/395/432、23/53/146/162/395/432、23/53/146/163、23/146/163/432、23/162、53/146/159/395、53/146/162/395、53/146/162/432、53/146/163/395、53/146/395/432、53/162/163/395/432、53/162/395、53/162/395/432、53/163/395/432、53/395、57/86、57/86/121/146/157、57/86/121/157/226/259/282/332、57/86/121/332、57/86/157/259、57/86/157/282/332、57/86/332、57/121/417/422、57/146/226/259、57/146/226/259/282、57/259、86、86/157、86/226、121、121/146/157/226/332、121/208/316/417/422、121/226/332、121/316/422、121/332、121/416/417/422、121/417/422、146、146/162/395/432、157、162/432、226/282/332、227、227/417、259、282、282/332、316/417/422、332、395/432、416、416/422、417、および422から選択される、配列番号30と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号30に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換21P、21P/23S/53C/146H/162D/395D、21P/23S/53C/146H/162D/395D/432V、21P/23S/53C/162D/395D/432V、21P/23S/53C/395D/432V、21P/23S/395D、21P/53C/159T/395D、21P/53C/163K/395D/432V、23S/53C/146H/159T/395D/431V、23S/53C/146H/159T/395D/432V、23S/53C/146H/162D/395D/432V、23S/53C/146H/163K、23S/146H/163K/432V、23S/162D、53C/146H/159T/395D、53C/146H/162D/395D、53C/146H/162D/432V、53C/146H/163K/395D、53C/146H/395D/432V、53C/162D/163K/395D/432V、53C/162D/395D、53C/162D/395D/432V、53C/163K/395D/432V、53C/395D、57A/86K、57A/86K/121A/332T、57A/86K/121C/146K/157G、57A/86K/157G/259V、57A/86K/157G/282L/332T、57A/146K/226T/259V、57A/146V/226T/259V/282L、57A/259V、57C/86K/121A/157G/226T/259V/282L/332T、57C/86K/332T、57C/121A/417M/422V、86K、86K/157G、86K/226T、121A、121A/208N/316S/417M/422V、121A/316F/422C、121A/416S/417M/422C、121A/417M/422C、121A/417M/422V、121C/146K/157G/226A/332T、121C/226A/332T、121C/332T、146H、146H/162D/395D/432V、157G、162D/432V、226A/282L/332T、227A、227F、227F/417V、227V、259V、282L、282L/332T、316S/417M/422V、332T、395D/432V、416S、416S/422C、417F、および422Cを含み、位置は、配列番号30に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換D21P、D21P/P23S/N53C/R146H/G162D/G395D、D21P/P23S/N53C/R146H/G162D/G395D/A432V、D21P/P23S/N53C/G162D/G395D/A432V、D21P/P23S/N53C/G395D/A432V、D21P/P23S/G395D、D21P/N53C/S159T/G395D、D21P/N53C/F163K/G395D/A432V、P23S/N53C/R146H/S159T/G395D/E431V、P23S/N53C/R146H/S159T/G395D/A432V、P23S/N53C/R146H/G162D/G395D/A432V、P23S/N53C/R146H/F163K、P23S/R146H/F163K/A432V、P23S/G162D、N53C/R146H/S159T/G395D、N53C/R146H/G162D/G395D、N53C/R146H/G162D/A432V、N53C/R146H/F163K/G395D、N53C/R146H/G395D/A432V、N53C/G162D/F163K/G395D/A432V、N53C/G162D/G395D、N53C/G162D/G395D/A432V、N53C/F163K/G395D/A432V、N53C/G395D、L57A/A86K、L57A/A86K/N121A/I332T、L57A/A86K/N121C/R146K/S157G、L57A/A86K/S157G/I259V、L57A/A86K/S157G/I282L/I332T、L57A/R146K/M226T/I259V、L57A/R146V/M226T/I259V/I282L、L57A/I259V、L57C/A86K/N121A/S157G/M226T/I259V/I282L/I332T、L57C/A86K/I332T、L57C/N121A/L417M/A422V、A86K、A86K/S157G、A86K/M226T、N121A、N121A/T208N/W316S/L417M/A422V、N121A/W316F/A422C、N121A/A416S/L417M/A422C、N121A/L417M/A422C、N121A/L417M/A422V、N121C/R146K/S157G/M226A/I332T、N121C/M226A/I332T、N121C/I332T、R146H、R146H/G162D/G395D/A432V、S157G、G162D/A432V、M226A/I282L/I332T、G227A、G227F、G227F/L417V、G227V、I259V、I282L、I282L/I332T、W316S/L417M/A422V、I332T、G395D/A432V、A416S、A416S/A422C、L417F、およびA422Cを含み、位置は、配列番号30に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、107、141、161、174、245、281、293、432、および453から選択される、配列番号66と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号66に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換107G、107V、141L、161S、174Q、245L、281S、293A、432D、432E、432V、453G、および453Tを含み、位置は、配列番号66に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換D107G、D107V、R141L、T161S、P174Q、I245L、I281S、P293A、A432D、A432E、A432V、A453G、およびA453Tを含み、位置は、配列番号66に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、2、4、5、5/38/56/346、13、17、17/31、19、31、57、74、79、86、121、155、161、161/174/432、163/167、164、190/291、195、195/408、203/207/219、205/419、207、207/235/419、214/228/251、222、223、226/228/230/231/311、228、233、246、247/271/293、259、282、284、309、327、346、359、362、375、404、408、419、420、422、および443から選択される、配列番号70と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号70に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換2I、4A、4C、4D、4R、5E、5H/38C/56T/346G、13E、17A、17G/31T、17H、17I、17M、17S、17V、19Y、31C、31F、31L、57A、57G、74M、79L、86C、86E、86G、86N、121C、155C、161S、161S/174Q/432V、163E/167I、164V、190K/291C、195K、195Q/408E、203R/207K/219R、205M/419S、207I、207K/235P/419S、214T/228G/251T、222T、223G、226D/228C/230R/231C/311R、228G、233V、246V、247A/271G/293P、259V、282L、284A、309R、327E、346N、359G、362Q、375R、404V、408A、408E、408L、408S、408V、419D、419S、420T、422C、443A、および443Iを含み、位置は、配列番号66に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換N2I、P4A、P4C、P4D、P4R、Q5E、Q5H/G38C/A56T/A346G、T13E、Y17A、Y17G/V31T、Y17H、Y17I、Y17M、Y17S、Y17V、F19Y、V31C、V31F、V31L、L57A、L57G、T74M、F79L、A86C、A86E、A86G、A86N、N121C、A155C、T161S、T161S/P174Q/A432V、K163E/S167I、P164V、E190K/F291C、E195K、E195Q/T408E、H203R/E207K/G219R、L205M/Q419S、E207I、E207K/A235P/Q419S、A214T/A228G/I251T、A222T、E223G、M226D/A228C/G230R/V231C/I311R、A228G、P233V、L246V、R247A/C271G/A293P、I259V、I282L、S284A、T309R、P327E、A346N、R359G、H362Q、I375R、A404V、T408A、T408E、T408L、T408S、T408V、Q419D、Q419S、S420T、A422C、K443A、およびK443Iを含み、位置は、配列番号70に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、21/23/53/163/293、21/23/53/163/293/395、21/53/146、21/53/146/163/293/395/432、21/53/163/293/395、21/53/293/432、23/53/146/163、23/53/146/163/293/432、23/53/146/293/432、23/53/163、23/53/163/293/395、23/53/163/293/432、23/53/163/395、23/53/293、23/53/293/395/432、23/53/293/432、23/146/293、53/146/163/293/395/432、53/146/163/395/432、53/146/163/432、53/146/293、53/163、53/163/293/395、53/163/293/395/432、53/163/293/432、53/163/432、53/293、53/293/395、53/395、53/432、146、および293から選択される、配列番号48と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号48に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換21P/23S/53C/163K/293A、21P/23S/53C/163K/293A/395D、21P/53C/146H、21P/53C/146H/163K/293A/395D/432V、21P/53C/163K/293A/395D、21P/53C/293A/432V、23S/53C/146H/163K、23S/53C/146H/163K/293A/432V、23S/53C/146H/293A/432V、23S/53C/163K、23S/53C/163K/293A/395D、23S/53C/163K/293A/432V、23S/53C/163K/395D、23S/53C/293A、23S/53C/293A/395D/432V、23S/53C/293A/432V、23S/146H/293A、53C/146H/163K/293A/395D/432V、53C/146H/163K/395D/432V、53C/146H/163K/432V、53C/146H/293A、53C/163K、53C/163K/293A/395D、53C/163K/293A/395D/432V、53C/163K/293A/432V、53C/163K/432V、53C/293A、53C/293A/395D、53C/395D、53C/432V、146H、および293Aを含み、位置は、配列番号48に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換D21P/P23S/N53C/F163K/P293A、D21P/P23S/N53C/F163K/P293A/G395D、D21P/N53C/R146H、D21P/N53C/R146H/F163K/P293A/G395D/A432V、D21P/N53C/F163K/P293A/G395D、D21P/N53C/P293A/A432V、P23S/N53C/R146H/F163K、P23S/N53C/R146H/F163K/P293A/A432V、P23S/N53C/R146H/P293A/A432V、P23S/N53C/F163K、P23S/N53C/F163K/P293A/G395D、P23S/N53C/F163K/P293A/A432V、P23S/N53C/F163K/G395D、P23S/N53C/P293A、P23S/N53C/P293A/G395D/A432V、P23S/N53C/P293A/A432V、P23S/R146H/P293A、N53C/R146H/F163K/P293A/G395D/A432V、N53C/R146H/F163K/G395D/A432V、N53C/R146H/F163K/A432V、N53C/R146H/P293A、N53C/F163K、N53C/F163K/P293A/G395D、N53C/F163K/P293A/G395D/A432V、N53C/F163K/P293A/A432V、N53C/F163K/A432V、N53C/P293A、N53C/P293A/G395D、N53C/G395D、N53C/A432V、R146H、およびP293Aを含み、位置は、配列番号48に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、157、163、163/164、284、および332から選択される、配列番号88と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号88に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換157A、157C、163K、163K/164G、163M、284A、および332Vを含み、位置は、配列番号88に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換S157A、S157C、F163K、F163K/P164G、F163M、S284A、およびI332Vを含み、位置は、配列番号88に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、31、86、149、191/208/211/286、192/294、195/207/208/286、208/294、260、284、286、294、313、395/396、および424から選択される、配列番号88と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号88に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換31M、86A、149S、191S/208P/211R/286A、192G/294A、195D/207R/208N/286G、208N/294S、208N/294T、260T、284A、286G、294A、294S、313L、313V、395D/396K、および424Aを含み、位置は、配列番号88に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換V31M、K86A、A149S、G191S/T208P/K211R/S286A、E192G/V294A、E195D/E207R/T208N/S286G、T208N/V294S、T208N/V294T、C260T、S284A、S286G、V294A、V294S、A313L、A313V、G395D/N396K、およびC424Aを含み、位置は、配列番号88に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、14/31/208/260/286/294/424、14/31/260/286/294/424、31、31/208、31/208/241/286/294、31/208/260/286/294、31/208/260/286/294/313/424、31/208/260/286/294/424、31/208/260/286/313/424、31/208/260/294/313/424、31/208/260/294/424、31/208/286/294、31/208/286/294/313、31/208/286/294/313/424、31/208/286/294/424、31/208/286/313/424、31/208/286/424、31/208/294、31/208/294/313/424、31/208/294/424、31/260/286、31/260/286/294/313、31/260/286/294/313/424、31/260/286/313/424、31/260/286/424、31/260/294、31/260/294/313、31/286/294、31/286/294/313、31/286/294/424、31/294/313/424、31/294/424、208/260/286/294/313/424、208/260/286/294/424、208/260/286/424、208/260/294、208/260/294/313/424、208/286/294/424、260/286/294/424、260/286/424、286/294/313/424、および286/313/424から選択される、配列番号110と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号110に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換14N/31M/208N/260T/286G/294A/424A、14N/31M/260T/286G/294A/424A、31M、31M/208N、31M/208N/241V/286G/294A、31M/208N/260T/286G/294A、31M/208N/260T/286G/294A/313E/424A、31M/208N/260T/286G/294A/313L/424A、31M/208N/260T/286G/294A/424A、31M/208N/260T/286G/313L/424A、31M/208N/260T/294A/313L/424A、31M/208N/260T/294A/424A、31M/208N/286G/294A、31M/208N/286G/294A/313L、31M/208N/286G/294A/313L/424A、31M/208N/286G/294A/424A、31M/208N/286G/313L/424A、31M/208N/286G/313V/424A、31M/208N/286G/424A、31M/208N/294A、31M/208N/294A/313L/424A、31M/208N/294A/424A、31M/260T/286G、31M/260T/286G/294A/313L、31M/260T/286G/294A/313L/424A、31M/260T/286G/313L/424A、31M/260T/286G/424A、31M/260T/294A、31M/260T/294A/313L、31M/286G/294A、31M/286G/294A/313L、31M/286G/294A/424A、31M/294A/313L/424A、31M/294A/424A、208N/260T/286G/294A/313L/424A、208N/260T/286G/294A/424A、208N/260T/286G/424A、208N/260T/294A、208N/260T/294A/313L/424A、208N/286G/294A/424A、260T/286G/294A/424A、260T/286G/424A、286G/294A/313L/424A、および286G/313L/424Aを含み、位置は、配列番号110に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Y14N/V31M/T208N/C260T/S286G/V294A/C424A、Y14N/V31M/C260T/S286G/V294A/C424A、V31M、V31M/T208N、V31M/T208N/A241V/S286G/V294A、V31M/T208N/C260T/S286G/V294A、V31M/T208N/C260T/S286G/V294A/A313E/C424A、V31M/T208N/C260T/S286G/V294A/A313L/C424A、V31M/T208N/C260T/S286G/V294A/C424A、V31M/T208N/C260T/S286G/A313L/C424A、V31M/T208N/C260T/V294A/A313L/C424A、V31M/T208N/C260T/V294A/C424A、V31M/T208N/S286G/V294A、V31M/T208N/S286G/V294A/A313L、V31M/T208N/S286G/V294A/A313L/C424A、V31M/T208N/S286G/V294A/C424A、V31M/T208N/S286G/A313L/C424A、V31M/T208N/S286G/A313V/C424A、V31M/T208N/S286G/C424A、V31M/T208N/V294A、V31M/T208N/V294A/A313L/C424A、V31M/T208N/V294A/C424A、V31M/C260T/S286G、V31M/C260T/S286G/V294A/A313L、V31M/C260T/S286G/V294A/A313L/C424A、V31M/C260T/S286G/A313L/C424A、V31M/C260T/S286G/C424A、V31M/C260T/V294A、V31M/C260T/V294A/A313L、V31M/S286G/V294A、V31M/S286G/V294A/A313L、V31M/S286G/V294A/C424A、V31M/V294A/A313L/C424A、V31M/V294A/C424A、T208N/C260T/S286G/V294A/A313L/C424A、T208N/C260T/S286G/V294A/C424A、T208N/C260T/S286G/C424A、T208N/C260T/V294A、T208N/C260T/V294A/A313L/C424A、T208N/S286G/V294A/C424A、C260T/S286G/V294A/C424A、C260T/S286G/C424A、S286G/V294A/A313L/C424A、およびS286G/A313L/C424Aを含み、位置は、配列番号110に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、16/272、17、19/86、19/86/321、20、21、22、22/255、22/255/362/421、22/294、22/362、24/255/362、31、41、42/187/294、66、66/190、66/394、84、114、153、157、161、163、164、164/397、221、222、272、294、320、320/435、および394から選択される、配列番号112と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号112に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換16F/272E、17M、19H/86N、19Y/86N/321Y、20A、21E、22L、22L/255A、22L/255A/362R/421I、22L/294M、22L/362R、24T/255A/362R、31T、41L、42F/187F/294M、66P、66P/190P、66P/394P、84N、84S、114A、153S、157G、157P、161R、163P、164G、164R/397P、221I、222T、272E、294M、320A、320A/435N、および394Pを含み、位置は、配列番号112に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換L16F/V272E、Y17M、F19H/K86N、F19Y/K86N/F321Y、T20A、D21E、M22L、M22L/S255A、M22L/S255A/H362R/V421I、M22L/V294M、M22L/H362R、S24T/S255A/H362R、M31T、I41L、V42F/Y187F/V294M、K66P、K66P/E190P、K66P/G394P、A84N、A84S、T114A、A153S、S157G、S157P、T161R、F163P、P164G、P164R/L397P、F221I、A222T、V272E、V294M、G320A、G320A/D435N、およびG394Pを含み、位置は、配列番号112に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、17、17/21、17/21/22、17/22、17/22/272、17/22/272/320、17/31/320/397、17/84/164、17/157/164、17/157/320/397、17/221/320、17/272/320、17/320、17/397、19/22/42/320/394、19/42、20/320、25/320、66/187/320、66/272、66/320、66/394、164/320/321、165、255、272、272/320、および320から選択される、配列番号120と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号120に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換17M、17M/21E、17M/21E/22L、17M/22L、17M/22L/272E、17M/22L/272E/320A、17M/31T/320A/397P、17M/84S/164R、17M/157G/164R、17M/157G/320A/397P、17M/221I/320A、17M/272E/320A、17M/320A、17M/397P、19Y/22L/42F/320A/394P、19Y/42F、20A/320A、25V/320A、66P/187F/320A、66P/272E、66P/320A、66P/394P、164R/320A/321Y、165W、255A、272E、272E/320A、および320Aを含み、位置は、配列番号120に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換Y17M、Y17M/D21E、Y17M/D21E/M22L、Y17M/M22L、Y17M/M22L/V272E、Y17M/M22L/V272E/G320A、Y17M/M31T/G320A/L397P、Y17M/A84S/P164R、Y17M/S157G/P164R、Y17M/S157G/G320A/L397P、Y17M/F221I/G320A、Y17M/V272E/G320A、Y17M/G320A、Y17M/L397P、H19Y/M22L/V42F/G320A/G394P、H19Y/V42F、T20A/G320A、L25V/G320A、K66P/Y187F/G320A、K66P/V272E、K66P/G320A、K66P/G394P、P164R/G320A/F321Y、Y165W、S255A、V272E、V272E/G320A、およびG320Aを含み、位置は、配列番号120に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、24、24/25、24/110/167、25、25/147/167、27/190/207/389/396、27/190/207/396、41/42/66/165、42、42/66/165/394、42/165/272/394、66/164、66/164/272、66/165、66/394、163、164、164/165/394、165、165/272、165/394、166、167、190、190/207、190/207/210、190/207/210/385/389、190/207/385、190/210、190/385/396、190/389、207、207/210/243/250/385/389、207/214/396、207/243、207/389、210、210/385、214、214/396、272/394、283、385、385/389、389、389/396、および394から選択される、配列番号138と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号138に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換24T、24T/25V、24T/110L/167E、25V、25V/147V/167E、27D/190P/207D/389T/396S、27D/190P/207D/396S、41L/42F/66P/165W、42F、42F/66P/165W/394P、42F/165W/272E/394P、66P/164R、66P/164R/272E、66P/165W、66P/394P、163L、164N、164R/165W/394P、164S、165W、165W/272E、165W/394P、166A、166L、166T、167E、190P、190P/207D、190P/207D/210A、190P/207D/210A/385A/389T、190P/207D/385A、190P/210A、190P/385A/396S、190P/389T、207D、207D/210A/243Q/250G/385A/389T、207D/214P/396S、207D/243Q、207D/389T、210A、210A/385A、214P、214P/396S、272E/394P、283C、385A、385A/389T、389T、389T/396S、および394Pを含み、位置は、配列番号138に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換S24T、S24T/L25V、S24T/R110L/S167E、L25V、L25V/W147V/S167E、Q27D/E190P/E207D/S389T/N396S、Q27D/E190P/E207D/N396S、I41L/V42F/K66P/Y165W、V42F、V42F/K66P/Y165W/G394P、V42F/Y165W/V272E/G394P、K66P/P164R、K66P/P164R/V272E、K66P/Y165W、K66P/G394P、F163L、P164N、P164R/Y165W/G394P、P164S、Y165W、Y165W/V272E、Y165W/G394P、N166A、N166L、N166T、S167E、E190P、E190P/E207D、E190P/E207D/Q210A、E190P/E207D/Q210A/K385A/S389T、E190P/E207D/K385A、E190P/Q210A、E190P/K385A/N396S、E190P/S389T、E207D、E207D/Q210A/L243Q/D250G/K385A/S389T、E207D/A214P/N396S、E207D/L243Q、E207D/S389T、Q210A、Q210A/K385A、A214P、A214P/N396S、V272E/G394P、S283C、K385A、K385A/S389T、S389T、S389T/N396S、およびG394Pを含み、位置は、配列番号138に関して番号付けされている。
一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、12/26/30/291、12/26/73/77/291、13/45/107/236/277/346/351/410/429、22/25/110/291/304、24/147/164/166/167/243/389、24/166、24/166/190、24/166/207、26/30、26/30/168/291、30/77/291、30/291、70/77/108/177/196/247/291/309/361/366、70/77/168/291、70/177/291/361/366、70/177/291/372、70/186、70/247/291/309/372、70/291、70/291/304/361、74、74/211、77/110/291/308、77/291/361/366、107/277/346/410/429、107/346、110/235/391、147/164/166/167、147/164/166/243/272/283/385/389、147/164/166/272、163、166、166/167/272/389、166/190、166/190/207、166/207、177/195/196/291/304/309/366、177/196/247/304/309/361/366、177/291/309/361、196/291/304/361、196/291/309/361、198/235/391、207、247/304/309/366、253/391、277、291、291/304/309、および291/309から選択される、配列番号156と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む操作されたトランスアミナーゼポリペプチドをコードし、位置は、配列番号156に関して番号付けされている。一部の実施形態において、アミノ酸の違いは、置換12D/26K/30P/291Y、12D/26R/73C/77R/291Y、13A/45N/107E/236E/277V/346L/351A/410H/429M、22L/25V/110K/291Y/304A、24T/147V/164S/166A/167E/243Q/389T、24T/166A、24T/166A/190P、24T/166A/207D、24T/166L、26K/30P/168E/291Y、26R/30P、30P/77R/291Y、30P/291Y、70E/77D/108R/177I/196E/247K/291Y/309A/361A/366H、70E/77R/168E/291Y、70E/177I/291Y/361A/366H、70E/177I/291Y/372W、70E/186C、70E/247K/291Y/309A/372W、70E/291Y、70E/291Y/304A/361A、74A、74A/211R、77D/110K/291Y/308Q、77D/291Y/361A/366H、107E/277V/346L/410H/429M、107E/346L、110K/235S/391T、147V/164R/166A/167E、147V/164R/166A/243Q/272E/283C/385A/389T、147V/164R/166A/272E、163Y、166A、166A/167E/272E/389T、166A/190P、166A/190P/207D、166A/207D、166G、166S、166S/207D、166V、177I/195A/196E/291Y/304A/309A/366H、177I/196E/247K/304A/309A/361A/366H、177I/291Y/309A/361A、196E/291Y/304A/361A、196E/291Y/309A/361A、198T/235S/391T、207D、247K/304A/309A/366H、253L/391T、277V、291Y、291Y/304A/309A、および291Y/309Aを含み、位置は、配列番号156に関して番号付けされている。一部の追加の実施形態において、アミノ酸の違いは、置換E12D/H26K/T30P/F291Y、E12D/H26R/K73C/E77R/F291Y、T13A/H45N/D107E/K236E/T277V/A346L/R351A/L410H/L429M、M22L/L25V/R110K/F291Y/S304A、S24T/W147V/P164S/N166A/S167E/L243Q/S389T、S24T/N166A、S24T/N166A/E190P、S24T/N166A/E207D、S24T/N166L、H26K/T30P/V168E/F291Y、H26R/T30P、T30P/E77R/F291Y、T30P/F291Y、D70E/E77D/S108R/L177I/Q196E/R247K/F291Y/T309A/K361A/R366H、D70E/E77R/V168E/F291Y、D70E/L177I/F291Y/K361A/R366H、D70E/L177I/F291Y/Y372W、D70E/R186C、D70E/R247K/F291Y/T309A/Y372W、D70E/F291Y、D70E/F291Y/S304A/K361A、T74A、T74A/K211R、E77D/R110K/F291Y/E308Q、E77D/F291Y/K361A/R366H、D107E/T277V/A346L/L410H/L429M、D107E/A346L、R110K/A235S/A391T、W147V/P164R/N166A/S167E、W147V/P164R/N166A/L243Q/V272E/S283C/K385A/S389T、W147V/P164R/N166A/V272E、F163Y、N166A、N166A/S167E/V272E/S389T、N166A/E190P、N166A/E190P/E207D、N166A/E207D、N166G、N166S、N166S/E207D、N166V、L177I/E195A/Q196E/F291Y/S304A/T309A/R366H、L177I/Q196E/R247K/S304A/T309A/K361A/R366H、L177I/F291Y/T309A/K361A、Q196E/F291Y/S304A/K361A、Q196E/F291Y/T309A/K361A、V198T/A235S/A391T、E207D、R247K/S304A/T309A/R366H、V253L/A391T、T277V、F291Y、F291Y/S304A/T309A、およびF291Y/T309Aを含み、位置は、配列番号156に関して番号付けされている。
一部の実施形態において、本発明のバリアントトランスアミナーゼは、酵素のコードされる活性を変更しない追加の配列をさらに含む。例えば、一部の実施形態において、バリアントトランスアミナーゼは、エピトープタグまたは精製において有用な別の配列に連結される。
一部の実施形態において、本発明のバリアントトランスアミナーゼポリペプチドは、それらが発現される宿主細胞(例えば、酵母または糸状菌宿主細胞)から分泌され、シグナルペプチド(すなわち、ポリペプチドのアミノ末端に連結され、コードされるポリペプチドを細胞分泌経路に誘導するアミノ酸配列)を含むプレタンパク質として発現される。
操作されたポリペプチドの配列が公知であるとき、酵素をコードするポリヌクレオチドは、公知の合成方法に従い、標準的な固相方法により調製することができる。一部の実施形態において、最大約100塩基の断片は、個別に合成され、次に、結合されて(例えば、酵素もしくは化学的ライゲーション方法により、またはポリメラーゼにより媒介される方法により)、任意の所望の連続配列を形成することができる。例えば、本発明のポリヌクレオチドおよびオリゴヌクレオチドは、化学合成により(例えば、Beaucageら、Tet. Lett., 22:1859-69[1981]により記載される古典的ホスホルアミダイト方法またはMatthesら、EMBO J., 3:801-05[1984]により記載される方法(これは、典型的には、自動合成方法において実施される)を使用して)調製することができる。ホスホルアミダイト方法に従い、オリゴヌクレオチドが、合成され(例えば、自動DNA合成装置において)、精製され、アニーリングされ、ライゲーションされ、適切なベクターにおいてクローニングされる。加えて、本質的に任意の核酸は、様々な商業的供給源(例えば、The Midland Certified Reagent Company、Midland、TX、The Great American Gene Company、Ramona、CA、ExpressGen Inc.、Chicago、IL、Operon Technologies Inc.、Alameda、CA、および多くの他の会社)のいずれかから得ることができる。
本発明はまた、本明細書において提供される、少なくとも1つのバリアントトランスアミナーゼをコードする配列を含む組換え構築物を提供する。一部の実施形態において、本発明は、異種プロモーターに作動可能に連結されたバリアントトランスアミナーゼポリヌクレオチドを含む発現ベクターを提供する。一部の実施形態において、本発明の発現ベクターを使用して、適切な宿主細胞を形質転換して、バリアントトランスアミナーゼタンパク質を発現させる。真菌および他の生物におけるタンパク質の組換え発現方法は、当技術分野において周知であり、多数の発現ベクターが、利用可能であるか、または日常的方法を使用して構築することができる。一部の実施形態において、本発明の核酸構築物は、本発明の核酸配列が挿入されている、プラスミド、コスミド、ファージ、ウイルス、細菌の人工染色体(BAC)、酵母の人工染色体(YAC)などのようなベクターを含む。一部の実施形態において、本発明のポリヌクレオチドは、バリアントトランスアミナーゼポリペプチド(複数可)を発現させるのに適した様々な発現ベクターのいずれか1つに組み込まれる。適切なベクターは、これらに限定されないが、染色体、非染色体および合成DNA配列(例えば、SV40の誘導体)、ならびに細菌のプラスミド、ファージDNA、バキュロウイルス、酵母プラスミド、プラスミドとファージDNAの組み合わせからもたらされるベクター、ワクシニア、アデノウイルス、鶏痘ウイルス、仮性狂犬病、アデノウイルス、アデノ随伴ウイルス、レトロウイルス、および多くの他のもののようなウイルスDNAを含む。遺伝物質を細胞に形質導入し、複製が望まれるなら、関連する宿主において複製可能であり、実行可能である、任意の適切なベクターが、本発明において使用される。
一部の実施形態において、構築物は、タンパク質コード配列に作動可能に連結されたプロモーターを含むが、これに限定されない、制御配列をさらに含む。多数の適切なベクターおよびプロモーターは、当業者に公知である。実際に、一部の実施形態において、特定の宿主において高いレベルの発現を得るために、異種プロモーターの調節下で本発明のバリアントトランスアミナーゼを発現させることが、しばしば有用である。一部の実施形態において、プロモーター配列は、当技術分野において公知の任意の適切な方法を使用して、バリアントトランスアミナーゼコード配列の5’領域に作動可能に連結されている。バリアントトランスアミナーゼの発現に有用なプロモーターの例は、これに限定されないが、真菌由来のプロモーターを含む。一部の実施形態において、真菌株においてトランスアミナーゼ遺伝子以外の遺伝子の発現をもたらすプロモーター配列が使用される。非限定的な例として、エンドグルカナーゼをコードする遺伝子由来の真菌プロモーターが使用されてもよい。一部の実施形態において、トランスアミナーゼがもたらされた真菌株以外の真菌株におけるトランスアミナーゼ遺伝子の発現をもたらすプロモーター配列が使用される。糸状菌宿主細胞における本発明のヌクレオチド構築物の転写を誘導するのに有用な他の適切なプロモーターの例は、これらに限定されないが、Aspergillus oryzae TAKAアミラーゼ、Rhizomucor mieheiアスパラギン酸プロテイナーゼ、Aspergillus niger中性アルファ-アミラーゼ、Aspergillus niger酸安定性アルファ-アミラーゼ、Aspergillus nigerまたはAspergillus awamoriグルコアミラーゼ(glaA)、Rhizomucor mieheiリパーゼ、Aspergillus oryzaeアルカリプロテアーゼ、Aspergillus oryzaeトリオースリン酸イソメラーゼ、Aspergillus nidulansアセトアミダーゼ、およびFusarium oxysporumトリプシン様プロテアーゼ(例えば、参照により本明細書に組み込まれる、国際公開第96/00787号を参照)の遺伝子から得られるプロモーター、ならびにNA2-tpiプロモーター(Aspergillus niger中性アルファ-アミラーゼとAspergillus oryzaeトリオースリン酸イソメラーゼの遺伝子由来のプロモーターのハイブリッド)、cbh1、cbh2、egl1、egl2、pepA、hfb1、hfb2、xyn1、amy、およびglaAのようなプロモーター(例えば、それらの全てが参照により本明細書に組み込まれる、Nunbergら、Mol. Cell Biol., 4:2306-2315[1984];Boelら、EMBO J., 3:1581-85[1984];および欧州特許出願第137280号を参照)、ならびにその変異体、切断、およびハイブリッドプロモーターを含む。
酵母宿主細胞において、有用なプロモーターは、これらに限定されないが、Saccharomyces cerevisiaeエノラーゼ(eno-1)、Saccharomyces cerevisiaeガラクトキナーゼ(gal1)、Saccharomyces cerevisiaeアルコール脱水素酵素/グリセルアルデヒド-3-リン酸脱水素酵素(ADH2/GAP)、およびS.cerevisiae3-ホスホグリセリン酸キナーゼの遺伝子由来のプロモーターを含む。酵母宿主細胞に有用な追加の有用なプロモーターは、当技術分野において公知である(例えば、参照により本明細書に組み込まれる、Romanosら、Yeast, 8:423-488[1992]を参照)。加えて、真菌におけるキチナーゼ生成と関連するプロモーターが本発明において使用される(例えば、両方が、参照により本明細書に組み込まれる、Blaiseau and Lafay, Gene, 120243-248[1992];およびLimonら、Curr. Genet., 28:478-83[1995]を参照)。
細菌の宿主細胞について、本開示の核酸構築物の転写を誘導するのに適切なプロモーターは、これらに限定されないが、E.coli lacオペロン、E.coli trpオペロン、バクテリオファージラムダ、Streptomyces coelicolorアガラーゼ遺伝子(dagA)、Bacillus subtilisレバンスクラーゼ遺伝子(sacB)、Bacillus licheniformisアルファ-アミラーゼ遺伝子(amyL)、Bacillus stearothermophilusマルトース生成アミラーゼ遺伝子(amyM)、Bacillus amyloliquefaciensアルファ-アミラーゼ遺伝子(amyQ)、Bacillus licheniformisペニシリナーゼ遺伝子(penP)、Bacillus subtilis xylAおよびxylB遺伝子、ならびに原核生物のベータ-ラクタマーゼ遺伝子(例えば、Villa-Kamaroffら、Proc. Natl. Acad. Sci. USA 75:3727-3731[1978]を参照)から得られるプロモーター、ならびにtacプロモーター(例えば、DeBoerら、Proc. Natl. Acad. Sci. USA 80:21-25[1983]を参照)を含む。
一部の実施形態において、本発明のクローニングされたバリアントトランスアミナーゼはまた、転写を終結するために宿主細胞により認識される配列である適切な転写ターミネーター配列を有する。ターミネーター配列は、ポリペプチドをコードする核酸配列の3’末端に作動可能に連結されている。選択した宿主細胞において機能的である任意のターミネーターが、本発明において使用される。糸状菌宿主細胞のための例示的な転写ターミネーターは、これらに限定されないが、Aspergillus oryzae TAKAアミラーゼ、Aspergillus nigerグルコアミラーゼ、Aspergillus nidulansアントラニル酸合成酵素、Aspergillus nigerアルファ-グルコシダーゼ、およびFusarium oxysporumトリプシン様プロテアーゼについての遺伝子から得られるものを含む(例えば、参照により本明細書に組み込まれる、米国特許第7,399,627号を参照)。一部の実施形態において、酵母宿主細胞のための例示的なターミネーターは、Saccharomyces cerevisiaeエノラーゼ、Saccharomyces cerevisiaeチトクロムC(CYCl)、およびSaccharomyces cerevisiaeグリセルアルデヒド-3-リン酸脱水素酵素についての遺伝子から得られるものを含む。酵母宿主細胞にとって他の有用なターミネーターは、当業者に周知である(例えば、Romanosら、Yeast, 8:423-88[1992]を参照)。
一部の実施形態において、適切なリーダー配列は、クローニングされたバリアントトランスアミナーゼ配列の一部であり、宿主細胞による翻訳に重要であるmRNAの非翻訳領域である。リーダー配列は、ポリペプチドをコードする核酸配列の5’末端に作動可能に連結されている。選択した宿主細胞において機能的である任意のリーダー配列が、本発明において使用される。糸状菌宿主細胞のための例示的なリーダーは、これに限定されないが、Aspergillus oryzae TAKAアミラーゼおよびAspergillus nidulansトリオースリン酸イソメラーゼについての遺伝子から得られるものを含む。酵母宿主細胞に適切なリーダーは、これに限定されないが、Saccharomyces cerevisiaeエノラーゼ(ENO-1)、Saccharomyces cerevisiae3-ホスホグリセリン酸キナーゼ、Saccharomyces cerevisiaeアルファ-因子、およびSaccharomyces cerevisiaeアルコール脱水素酵素/グリセルアルデヒド-3-リン酸脱水素酵素(ADH2/GAP)についての遺伝子から得られるものを含む。
一部の実施形態において、本発明の配列はまた、ポリアデニル化配列を含み、これは、核酸配列の3’末端に作動可能に連結されている配列であり、転写されたとき、転写されたmRNAにポリアデノシン残基を加えるためのシグナルとして宿主細胞により認識される。選択した宿主細胞において機能的である任意のポリアデニル化配列が、本発明において使用される。糸状菌宿主細胞についての例示的なポリアデニル化配列は、これに限定されないが、Aspergillus oryzae TAKAアミラーゼ、Aspergillus nigerグルコアミラーゼ、Aspergillus nidulansアントラニル酸合成酵素、Fusarium oxysporumトリプシン様プロテアーゼ、およびAspergillus nigerアルファ-グルコシダーゼについての遺伝子から得られるものを含む。酵母宿主細胞に有用なポリアデニル化配列は、当技術分野において公知である(例えば、Guo and Sherman, Mol. Cell. Biol., 15:5983-5990[1995]を参照)。
一部の実施形態において、調節配列は、ポリペプチドのアミノ末端に連結したアミノ酸配列をコードするシグナルペプチドコード領域を含み、細胞の分泌経路にコードされたポリペプチドを誘導する。核酸配列のコード配列の5’末端は、分泌されるポリペプチドをコードするコード領域のセグメントと共に翻訳リーディングフレームにおいて天然で連結されるシグナルペプチドコード領域を元来含有してもよい。あるいは、コード配列の5’末端は、コード配列にとって外来であるシグナルペプチドコード領域を含有してもよい。コード配列が、シグナルペプチドコード領域を天然で含有しない場合、外来シグナルペプチドコード領域が、必要とされ得る。
あるいは、外来シグナルペプチドコード領域は、ポリペプチドの分泌を増強するために、天然のシグナルペプチドコード領域と単に置き換えてもよい。しかしながら、発現されたポリペプチドを、選択した宿主細胞の分泌経路に誘導する任意のシグナルペプチドコード領域が、本発明において使用されてもよい。
一部の実施形態において、シグナルペプチドは、内在性V. fluvialisトランスアミナーゼシグナルペプチドである。一部の追加の実施形態において、他のV. fluvialisの分泌されたタンパク質由来のシグナルペプチドが使用される。一部の実施形態において、宿主細胞および他の因子によっては、他のシグナルペプチドも使用される。
細菌宿主細胞のための有効なシグナルペプチドコード領域は、これらに限定されないが、Bacillus NClB 11837マルトース生成アミラーゼ、Bacillus stearothermophilusアルファ-アミラーゼ、Bacillus licheniformisスブチリシン、Bacillus licheniformisベータ-ラクタマーゼ、Bacillus stearothermophilus中性プロテアーゼ(nprT、nprS、nprM)、およびBacillus subtilis prsAについての遺伝子から得られるシグナルペプチドコード領域を含む。さらなるシグナルペプチドが、当技術分野において公知である(例えば、Simonen and Palva, Microbiol. Rev., 57:109-137[1993]を参照)。
糸状菌宿主細胞に有効なシグナルペプチドコード領域は、これらに限定されないが、Aspergillus oryzae TAKAアミラーゼ、Aspergillus niger中性アミラーゼ、Aspergillus nigerグルコアミラーゼ、Rhizomucor mieheiアスパラギン酸プロテイナーゼ、Humicola insolensセルラーゼ、およびHumicola lanuginosaリパーゼの遺伝子から得られるシグナルペプチドコード領域を含む。
酵母宿主細胞に有用なシグナルペプチドは、これらに限定されないが、Saccharomyces cerevisiaeアルファ-因子およびSaccharomyces cerevisiaeインベルターゼの遺伝子を含む。他の有用なシグナルペプチドコード領域は、当技術分野において公知である(例えば、Romanosら、[1992]、上を参照)。
一部の実施形態において、調節配列は、ポリペプチドのアミノ末端に位置するアミノ酸配列をコードするプロペプチドコード領域を含む。得られたポリペプチドは、前酵素またはプロポリペプチド(または一部の場合においてチモーゲン)として公知である。プロポリペプチドは、一般に、不活性であり、プロポリペプチドからのプロペプチドの触媒または自己触媒切断により、成熟活性トランスアミナーゼポリペプチドに変換され得る。プロペプチドコード領域は、Bacillus subtilisアルカリプロテアーゼ(aprE)、Bacillus subtilis中性プロテアーゼ(nprT)、Saccharomyces cerevisiaeアルファ-因子、Rhizomucor mieheiアスパラギン酸プロテイナーゼ、およびMyceliophthora thermophilaラクターゼについての遺伝子から得られてもよい(例えば、国際公開第95/33836号を参照)。
シグナルペプチドとプロペプチド領域の両方が、ポリペプチドのアミノ末端に存在する場合、プロペプチド領域は、ポリペプチドのアミノ末端の次に位置し、シグナルペプチド領域は、プロペプチド領域のアミノ末端の次に位置する。
一部の実施形態において、制御配列をまた使用して、宿主細胞の成長に関連するポリペプチドの発現の制御を可能にする。制御システムの例は、制御性化合物の存在を含む、化学的または物理的刺激に応答して、遺伝子の発現をオンまたはオフにするものである。原核生物の宿主細胞において、適切な制御配列は、これらに限定されないが、lac、tac、およびtrpオペレーターシステムを含む。酵母宿主細胞において、適切な制御システムは、例として、ADH2システムまたはGAL1システムを含む。糸状菌において、適切な制御配列は、TAKAアルファ-アミラーゼプロモーター、Aspergillus nigerグルコアミラーゼプロモーター、およびAspergillus oryzaeグルコアミラーゼプロモーターを含む。
制御配列の他の例は、遺伝子増幅を可能にするものである。真核生物のシステムにおいて、これらは、メトトレキサートの存在下で増幅される、ジヒドロ葉酸還元酵素遺伝子、および重金属を用いて増幅される、メタロチオネイン遺伝子を含む。これらの場合において、本発明のトランスアミナーゼポリペプチドをコードする核酸配列は、制御配列と作動可能に連結されているであろう。
したがって、追加の実施形態において、本発明は、それらが導入されるべき宿主のタイプに依存して、操作されたトランスアミナーゼポリペプチドまたはそのバリアントをコードするポリヌクレオチドならびにプロモーターおよびターミネーターのような1つまたは複数の発現制御領域、複製開始点などを含む組換え発現ベクターを提供する。一部の実施形態において、上で記載された様々な核酸および調節配列を一緒に結合させて、1つまたは複数の好都合の制限部位でのポリペプチドをコードする核酸配列の挿入または置換を可能にするためのかかる部位を含み得る、組換え発現ベクターを生成する。あるいは、一部の実施形態において、核酸配列は、核酸配列または配列を含む核酸構築物を発現のための適切なベクターに挿入することにより、発現される。発現ベクターの生成において、コード配列が、発現のための適切な調節配列と作動可能に連結されるように、コード配列は、ベクターの中に位置する。
組換え発現ベクターは、好都合に、組換えDNA手法の対象とされ得、ポリヌクレオチド配列の発現をもたらし得る、任意の適切なベクター(例えば、プラスミドまたはウイルス)を含む。ベクターの選択は、典型的には、ベクターが導入されるべき宿主細胞とのベクターの適合性に依存する。一部の実施形態において、ベクターは、直鎖または閉じた環状プラスミドである。
一部の実施形態において、発現ベクターは、自己複製するベクター(すなわち、染色体外実体として存在するベクター、染色体の複製に非依存性の複製、例えば、プラスミド、染色体外エレメント、ミニ染色体、または人工染色体)である。一部の実施形態において、ベクターは、自己複製を保証する任意の手段を含有する。あるいは、一部の他の実施形態において、宿主細胞に導入される際、ベクターは、ゲノムに組み込まれ、それが組み込まれている染色体(複数可)と一緒に複製される。さらに、追加の実施形態において、宿主細胞のゲノム、またはトランスポゾンに導入されるべき全DNAを一緒に含有する単一ベクターもしくはプラスミドまたは2つもしくはそれより多いベクターもしくはプラスミドが使用される。
一部の実施形態において、本発明の発現ベクターは、1つまたは複数の選択マーカーを含有し、それが、形質転換された細胞の容易な選択を可能にする。「選択マーカー」は、遺伝子、殺生物剤またはウイルス抵抗性、抗菌薬または重金属に対する抵抗性、栄養要求体への原栄養性をもたらすその生成物などである。amdS(アセトアミダーゼ)、argB(オルニチンカルバモイルトランスフェラーゼ)、bar(ホスフィノトリシンアセチルトランスフェラーゼ)、hph(ハイグロマイシンホスホトランスフェラーゼ)、niaD(硝酸還元酵素)、pyrG(オロチジン-5’-リン酸デカルボキシラーゼ)、sC(硫酸アデニルトランスフェラーゼ)、およびtrpC(アントラニル酸合成酵素)、ならびにその等価物を含むが、これらに限定されない、糸状菌宿主細胞における使用のための任意の適切な選択マーカーが、本発明において使用される。Aspergillusのような宿主細胞において有用な追加のマーカーは、これらに限定されないが、Aspergillus nidulansまたはAspergillus oryzaeのamdSおよびpyrG遺伝子、ならびにStreptomyces hygroscopicusのbar遺伝子を含む。酵母宿主細胞に適切なマーカーは、これらに限定されないが、ADE2、HIS3、LEU2、LYS2、MET3、TRP1、およびURA3を含む。細菌の選択マーカーの例は、これらに限定されないが、Bacillus subtilisもしくはBacillus licheniformis由来のdal遺伝子、またはアンピシリン、カナマイシン、クロラムフェニコール、およびもしくはテトラサイクリン抵抗性のような抗生物質抵抗性を与える、マーカーを含む。
一部の実施形態において、本発明の発現ベクターは、宿主細胞のゲノムへのベクターの組込みまたはゲノムに非依存性の細胞におけるベクターの自己複製を可能にするエレメント(複数可)を含有する。宿主細胞ゲノムへの組込みに関する一部の実施形態において、ベクターは、ポリペプチドをコードする核酸配列または相同もしくは非相同組換えによるゲノムへのベクターの組込みのためのベクターの任意の他のエレメントに依拠する。
一部の代替の実施形態において、発現ベクターは、宿主細胞のゲノムへの相同組換えによる組込みを誘導するための追加の核酸配列を含有する。追加の核酸配列は、ベクターが、染色体(複数可)における正確な場所(複数可)において宿主細胞ゲノムに組み込まれることを可能にする。正確な場所での組込みの可能性を増大させるために、組込みエレメントは、100~10,000塩基対、好ましくは、400~10,000塩基対、最も好ましくは、800~10,000塩基対のような、十分な数のヌクレオチドを好ましくは含有し、相同組換えの確率を増強するための対応する標的配列と高度に相同である。組込みエレメントは、宿主細胞のゲノムにおける標的配列と相同である任意の配列であってもよい。さらに、組込みエレメントは、非コードまたはコード核酸配列であってもよい。他方、ベクターは、非相同組換えにより、宿主細胞のゲノムに組み込まれてもよい。
自己複製のため、ベクターは、ベクターが当該宿主細胞において自己複製することを可能にする複製起点をさらに含んでもよい。細菌の複製起点の例は、P15A oriまたはプラスミドpBR322、pUC19、pACYCl77(このプラスミドは、P15A oriを有する)、もしくはpACYC184(E.coliにおける複製を可能にする)、およびpUB110、pE194、pTA1060もしくはpAMβ1(Bacillusにおける複製を可能にする)の複製起点である。酵母宿主細胞において使用するための複製起点の例は、2ミクロンの複製起点、ARS1、ARS4、ARS1とCEN3の組み合わせ、およびARS4とCEN6の組み合わせである。複製起点は、宿主細胞において温度感受性を機能させる変異を有するものであってもよい(例えば、Ehrlich, Proc. Natl. Acad. Sci. USA 75:1433[1978]を参照)。
一部の実施形態において、1つより多いコピーの本発明の核酸配列を宿主細胞に挿入して、遺伝子産物の生成を増大させる。核酸配列のコピー数における増大は、少なくとも1つの追加のコピーの配列を宿主細胞ゲノムに組み込むことにより、または増幅されたコピーの選択マーカー遺伝子、これにより追加のコピーの核酸配列を含有する細胞が、細胞を適切な選択可能な薬剤の存在下で培養することにより選択され得る場合、核酸配列と共に増幅可能な選択マーカー遺伝子を含むことにより、得られ得る。
本発明において使用するための発現ベクターの多くは、市販されている。適切な市販の発現ベクターは、これに限定されないが、哺乳動物宿主細胞における発現のためのCMVプロモーターおよびhGHポリアデニル化部位ならびにE.coliにおける増幅のためのpBR322複製起点およびアンピシリン抵抗性マーカーを含む、p3xFLAGTM(商標)発現ベクター(Sigma-Aldrich Chemicals)を含む。他の適切な発現ベクターは、これらに限定されないが、pBluescriptII SK(-)およびpBK-CMV(Stratagene)、ならびにpBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)またはpPolyからもたらされるプラスミドを含む(例えば、Latheら、Gene, 57:193-201[1987]を参照)。
したがって、一部の実施形態において、少なくとも1つのバリアントトランスアミナーゼをコードする配列を含むベクターは、ベクターの増殖およびバリアントトランスアミナーゼ(複数可)の発現を可能にするために、宿主細胞に形質転換される。一部の実施形態において、バリアントトランスアミナーゼを翻訳後修飾して、シグナルペプチドを除去し、一部の場合では、分泌後切断されてもよい。一部の実施形態において、上で記載された形質転換された宿主細胞は、適切な栄養培地において、バリアントトランスアミナーゼ(複数可)の発現を可能にする条件下で培養される。適切な栄養補助剤を含有する最小または複合培地を含むが、これらに限定されない、宿主細胞を培養するのに有用な任意の適切な培地が、本発明において使用される。一部の実施形態において、宿主細胞は、HTP培地において成長する。適切な培地は、様々な商業的供給者から入手可能であるか、または公開されたレシピに従い調製されてもよい(例えば、American Type Culture Collectionのカタログにおいて)。
別の態様において、本発明は、本明細書において提供される改善されたトランスアミナーゼポリペプチドをコードするポリヌクレオチドを含む宿主細胞であって、ポリヌクレオチドが、宿主細胞におけるトランスアミナーゼ酵素の発現のための1つまたは複数の調節配列に作動可能に連結されている、宿主細胞を提供する。本発明の発現ベクターによりコードされるトランスアミナーゼポリペプチドの発現における使用のための宿主細胞は、当技術分野において周知であり、これらに限定されないが、E.coli、Bacillus megaterium、Lactobacillus kefir、StreptomycesおよびSalmonella typhimurium細胞のような、細菌細胞;酵母細胞(例えば、Saccharomyces cerevisiaeまたはPichia pastoris(ATCC受託番号201178))のような、真菌細胞;Drosophila S2およびSpodoptera Sf9細胞のような昆虫細胞;CHO、COS、BHK、293、およびBowesメラノーマ細胞のような動物細胞;ならびに植物細胞を含む。上で記載された宿主細胞のための適切な培地および成長条件は、当技術分野において周知である。
トランスアミナーゼの発現のためのポリヌクレオチドは、当技術分野において公知の様々な方法により細胞に導入されてもよい。技術は、数ある中でも、エレクトロポレーション、微粒子銃粒子照射(biolistic particle bombardment)、リポソームにより媒介されるトランスフェクション、塩化カルシウムトランスフェクション、およびプロトプラスト融合を含む。ポリヌクレオチドを細胞に導入する様々な方法は、当業者に公知である。
一部の実施形態において、宿主細胞は、真核生物の細胞である。適切な真核生物の宿主細胞は、これらに限定されないが、真菌細胞、藻類細胞、昆虫細胞、および植物細胞を含む。適切な真菌宿主細胞は、これらに限定されないが、Ascomycota、Basidiomycota、Deuteromycota、Zygomycota、Fungi imperfectiを含む。一部の実施形態において、真菌宿主細胞は、酵母細胞および糸状菌細胞である。本発明の糸状菌宿主細胞は、亜門EumycotinaおよびOomycotaの全ての糸状形態を含む。糸状菌は、キチン、セルロースおよび他の複合体多糖から構成される細胞壁を有する栄養菌糸により特徴付けられる。本発明の糸状菌宿主細胞は、酵母と形態学的に異なる。
本発明の一部の実施形態において、糸状菌宿主細胞は、Achlya、Acremonium、Aspergillus、Aureobasidium、Bjerkandera、Ceriporiopsis、Cephalosporium、Chrysosporium、Cochliobolus、Corynascus、Cryphonectria、Cryptococcus、Coprinus、Coriolus、Diplodia、Endothis、Fusarium、Gibberella、Gliocladium、Humicola、Hypocrea、Myceliophthora、Mucor、Neurospora、Penicillium、Podospora、Phlebia、Piromyces、Pyricularia、Rhizomucor、Rhizopus、Schizophyllum、Scytalidium、Sporotrichum、Talaromyces、Thermoascus、Thielavia、Trametes、Tolypocladium、Trichoderma、Verticillium、および/もしくはVolvariella、ならびに/またはその有性世代、もしくは無性世代、および異名、バシオニム、もしくは分類学的等価物を含むが、これらに限定されない、任意の適切な属または種のものである。
本発明の一部の実施形態において、宿主細胞は、Candida、Hansenula、Saccharomyces、Schizosaccharomyces、Pichia、Kluyveromyces、またはYarrowia種の細胞を含むが、これらに限定されない、酵母細胞である。本発明の一部の実施形態において、酵母細胞は、Hansenula polymorpha、Saccharomyces cerevisiae、Saccharomyces carlsbergensis、Saccharomyces diastaticus、Saccharomyces norbensis、Saccharomyces kluyveri、Schizosaccharomyces pombe、Pichia pastoris、Pichia finlandica、Pichia trehalophila、Pichia kodamae、Pichia membranaefaciens、Pichia opuntiae、Pichia thermotolerans、Pichia salictaria、Pichia quercuum、Pichia pijperi、Pichia stipitis、Pichia methanolica、Pichia angusta、Kluyveromyces lactis、Candida albicans、またはYarrowia lipolyticaである。
本発明の一部の実施形態において、宿主細胞は、Chlamydomonas(例えば、C. reinhardtii)およびPhormidium(例えば、Phormidium sp. ATCC29409)のような藻類細胞である。
一部の他の実施形態において、宿主細胞は、原核細胞である。適切な原核細胞は、これらに限定されないが、グラム陽性、グラム陰性、およびグラム不定細菌細胞を含む。Agrobacterium、Alicyclobacillus、Anabaena、Anacystis、Acinetobacter、Acidothermus、Arthrobacter、Azobacter、Bacillus、Bifidobacterium、Brevibacterium、Butyrivibrio、Buchnera、Campestris、Camplyobacter、Clostridium、Corynebacterium、Chromatium、Coprococcus、Escherichia、Enterococcus、Enterobacter、Erwinia、Fusobacterium、Faecalibacterium、Francisella、Flavobacterium、Geobacillus、Haemophilus、Helicobacter、Klebsiella、Lactobacillus、Lactococcus、Ilyobacter、Micrococcus、Microbacterium、Mesorhizobium、Methylobacterium、Methylobacterium、Mycobacterium、Neisseria、Pantoea、Pseudomonas、Prochlorococcus、Rhodobacter、Rhodopseudomonas、Rhodopseudomonas、Roseburia、Rhodospirillum、Rhodococcus、Scenedesmus、Streptomyces、Streptococcus、Synecoccus、Saccharomonospora、Staphylococcus、Serratia、Salmonella、Shigella、Thermoanaerobacterium、Tropheryma、Tularensis、Temecula、Thermosynechococcus、Thermococcus、Ureaplasma、Xanthomonas、Xylella、YersiniaおよびZymomonasを含むが、これらに限定されない、任意の適切な細菌生物が、本発明において使用される。一部の実施形態において、宿主細胞は、Agrobacterium、Acinetobacter、Azobacter、Bacillus、Bifidobacterium、Buchnera、Geobacillus、Campylobacter、Clostridium、Corynebacterium、Escherichia、Enterococcus、Erwinia、Flavobacterium、Lactobacillus、Lactococcus、Pantoea、Pseudomonas、Staphylococcus、Salmonella、Streptococcus、Streptomyces、またはZymomonasの種である。一部の実施形態において、細菌宿主株は、ヒトにとって非病原性である。一部の実施形態において、細菌宿主株は、産業株である。多数の細菌の産業株が公知であり、本発明において適切である。本発明の一部の実施形態において、細菌の宿主細胞は、Agrobacterium種(例えば、A.radiobacter、A.rhizogenes、およびA.rubi)である。本発明の一部の実施形態において、細菌の宿主細胞は、Arthrobacter種(例えば、A.aurescens、A.citreus、A.globiformis、A.hydrocarboglutamicus、A.mysorens、A.nicotianae、A.paraffineus、A.protophonniae、A.roseoparqffinus、A.sulfureus、およびA.ureafaciens)である。本発明の一部の実施形態において、細菌の宿主細胞は、Bacillus種(例えば、B.thuringensis、B.anthracis、B.megaterium、B.subtilis、B.lentus、B.circulans、B.pumilus、B.lautus、B.coagulans、B.brevis、B.firmus、B.alkaophius、B.licheniformis、B.clausii、B.stearothermophilus、B.halodurans、およびB.amyloliquefaciens)である。一部の実施形態において、宿主細胞は、B.subtilis、B.pumilus、B.licheniformis、B.megaterium、B.clausii、B.stearothermophilus、またはB.amyloliquefaciensを含むが、これらに限定されない、産業上のBacillus株である。一部の実施形態において、Bacillus宿主細胞は、B.subtilis、B.licheniformis、B.megaterium、B.stearothermophilus、および/またはB.amyloliquefaciensである。一部の実施形態において、細菌の宿主細胞は、Clostridium種(例えば、C.acetobutylicum、C.tetaniE88、C.lituseburense、C.saccharobutylicum、C.perfringens、およびC.Beijerinckii)である。一部の実施形態において、細菌の宿主細胞は、Corynebacterium種(例えば、C.glutamicumおよびC.acetoacidophilum)である。一部の実施形態において、細菌の宿主細胞は、Escherichia種(例えば、E.coli)である。一部の実施形態において、宿主細胞は、Escherichia coli W3110である。一部の実施形態において、細菌の宿主細胞は、Erwinia種(例えば、E.uredovora、E.carotovora、E.ananas、E.herbicola、E.punctata、およびE.terreus)である。一部の実施形態において、細菌の宿主細胞は、Pantoea種(例えば、P.citrea、およびP.agglomerans)である。一部の実施形態において、細菌の宿主細胞は、Pseudomonas種(例えば、P.putida、P.aeruginosa、P.mevalonii、およびP.sp.D-0l 10)である。一部の実施形態において、細菌の宿主細胞は、Streptococcus種(例えば、S.equisimiles、S.pyogenes、およびS.uberis)である。一部の実施形態において、細菌の宿主細胞は、Streptomyces種(例えば、S.ambofaciens、S.achromogenes、S.avermitilis、S.coelicolor、S.aureofaciens、S.aureus、S.fungicidicus、S.griseus、およびS.lividans)である。一部の実施形態において、細菌の宿主細胞は、Zymomonas種(例えば、Z.mobilis、およびZ.lipolytica)である。
本発明において使用される多くの原核生物および真核生物株は、American Type Culture Collection(ATCC)、Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)、およびAgricultural Research Service Patent Culture Collection、Northern Regional Research Center(NRRL)のような多数の培養収集物から公開されて容易に入手可能である。
一部の実施形態において、宿主細胞を遺伝子修飾して、タンパク質分泌、タンパク質安定性ならびに/またはタンパク質の発現および/もしくは分泌のため望ましい他の特性を改善する特徴を有するようにする。遺伝子修飾は、遺伝子操作技術ならびに/または古典的な微生物学的技術(例えば、化学的もしくはUV変異誘発および続く選択)により達成することができる。実際に、一部の実施形態において、組換え修飾と古典的な選択技術の組み合わせを使用して、宿主細胞を産生する。組換え技法を使用して、宿主細胞内および/または培養培地においてトランスアミナーゼバリアント(複数可)の収量の増大をもたらすように、核酸分子を導入するか、欠失させるか、阻害するか、または修飾することができる。例えば、Alp1機能のノックアウトは、プロテアーゼ欠乏である細胞をもたらし、pyr5機能のノックアウトは、ピリミジン欠乏表現型を有する細胞をもたらす。1つの遺伝子操作アプローチにおいて、相同組換えを使用して、コードされるタンパク質の発現を抑制するようin vivoで遺伝子を特異的に標的化することにより、標的化された遺伝子修飾を誘導する。代替のアプローチにおいて、siRNA、アンチセンスおよび/またはリボザイムテクノロジーは、遺伝子発現の阻害において使用される。タンパク質をコードする遺伝子の全てまたは一部の欠失、遺伝子産物の発現または活性を破壊するための部位特異的変異誘発を含むが、これらに限定されない、細胞におけるタンパク質の発現を低減する様々な方法が、当技術分野において公知である。(例えば、これらの全てが参照により本明細書に組み込まれる、Chaverocheら、Nucl. Acids Res., 28:22 e97[2000];Choら、Mol. Plant Mic. Interact., 19:7-15[2006];Maruyama and Kitamoto, Biotechnol Lett., 30:1811-1817[2008];Takahashiら、Mol. Gen. Genom., 272:344-352[2004];およびYouら、Arch. Micriobiol., 191:615-622[2009]を参照)。ランダム変異誘発、続いて、所望の変異についてのスクリーニングも使用される(例えば、これらの両方が参照により本明細書に組み込まれる、Combier et al, FEMS Microbiol. Lett., 220:141-8[2003];およびFironら、Eukary. Cell, 2:247-55[2003]を参照)。
宿主細胞へのベクターまたはDNA構築物の導入は、リン酸カルシウムトランスフェクション、DEAE-デキストランにより媒介されるトランスフェクション、PEGにより媒介される形質転換、エレクトロポレーション、または当技術分野において公知の他の共通の技術を含むが、これらに限定されない、当技術分野において公知の任意の適切な方法を使用して成し遂げることができる。一部の実施形態において、Escherichia coli発現ベクターpCK100900i(参照により本明細書に組み込まれる、米国特許出願公開第2006/0195947号を参照)が使用される。
一部の実施形態において、本発明の操作された宿主細胞(すなわち、「組換え宿主細胞」)は、プロモーターの活性化、形質転換体の選択、またはトランスアミナーゼポリヌクレオチドの増幅に適切であるとして改変された従来の栄養培地において培養される。温度、pHなどのような、培養条件は、発現について選択された宿主細胞と共に既に使用されたものであり、当業者に周知である。注意される通り、多くの標準的な参考文献およびテキストが、細菌、植物、動物(特に、哺乳動物)、および古細菌起源の細胞を含む、多くの細胞の培養ならびに産生に利用可能である。
一部の実施形態において、本発明のバリアントトランスアミナーゼポリペプチドを発現する細胞は、バッチまたは連続発酵条件下で成長する。古典的な「バッチ発酵」は、密閉システムであり、培地の組成が、発酵の開始時に設定され、発酵中に人工的な変更の対象にされない。バッチシステムのバリエーションは、本発明においてまた使用される、「流加発酵」である。このバリエーションにおいて、基質は、発酵が進行するにつれ、漸増して加えられる。カタボライト抑制が恐らく、細胞の代謝を阻害するとき、および培地において制限された量の基質を有することが望ましい場合、流加システムは有用である。バッチおよび流加発酵は、一般的であり、当技術分野において周知である。「連続発酵」は、規定の発酵培地が、バイオリアクターに連続して加えられ、等しい量の条件培地が、処理のため同時に除去される、開放システムである。連続発酵は、一般に、細胞が、主に対数期成長にある、一定の高い密度の培養物を維持する。連続発酵システムは、努めて定常状態の成長状態を維持する。連続発酵プロセスのための栄養および増殖因子を調整する方法ならびに生成物形成の速度を最大にする技術は、産業上の微生物学の技術分野において周知である。
本発明の一部の実施形態において、細胞を含まない転写/翻訳システムは、バリアントトランスアミナーゼ(複数可)の生成において使用される。いくつかのシステムは、市販されており、方法は、当業者に周知である。
本発明は、バリアントトランスアミナーゼポリペプチドまたはその生物学的に活性な断片を製造する方法を提供する。一部の実施形態において、方法は、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156に対して少なくとも約70%(または少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%)の配列同一性を含む、ならびに本明細書において提供される少なくとも1つの変異を含むアミノ酸配列をコードするポリヌクレオチドを用いて形質転換された宿主細胞を提供するステップ;形質転換された宿主細胞を、培養培地において、宿主細胞がコードされたバリアントトランスアミナーゼポリペプチドを発現する条件下で、培養するステップ;ならびに必要に応じて、発現したバリアントトランスアミナーゼポリペプチドを回収するステップもしくは単離するステップ、および/または発現したバリアントトランスアミナーゼポリペプチドを含有する培養培地を回収するステップもしくは単離するステップを含む。一部の実施形態において、方法は、必要に応じて、コードされるトランスアミナーゼポリペプチドを発現させた後、形質転換された宿主細胞を溶解するステップ、ならびに必要に応じて、発現されたバリアントトランスアミナーゼポリペプチドを細胞溶解物から回収するステップおよび/または単離するステップをさらに提供する。本発明は、バリアントトランスアミナーゼポリペプチドを用いて形質転換された宿主細胞を、バリアントトランスアミナーゼポリペプチドの生成に適した条件下で培養するステップ、およびバリアントトランスアミナーゼポリペプチドを回収するステップを含む、バリアントトランスアミナーゼポリペプチドを製造する方法をさらに提供する。典型的には、トランスアミナーゼポリペプチドは、宿主細胞培養培地、宿主細胞または両方から、本明細書において記載されるものを含む、当技術分野において周知のタンパク質回収技術を使用して、回収または単離される。一部の実施形態において、宿主細胞は、遠心分離により採取され、物理的または化学的手段により破壊され、得られた粗製抽出物は、さらなる精製のため保持される。タンパク質の発現において利用される微生物細胞は、凍結と融解のサイクル、超音波処理、機械的破壊、および/または細胞溶解剤の使用、ならびに当業者に周知の多くの他の適切な方法を含むが、これらに限定されない、任意の便利な方法により破壊することができる。
宿主細胞により生成される操作されたトランスアミナーゼ酵素は、細胞および/または培養培地から、数ある中でも、リゾチーム処置、超音波処理、濾過、塩析、超遠心分離、およびクロマトグラフィーを含む、タンパク質精製のため当技術分野において公知の技術のいずれか1つまたは複数を使用して回収することができる。E. coliのような、細菌からのタンパク質の溶解および高い効率の抽出に適切な溶液は、商標名CelLytic B(商標)(Sigma-Aldrich)の下市販されている。したがって、一部の実施形態において、得られたポリペプチドは、回収され/単離され、必要に応じて、当技術分野において公知の多数の方法のいずれかにより精製される。例えば、一部の実施形態において、ポリペプチドは、栄養培地から、遠心分離、濾過、抽出、噴霧乾燥、蒸発、クロマトグラフィー(例えば、イオン交換、アフィニティー、疎水性相互作用、等電点電気泳動、およびサイズ除外)、または沈殿を含むが、これらに限定されない、従来の手法により、単離される。一部の実施形態において、タンパク質リフォールディングステップが、成熟タンパク質の配置の完了において、望まれる通り、使用される。加えて、一部の実施形態において、高速液体クロマトグラフィー(HPLC)が、最終精製ステップにおいて利用される。例えば、一部の実施形態において、当技術分野において公知の方法が、本発明において使用される(例えば、これらの両方が参照により本明細書に組み込まれる、Parryら、Biochem. J., 353:117[2001];およびHongら、Appl. Microbiol. Biotechnol., 73:1331[2007]を参照)。実際に、当技術分野において公知の任意の適切な精製方法は、本発明において使用される。
トランスアミナーゼポリペプチドの単離のためのクロマトグラフ技術は、これらに限定されないが、逆相クロマトグラフィー高速液体クロマトグラフィー、イオン交換クロマトグラフィー、ゲル電気泳動、およびアフィニティークロマトグラフィーを含む。特定の酵素を精製するための条件は、当業者に公知である、正味の荷電、疎水性、親水性、分子量、分子の形などのような因子に、一部依存する。
一部の実施形態において、改善されたトランスアミナーゼ酵素の単離においてアフィニティー技術が使用される。アフィニティークロマトグラフィー精製のため、トランスアミナーゼポリペプチドに特異的に結合する任意の抗体が使用されてもよい。抗体の産生のため、ウサギ、マウス、ラットなどを含むが、これらに限定されない、様々な宿主動物が、トランスアミナーゼを用いた注射により免疫化されてもよい。トランスアミナーゼポリペプチドは、BSAのような、適切な担体に、側鎖官能基または側鎖官能基に結合したリンカーにより、結合されてもよい。宿主の種に依存して、フロイント(完全および不完全)、水酸化アルミニウムのようなミネラルゲル、リゾレシチンのような表面活性物質、プルロニックポリオール、ポリアニオン、ペプチド、オイルエマルジョン、キーホールリンペットヘモシアニン、ジニトロフェノール、ならびにBCG(Bacillus Calmette Guerin)およびCorynebacterium parvumのような潜在的に有用なヒトアジュバントを含むが、これらに限定されない、様々なアジュバントを使用して、免疫応答が増大されてもよい。
一部の実施形態において、トランスアミナーゼバリアントは、酵素を発現する細胞の形態で、粗製抽出物として、または単離もしくは精製された調製物として、調製され、使用される。一部の実施形態において、トランスアミナーゼバリアントは、粉末形態(例えば、アセトン粉末)で、凍結乾燥物として調製されるか、または酵素溶液として調製される。一部の実施形態において、トランスアミナーゼバリアントは、実質的に純粋な調製物の形態である。
一部の実施形態において、トランスアミナーゼポリペプチドは、任意の適切な固体基材に結合される。固体基材は、これらに限定されないが、固相、表面、および/または膜を含む。固体支持体は、これらに限定されないが、ポリスチレン、ポリエチレン、ポリプロピレン、ポリフルオロエチレン、ポリエチレンオキシ、およびポリアクリルアミドのような有機ポリマー、ならびにそれらのコポリマーおよびグラフトを含む。固体支持体はまた、無機、例えば、ガラス、シリカ、制御孔質ガラス(CPG)、逆相シリカまたは金属、例えば、金もしくは白金であり得る。基材の構成は、ビーズ、球、粒子、顆粒、ゲル、膜または表面の形態であり得る。表面は、平面、実質的に平面、または非平面であり得る。固体支持体は、多孔性または非多孔性であり得、膨張または非膨張特徴を有し得る。固体支持体は、ウェル、くぼみ、または他の容器、器、特色、または場所の形態で構成され得る。複数の支持体は、アレイ上、試薬のロボットデリバリーのためアドレス指定可能な、または検出方法および/もしくは装置により様々な場所で構成され得る。
一部の実施形態において、免疫学的方法を使用して、トランスアミナーゼバリアントを精製する。1つのアプローチにおいて、従来の方法を使用したバリアントトランスアミナーゼポリペプチドに対して(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/もしくは156を含むが、これらに限定されない、本明細書において提供される操作されたトランスアミナーゼバリアントを含むポリペプチド、ならびに/またはその免疫原性断片に対して)生じた抗体が、ビーズに固定され、バリアントトランスアミナーゼが結合される条件下で細胞培養培地と混合され、沈殿される。関連するアプローチにおいて、イムノクロマトグラフィーが使用される。
一部の実施形態において、バリアントトランスアミナーゼは、非酵素部分を含む融合タンパク質として発現される。一部の実施形態において、バリアントトランスアミナーゼ配列は、精製促進ドメインに融合される。本明細書において使用される場合、用語「精製促進ドメイン」は、それが融合されるポリペプチドの精製を媒介するドメインを指す。適切な精製ドメインは、これらに限定されないが、金属キレートペプチド、固定された金属上での精製を可能にするヒスチジン-トリプトファンモジュール、グルタチオン(例えば、GST)に結合する配列、赤血球凝集素(HA)タグ(インフルエンザ赤血球凝集素タンパク質からもたらされるエピトープに対応する;例えば、Wilsonら、Cell 37:767[1984]を参照)、マルトース結合タンパク質配列、FLAGS伸長/アフィニティー精製システムにおいて利用されるFLAGエピトープ(例えば、Immunex Corpから入手可能なシステム)などを含む。本明細書において記載される組成物および方法における使用が考慮される1つの発現ベクターは、エンテロキナーゼ切断部位により分けられるポリヒスチジン領域に融合された本発明のポリペプチドを含む融合タンパク質の発現をもたらす。ヒスチジン残基は、IMIAC(固定された金属イオンアフィニティークロマトグラフィー;例えば、Porathら、Prot. Exp. Purif., 3:263-281[1992]を参照)上での精製を促進し、一方、エンテロキナーゼ切断部位は、バリアントトランスアミナーゼポリペプチドを融合タンパク質から分ける手段をもたらす。pGEXベクター(Promega)をまた使用して、グルタチオンS-トランスフェラーゼ(GST)との融合タンパク質として外来ポリペプチドを発現させてもよい。一般に、かかる融合タンパク質は、可溶性であり、リガンド-アガロースビーズ(例えば、GST-融合物の場合におけるグルタチオン-アガロース)への吸着、続いて、遊離リガンドの存在下での溶出により、溶解された細胞から容易に精製することができる。
操作されたトランスアミナーゼ酵素の使用方法
別の態様において、本明細書において開示される操作されたトランスアミナーゼポリペプチドは、基質化合物(2)またはその構造上の類似体から、化合物(1)の生成物または対応する構造上の類似体への変換のプロセスにおいて使用することができる。
本明細書において記載され、実施例において説明される通り、本発明は、pH、温度、緩衝液、溶媒系、基質負荷量、基質化合物立体異性体の混合物、ポリペプチド負荷量、補助因子負荷量、圧力、および反応時間の範囲を含むが、これらに限定されない、本明細書におけるプロセスにおいて使用され得る適切な反応条件の範囲を考慮する。本明細書において記載される操作されたトランスアミナーゼポリペプチドを使用して、基質化合物から生成物化合物への生体触媒性変換のプロセスを行うためのさらなる適切な反応条件は、操作されたトランスアミナーゼポリペプチドおよび基質化合物を、濃度、pH、温度、溶媒条件の実験反応条件下で接触させること、および例えば、本明細書において提供される実施例において記載される方法を使用して、生成物化合物を検出することを含むが、これらに限定されない、日常的な実験により容易に最適化することができる。
上で記載された通り、本発明のプロセスにおいて使用するためのトランスアミナーゼ活性を有する操作されたポリペプチドは、一般に、配列番号6~172の偶数番号の配列のいずれか1つから選択される参照アミノ酸配列に対して少なくとも80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれより高い同一性を有するアミノ酸配列を含み、操作されたトランスアミナーゼポリペプチドは、(a)参照配列(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)と比較して、1つまたは複数のアミノ酸残基の違いを有するアミノ酸配列を含む。一部の実施形態において、高度にストリンジェントな条件下でハイブリダイズする能力があるポリヌクレオチドは、上で記載されたパーセント同一性、ならびに参照配列(例えば、配列番号2、4、18、20、30、48、66、70、88、110、112、120、138、および/または156)と比較して、1つまたは複数の残基の違いを有するトランスアミナーゼポリペプチドをコードする。
反応混合物における基質化合物は、例えば、所望の量の生成物化合物、酵素活性に対する基質濃度の作用、反応条件下での酵素の安定性、および基質から生成物への変換パーセントを考慮して、変動することができる。方法の一部の実施形態において、適切な反応条件は、少なくとも約0.5~約200g/L、1~約200g/L、5~約150g/L、約10~約100g/L、または約50~約100g/Lの基質化合物負荷量を含む。一部の実施形態において、適切な反応条件は、少なくとも約0.5g/L、少なくとも約1g/L、少なくとも約5g/L、少なくとも約10g/L、少なくとも約15g/L、少なくとも約20g/L、少なくとも約30g/L、少なくとも約50g/L、少なくとも約75g/L、少なくとも約100g/L、少なくとも約150g/Lもしくは少なくとも約200g/L、またはさらにそれより高い基質化合物負荷量を含む。本明細書において提供される基質負荷量についての値は、化合物(2)の分子量に基づくが、等しいモル量の化合物(2)の様々な水和物および塩も、プロセスにおいて使用することができることも考慮される。
本明細書において記載されるプロセスにおいて、操作されたトランスアミナーゼポリペプチドは、アミノドナーを使用して、生成物化合物を形成させる。一部の実施形態において、反応条件におけるアミノドナーは、イソプロピルアミン(本明細書において「IPM」とも称する)から選択される化合物または目的の反応のための任意の他の適切なアミノドナーを含む。一部の実施形態において、アミノドナーは、IPMである。一部の実施形態において、適切な反応条件は、少なくとも約0.1~約3.0M、0.2~約2.5M、約0.5~約2Mまたは約1~約2Mの濃度で存在する、アミノドナー、特に、IPMを含む。一部の実施形態において、アミノドナーは、約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、1、1.5、2、2.5または3Mの濃度で存在する。
プロセスに適切な反応条件はまた、典型的には、反応混合物における補助因子の存在を含む。操作されたトランスアミナーゼは、典型的には、ビタミンB6ファミリーのメンバーを使用するので、反応条件は、-ピリドキサール-5’-ホスフェート(リン酸ピリドキサール、PLP、P5Pとしても公知)、ピリドキシン(PN)、ピリドキサール(PL)、ピリドキサミン(PM)、およびそれらのリン酸化対応物;リン酸ピリドキシン(PNP)、およびリン酸ピリドキサミン(PMP)から選択される補助因子を含んでもよい。一部の実施形態において、適切な反応条件は、約0.1g/L~約10g/L、約0.2g/L~約5g/L、約0.5g/L~約2.5g/Lの濃度で、PLP、PN、PL、PM、PNP、およびPMPから選択される補助因子の存在を含み得る。一部の実施形態において、補助因子は、PLPである。したがって、一部の実施形態において、適切な反応条件は、約0.1g/L~約10g/L、約0.2g/L~約5g/L、約0.5g/L~約2.5g/Lの濃度で、補助因子、PLPの存在を含み得る。一部の実施形態において、反応条件は、約10g/Lもしくはそれより低い、約5g/Lもしくはそれより低い、約2.5g/Lもしくはそれより低い、約1.0g/Lもしくはそれより低い、約0.5g/Lもしくはそれより低い、または約0.2g/Lもしくはそれより低いPLP濃度を含む。
プロセスの一部の実施形態(例えば、細胞全体または溶解物が使用される場合)において、補助因子は、細胞抽出物において天然で存在し、添加される必要はない。プロセスの一部の実施形態(例えば、部分的に精製された、または精製されたトランスアミナーゼ酵素を使用する)において、プロセスは、補助因子を酵素反応混合物に加えるステップをさらに含み得る。一部の実施形態において、補助因子は、反応の開始時に加えられ、および/または追加の補助因子は、反応中に加えられる。
アミノ基転移反応の経過中に、反応混合物のpHは、変化してもよい。反応混合物のpHは、所望のpHにおいてまたは所望のpH範囲内で維持されてもよい。これは、反応の経過前および/もしくは経過中、酸または塩基を加えることにより、なされてもよい。あるいは、pHは、緩衝液を使用することにより、調節されてもよい。したがって、一部の実施形態において、反応条件は、緩衝液を含む。所望のpH範囲を維持するのに適切な緩衝液は、当技術分野において公知であり、例示および限定でない目的で、ホウ酸緩衝液、炭酸緩衝液、リン酸緩衝液、トリエタノールアミン(TEA)緩衝液などを含む。一部の実施形態において、緩衝液は、TEAである。プロセスの一部の実施形態において、適切な反応条件は、TEAの緩衝溶液を含み、TEA濃度は、約0.01~約0.4M、0.05~約0.4M、0.1~約0.3M、または約0.1~約0.2Mである。一部の実施形態において、反応条件は、約0.01、0.02、0.03、0.04、0.05、0.07、0.1、0.12、0.14、0.16、0.18、0.2、0.3、または0.4MのTEA濃度を含む。一部の実施形態において、反応条件は、緩衝液が存在しない適切な溶媒として水を含む。
プロセスの一部の実施形態において、反応条件は、適切なpHを含み得る。上で注意される通り、所望のpHまたは所望のpH範囲は、酸もしくは塩基、適切な緩衝液、または緩衝化と酸もしくは塩基添加の組み合わせの使用により維持され得る。反応混合物のpHは、反応の経過前および/または経過中に調節することができる。一部の実施形態において、適切な反応条件は、溶液pH約8~約12.5、pH約8~約12、pH約9.0~約11.5、またはpH約9.5~約11.0を含む。一部の実施形態において、反応条件は、約8、8.5、9、9.5、10、10.5、11、11.5、12または12.5の溶液pHを含む。
本明細書におけるプロセスの一部の実施形態において、適切な温度が、例えば、より高い温度での反応速度における増大、反応の十分な持続時間の酵素の活性、および以下でさらに記載されるものを考慮して、反応条件のため使用され得る。例えば、本発明の操作されたポリペプチドは、天然に存在するトランスアミナーゼポリペプチドと比べて、増大した安定性を有し、本発明の操作されたポリペプチドが、増大した変換速度および反応のため改善された基質溶解度特徴のためより高い温度にて使用されるのを可能にする。したがって、一部の実施形態において、適切な反応条件は、約10℃~約70℃、約10℃~約65℃、約15℃~約60℃、約20℃~約60℃、約20℃~約55℃、約30℃~約55℃、または約40℃~約50℃の温度を含む。一部の実施形態において、適切な反応条件は、温度約10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、または70℃を含む。一部の実施形態において、酵素反応中の温度は、反応の経過を通じてある温度にて維持され得る。一部の実施形態において、酵素反応中の温度は、反応の経過中に温度プロファイルにわたり調整され得る。
プロセスの一部の実施形態において、適切な反応条件は、還元型補助因子であるニコチンアミドアデニンジヌクレオチド(NADH)の存在をさらに含むことができ、トランスアミナーゼ酵素の不活性化を制限するよう作用することができる(例えば、van Ophemら、Biochem., 37(9):2879-88[1998]を参照)。NADHが存在するかかる実施形態において、グルコース脱水素酵素(GDH)およびグルコースまたはギ酸脱水素酵素およびギ酸塩のような、補助因子再生システムを使用して、反応媒体においてNADHを再生することができる。
操作されたトランスアミナーゼを使用するプロセスは、一般に、溶媒において行われる。適切な溶媒は、水、水性緩衝溶液、有機溶媒、および/または共溶媒系を含み、一般に、水性溶媒および有機溶媒を含む。水性溶媒(水または水性共溶媒系)は、pH緩衝化されるか、または緩衝化されていなくてもよい。一部の実施形態において、操作されたトランスアミナーゼポリペプチドを使用するプロセスは、一般に、有機溶媒(例えば、エタノール、イソプロパノール(IPA)、ジメチルスルホキシド(DMSO)、酢酸エチル、酢酸ブチル、1-オクタノール、ヘプタン、オクタン、メチルt-ブチルエーテル(MTBE)、トルエンなど)、イオン性液体(例えば、1-エチル4-メチルイミダゾリウムテトラフルオロボレート、1-ブチル-3-メチルイミダゾリウムテトラフルオロボレート、1-ブチル-3-メチルイミダゾリウムヘキサフルオロホスフェートなど)を含む水性共溶媒系において行われる。水性共溶媒系の有機溶媒成分は、単一の液相をもたらす、水性成分と混和性であってもよいか、または2つの液相をもたらす、水性成分と部分的な混和性もしくは非混和性であってもよい。例示的な水性共溶媒系は、水および1つまたは複数の有機溶媒を含む。一般に、水性共溶媒系の有機溶媒成分は、それが、トランスアミナーゼ酵素を完全に不活性化しないように、選択される。適切な共溶媒系は、本明細書において記載されるもののような、酵素活性アッセイを利用して、候補溶媒系において目的の規定の基質を用いて特定された操作されたトランスアミナーゼ酵素の酵素活性を測定することにより、容易に同定することができる。プロセスの一部の実施形態において、適切な反応条件は、約1%~約80%(v/v)、約1~約70%(v/v)、約2%~約60%(v/v)、約5%~約40%(v/v)、10%~約40%(v/v)、10%~約30%(v/v)、または約10%~約20%(v/v)の濃度でDMSOを含む水性共溶媒を含む。プロセスの一部の実施形態において、適切な反応条件は、少なくとも約1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、または80%(v/v)の濃度でDMSOを含む水性共溶媒を含む。
適切な反応条件は、基質化合物からその対応する生成物化合物への生体触媒性変換をもたらす反応パラメーターの組み合わせを含み得る。したがって、プロセスの一部の実施形態において、反応パラメーターの組み合わせは、(a)約2~200g/L基質化合物(例えば、化合物(2))の基質負荷量;(b)操作されたポリペプチド濃度約0.5g/L~5g/L;(c)IPM濃度約0.1~3M;(d)PLP補助因子濃度約0.1~1g/L;(e)DMSO濃度約0%(v/v)~約60%(v/v);(f)pH約8.5~11.5;および(g)温度約45℃~60℃を含む。
一部の実施形態において、反応パラメーターの組み合わせは、(a)約50g/Lの基質化合物(例えば、化合物(2));(b)約2g/Lの操作されたポリペプチド;(c)約10%(v/v)のジメチルスルホキシド(DMSO);(d)約1Mのイソプロピルアミン(IPM);(e)約1g/Lのリン酸ピリドキサール(PLP);(f)約pH9;および(g)約50℃を含む。
一部の実施形態において、反応パラメーターの組み合わせは、(a)約50g/Lの基質化合物(例えば、化合物(2));(b)約1g/Lの操作されたポリペプチド;(c)約10%(v/v)のジメチルスルホキシド(DMSO);(d)約1Mのイソプロピルアミン(IPM);(e)約1g/Lのリン酸ピリドキサール(PLP);(f)約pH10;および(g)約55℃を含む。
一部の実施形態において、反応パラメーターの組み合わせは、(a)約50g/Lの基質化合物(例えば、化合物(2));(b)約0.5g/Lの操作されたポリペプチド;(c)約10%(v/v)のジメチルスルホキシド(DMSO);(d)約2Mのイソプロピルアミン(IPM);(e)約1g/Lのリン酸ピリドキサール(PLP);(f)約pH10.5;および(g)約55℃を含む。
さらに例示的な反応条件は、実施例において提供されるアッセイ条件を含む。本明細書において記載されるアミノ基転移反応の実施において、操作されたトランスアミナーゼポリペプチドは、反応混合物に、部分的に精製された、または精製された酵素、酵素をコードする遺伝子(複数可)を用いて形質転換された細胞全体において、ならびに/またはかかる細胞の細胞抽出物および/もしくは溶解物として加えられてもよい。操作されたトランスアミナーゼ酵素をコードする遺伝子(複数可)を用いて形質転換された細胞全体または細胞抽出物、その溶解物、および単離された酵素は、固体(例えば、凍結乾燥、噴霧乾燥など)または半固体(例えば、粗製ペースト)を含む、様々な異なる形態で利用されてもよい。細胞抽出物または細胞溶解物は、凍結乾燥に先立ち、沈殿(例えば、硫酸アンモニウム、ポリエチレンイミン、熱処理など)、続いて、脱塩手法(例えば、限外濾過、透析など)により部分的に精製されてもよい。酵素調製物のいずれかは、例えば、グルタルアルデヒドのような、公知の架橋剤を使用した架橋により安定化されるか、または固相物質(例えば、樹脂、ビーズ、例えば、キトサン、Eupergit C、SEPABEADなど)に固定されてもよい。
本明細書において記載されるアミノ基転移反応の一部の実施形態において、反応は、本明細書において記載される適切な反応条件下で行われ、操作されたトランスアミナーゼポリペプチドは、固体支持体に固定される。アミノ基転移反応を行うための操作されたトランスアミナーゼポリペプチドを固定するのに有用な固体支持体は、これらに限定されないが、エポキシド官能基を有するポリメタクリレート、アミノエポキシド官能基を有するポリメタクリレート、スチレン/DVBコポリマーもしくはオクタデシル官能基を有するポリメタクリレートを含むビーズまたは樹脂を含む。例示的な固体支持体は、これらに限定されないが、キトサンビーズ、Eupergit C、ならびに次の異なるタイプのSEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119およびEXE120を含む、SEPABEAD(Mitsubishi)を含む。
操作されたポリペプチドが、分泌されたポリペプチドの形態で発現され得る、一部の実施形態において、分泌されたポリペプチドを含有する培養培地は、本明細書におけるプロセスにおいて使用され得る。
一部の実施形態において、固体反応物(例えば、酵素、塩など)は、粉末(例えば、凍結乾燥、噴霧乾燥など)、溶液、エマルジョン、懸濁物などを含む、様々な異なる形態で反応に提供されてもよい。反応物は、当業者に公知である方法および装置を使用して、容易に凍結乾燥されるか、または噴霧乾燥され得る。例えば、タンパク質溶液は、小アリコートで-80℃にて凍結され、次に、予め冷却した凍結乾燥チャンバーに加えられ、続いて、真空適用され得る。
一部の実施形態において、反応物の添加の順は、重大ではない。反応物は、同じときに、溶媒(例えば、単相溶媒、二相性水性共溶媒系など)に一緒に加えられるか、または代わりに、反応物の一部を、分けて、異なる時点にて一部一緒に加えられてもよい。例えば、補助因子、トランスアミナーゼ、およびトランスアミナーゼ基質が、溶媒にまず加えられてもよい。改善された混合効率のため、水性共溶媒系が使用されるとき、トランスアミナーゼ、および補助因子が、水相にまず加えられ、混合されてもよい。次に、有機相が加えられ、混合され、続いて、トランスアミナーゼ基質が加えられてもよい。あるいは、トランスアミナーゼ基質は、水相への添加に先立ち、有機相において予め混合されてもよい。
一部の実施形態において、アミノドナーの選択が、水より高い蒸気圧(例えば、揮発性有機カルボニル化合物のような低い沸点の共生成物)を有するカルボニル副生成物を生じる場合、カルボニル副生成物が、反応溶液に非反応性のガスを吹き込むことにより、または真空を適用して反応圧を低下させ、ガス相に存在するカルボニル副生成物を除去することにより、除去され得る。非反応性ガスは、反応成分と反応しない任意のガスである。様々な非反応性ガスは、窒素および希ガス(例えば、不活性ガス)を含む。一部の実施形態において、非反応性ガスは、窒素ガスである。一部の実施形態において、プロセスにおいて使用されるアミノドナーは、イソプロピルアミン(IPM)であり、アミノ基のアミノ基アクセプターへの転移の際、カルボニル副生成物アセトンを形成する。アセトンは、窒素ガスを吹き込むか、または真空を反応溶液に適用し、コンデンサーもしくは他の冷却トラップのような、アセトントラップによりアセトンをガス相から除去することにより、除去され得る。あるいは、アセトンは、ケト還元酵素を使用してイソプロパノールへの還元により除去され得る。
カルボニル副生成物が除去される、プロセスの一部の実施形態において、対応するアミノ基ドナーをアミノ基転移反応中に加えて、アミノ基ドナーを補充し、および/または反応のpHを維持することができる。アミノ基ドナーの補充はまた、平衡を生成物の形成に向けてシフトし、これにより、基質から生成物への変換を増大させる。したがって、アミノ基ドナーがIPMであり、アセトン生成物がin situで除去される、一部の実施形態において、プロセスは、IPMを反応溶液に加えて、アセトン除去中に失われたアミノ基ドナーを補充し、反応のpHを維持するステップ(例えば、約8.5~約pH11.5において)をさらに含み得る。
一部の実施形態において、本発明のトランスアミナーゼポリペプチドを使用した、アミンアクセプター基質化合物からキラルアミン生成物化合物への生体触媒性変換を含むプロセスが、薬学的に許容される塩もしくは酸の形成、薬学的に許容される製剤、生成物の後処理、抽出、単離、精製、および/または結晶化のステップをさらに含み得、これらのそれぞれが、一連の条件下で行われ得ることも考慮される。
一部の実施形態において、本明細書において開示される操作されたポリペプチドを使用するプロセスを実行することができ、アミノ基ドナーは、イソプロピルアミン、アラニン、3-アミノ酪酸、またはメチルベンジルアミンから選択される。一部の実施形態において、アミノ基ドナーは、イソプロピルアミンである。
上で開示されたプロセスにより生成される生体触媒反応混合物からアミノ化生成物化合物もしくは閉環化合物を抽出し、単離し、その塩を形成し、精製し、および/または結晶化する方法、技術ならびにプロトコールは、当業者に公知であり、および/または日常的な実験を通じて利用される。加えて、説明的な方法は、以下の実施例において提供される。
本発明の様々な特性および実施形態は、次の代表的な実施例において説明され、これは、例示であり、限定ではないとことが意図される。
本発明の様々な特性および実施形態は、次の代表的な実施例において説明され、これは、例示であり、限定ではないことが意図される。
以下の実験的な本発明において、次の略語を適用する:ppm(百万分率);M(モル濃度);mM(ミリモル濃度)、uMおよびμM(マイクロモル濃度);nM(ナノモル濃度);mol(モル);gmおよびg(グラム);mg(ミリグラム);ugおよびμg(マイクログラム);Lおよびl(リットル);mlおよびmL(ミリリットル);cm(センチメートル);mm(ミリメートル);umおよびμm(マイクロメートル);sec(秒);min(分);hおよびhr(時間);U(ユニット);MW(分子量);rpm(毎分回転数);℃(摂氏度);RT(室温);CDS(コード配列);DNA(デオキシリボ核酸);RNA(リボ核酸);aa(アミノ酸);TB(テリフィックブロス;12g/Lバクト-トリプトン、24g/L酵母抽出物、4mL/Lグリセロール、65mMリン酸カリウム、pH7.0、1mM MgSO4);LB(ルリアブロス);CAM(クロラムフェニコール);PMBS(硫酸ポリミキシンB);IPTG(イソプロピルチオガラクトシド);ATA(オメガ-トランスアミナーゼ);TFA(トリフルオロ酢酸);TEoA(トリエタノールアミン);ボラート(四ホウ酸ナトリウム十水和物);アセトニトリル(MeCN);ジメチルスルホキシド(DMSO);HPLC(高速液体クロマトグラフィー);FIOP(正の対照に対する倍数改善(fold improvement over positive control));HTP(ハイスループット);MWD(多波長検出器);UV(紫外線);Codexis(Codexis,Inc.、Redwood City、CA);Sigma-Aldrich(Sigma-Aldrich、St.Louis、MO);Millipore(Millipore,Corp.、Billerica MA);Difco(Difco Laboratories、BD Diagnostic Systems、Detroit、MI);Daicel(Daicel、West Chester、PA);Genetix(Genetix USA,Inc.、Beaverton、OR);Molecular Devices(Molecular Devices,LLC、Sunnyvale、CA);Applied Biosystems(Applied Biosystems、Life Technologies,Corp.の子会社、Grand Island、NY)、Agilent(Agilent Technologies,Inc.、Santa Clara、CA);Thermo Scientific(Thermo Fisher Scientificの子会社、Waltham、MA);(Infors;Infors-HT、Bottmingen/Basel、Switzerland);Corning(Corning,Inc.、Palo Alto、CA);およびBio-Rad(Bio-Rad Laboratories、Hercules、CA);Microfluidics(Microfluidics Corp.、Newton、MA);Waters(Waters Corp.、Milford、MA)。
(実施例1)
組換えATA遺伝子を含有するE. coli発現宿主
本発明のバリアント酵素を生成するために使用する開始ATA酵素を、Codex(登録商標)ATAパネルプレート(Codexis)において含まれるVibrio fluvialisトランスアミナーゼバリアントから得た。このATAパネルプレートは、野生型ATAと比較して、改善された特性を有する操作されたATAポリペプチドの収集物を含む。ATAをコードする遺伝子を、lacIリプレッサーの調節下lacプロモーターに作動可能に連結させた、発現ベクターpCK110900にクローニングした(これらの両方が、その全体および全ての目的について参照により本明細書に組み込まれる、米国特許第7,629,157号および米国特許出願公開第2016/0244787号を参照)。発現ベクターはまた、P15a複製起点およびクロラムフェニコール抵抗性遺伝子を含有する。当技術分野において公知の標準的な方法を使用して、得られたプラスミドをE.coli W3110に形質転換した。当技術分野において公知の通り、細胞をクロラムフェニコール選択の対象にすることにより、形質転換体を単離した(例えば、これらのそれぞれが、その全体および全ての目的について参照により本明細書に組み込まれる、米国特許第8,383,346号および国際公開第2010/144103号を参照)。
(実施例2)
HTP ATA含有湿潤細胞ペレットの調製
モノクローナルコロニー由来の組換えATAコード遺伝子を含有するE. coli細胞を、1%グルコースおよび30μg/mLクロラムフェニコールを含有するLB180μl、96ウェルの浅いウェルのマイクロタイタープレートのウェルに接種した。プレートを、O2透過性シールを用いて密封し、培養物を、一晩、30℃、200rpmおよび85%湿度において成長させた。次に、細胞培養物のそれぞれ10μlを、TB390mLおよび30μg/mLのCAMを含有する96ウェルの深いウェルのプレートのウェルに移した。深いウェルプレートを、O2透過性シールを用いて密封し、OD6000.6~0.8に達するまで、30℃、250rpmおよび85%湿度においてインキュベーションした。次に、細胞培養物を、終濃度1mMのIPTGにより誘導し、一晩、元々使用したのと同じ条件下でインキュベーションした。次に、4000rpmにおいて10分間の遠心分離を使用して、細胞をペレット化した。上清を廃棄し、溶解に先立ち、-80℃にてペレットを凍結した。
(実施例3)
HTP ATA含有細胞溶解物の調製
まず、50mMトリエタノールアミン-HCl緩衝液、pH7.5、1mg/mLのPLP、1mg/mLのリゾチーム、および0.5mg/mLのPMBSを含有する溶解緩衝液200μlを、実施例2において記載した通り生成した、それぞれのウェルにおける細胞ペレットに加えた。ベンチトップシェーカー上で振盪しながら、室温において2時間、細胞を溶解した。次に、プレートを、15分間、4000rpmおよび4℃において遠心分離した。次に、透明な上清を、生体触媒反応において使用して、それらの活性レベルを決定した。
(実施例4)
振盪フラスコ(SF)培養物からの凍結乾燥溶解物の調製およびアッセイ
上で記載した通り成長させた、選択したHTP培養物を、1%グルコースおよび30μg/mlのCAMを含むLB寒天プレート上にプレートし、一晩、37℃において成長させた。それぞれの培養物由来の単一コロニーを、1%グルコースおよび30μg/mlのCAMを含むLB50mlに移した。培養物を、18時間、30℃、250rpmにおいて成長させて、30μg/mlのCAMを含有するTB250mlにおよそ1:20で、最終OD6000.2まで継代培養した。培養物を、およそ3時間、30℃、250rpmにおいて、OD6000.6~0.8まで成長させ、1mMのIPTGを用いて誘導した。次に、培養物を、20時間、30℃、250rpmにおいて成長させた。培養物を、4000rpm×20分、遠心分離し、上清を廃棄した。細胞を、1g/LのPLPを含む13mlの50mMトリエタノールアミン-HCl、pH7.5に再懸濁し、One-Shot(登録商標)プロセッサーシステム(Constant Systems)を33,000psiにおいて使用して、溶解した。溶解物をペレット化し(10,000rpm×60分)、上清を凍結し、凍結乾燥させて、振盪フラスコ(SF)酵素を得た。
選択した振盪フラスコATAバリアントの活性を、バリアントが、アミンドナーとしてイソプロピルアミンを含む化合物(2)を生成物である化合物(1)およびアセトンにアミノ基転移する効率に基づき評価した。振盪フラスコ粉末を使用した反応を、96ウェルの浅いウェルのマイクロタイタープレートにおいて行った。このアッセイにおいて、2.5~75g/Lの化合物(2)、0~50g/Lの振盪フラスコ粉末、25mMのホウ酸緩衝液、0.5g/LのPLP、および1Mのイソプロピルアミンからなる反応溶液0.1mLを、最終pH9に調整して、調製した。プレートをヒートシールし、40~65℃においてインキュベーションし、600RPMにて、Infors Thermotron(登録商標)シェーカーにおいて、0~72時間撹拌した。プレートを取り出し、MeCN中の10%ギ酸を用いて1:1(100μL/ウェル)でクエンチし、次に、MeCN中の10%酢酸において1:10~1:100に希釈した。0.2%酢酸および0.1%トリエチルアミンを含むメタノールからなる均一濃度の移動相を使用して、2.5mL/分の流量で、Astec Chirobiotic(商標)Tカラム(4.6×100mm、5μmの粒子サイズ)を使用したHPLCにより、試料を解析した。注射容量は、10μLであった。合計の実行時間は、1.8分であり;ケトンは0.54分において、(R)-ジアステレオマーは1.1分において、(S)-ジアステレオマーは、1.4分において溶出した(245nmにおけるUVモニタリング)。
(実施例5)
化合物(2)のアミノ基転移についてのCodex(登録商標)トランスアミナーゼキットの評価
化合物(2)に対する初期活性を有するATAを見出すために、Codex(登録商標)トランスアミナーゼキット(Codexis)由来の酵素を、化合物(2)に対してスクリーニングした。スクリーニングを、本質的に実施例4において記載した通りに行った。反応濃度は、2.5g/Lの化合物(2)、50g/LのATA、1MのIPM、0.5g/LのPLP、25mMのホウ酸緩衝液、40℃において、22時間であった。ATAキット由来の唯一の活性なバリアントは、これらの条件下で約5%の変換を生じるATA-217であった。しかしながら、これは、ほぼ排他的に所望でない(R)-アミンジアステレオマーを作製する、所望の選択性とは反対のものを有した。
(実施例6)
ハイスループットスクリーニングにおける配列番号4と比較した化合物(2)のアミノ基転移活性の改善
実施例5において記載した結果に基づき、配列番号4を開始骨格として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。
HTP反応を、100μLの2.5g/Lの化合物(2)、1MのIPM、0.5g/LのPLP、25mMのホウ酸緩衝液および50v/v%のATA溶解物、pH9を含有する96ウェルの浅いウェルプレートにおいて行った。HTPプレートをヒートシールし、Thermotron(登録商標)シェーカーにおいて、40℃、600rpmにて、一晩(およそ21時間)インキュベーションした。次に、反応を、100μL/ウェルMeCN中の10%酢酸を用いてクエンチし、ベンチトップシェーカーを使用して10分間混合した。次に、プレートを、4000rpmにおいて5分間遠心分離し、実施例4において記載した通り、パラメーターを使用した解析のため、HPLCに注入した。
配列番号4と比べた活性(FIOP)を、配列番号4が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表6.1に示す。
(実施例7)
ハイスループットスクリーニングにおける配列番号18と比較した化合物(2)のアミノ基転移活性の改善
実施例6において記載した結果に基づき、配列番号18を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。実施例6において記載した通り、HTP反応を行った。
配列番号18と比べた活性(FIOP)を、配列番号18が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表7.1に示す
(実施例8)
ハイスループットスクリーニングにおける配列番号20と比較した化合物(2)のアミノ基転移活性の改善
実施例7において記載した結果に基づき、配列番号20を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。基質化合物(2)の濃度を、10g/Lに増大したことを除き、実施例6において記載した通りに、HTP反応を行った。
配列番号20と比べた活性(FIOP)を、配列番号20が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表8.1に示す
(実施例9)
ハイスループットスクリーニングにおける配列番号30と比較した化合物(2)のアミノ基転移活性の改善
実施例8において記載した結果に基づき、配列番号30を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。実施例8において記載した通りに、HTP反応を行った。
配列番号30と比べた活性(FIOP)を、配列番号30が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表9.1に示す
(実施例10)
ハイスループットスクリーニングにおける配列番号66と比較した化合物(2)のアミノ基転移活性の改善
実施例9において記載した結果に基づき、配列番号66を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。次の相違点:反応を、50℃において行ったこと、1:1でクエンチした反応物を、HPLC解析前に、MeCN中の10%酢酸に10倍希釈したこと以外は実施例8において記載した通りに、HTP反応を行った。
配列番号66と比べた活性(FIOP)を、配列番号66が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表10.1に示す
(実施例11)
ハイスループットスクリーニングにおける配列番号70と比較した化合物(2)のアミノ基転移活性の改善
実施例10において記載した結果に基づき、配列番号70を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。反応混合物に加える前に、ATA溶解物を、50mMのTEoA+1g/LのPLP、pH7.5中4倍希釈したことを除き、実施例10において記載される通りに、HTP反応を行った。
配列番号70と比べた活性(FIOP)を、配列番号70が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表11.1に示す。
(実施例12)
ハイスループットスクリーニングにおける配列番号48と比較した化合物(2)のアミノ基転移活性の改善
実施例9において記載した結果に基づき、配列番号48を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。実施例11において記載した通りに、HTP反応を行った。
配列番号48と比べた活性(FIOP)を、配列番号48が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表12.1に示す
(実施例13)
ハイスループットスクリーニングにおける配列番号88と比較した化合物(2)のアミノ基転移活性の改善
実施例12において記載した結果に基づき、配列番号88を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。反応混合物に加える前に、ATA溶解物を、50mMのTEoA+1g/LのPLP、pH7.5中16倍希釈し、50℃においてスクリーニングしたことを除き、実施例12において記載される通りに、HTP反応を行った。加えて、変異体をまた、4倍希釈した溶解物を用いて58℃においてスクリーニングした。
配列番号88と比べた活性(FIOP)を、配列番号88が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。50℃においてスクリーニングしたバリアントについての結果を、表13.1において示し、58℃においてスクリーニングしたバリアントについての結果を、表13.2において示す。
(実施例14)
ハイスループットスクリーニングにおける配列番号110と比較した化合物(2)のアミノ基転移活性の改善
実施例13において記載した結果に基づき、配列番号110を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。反応物に加える前に、溶解物を、50mMのトリエタノールアミン-HCl緩衝液pH7.5+1g/LのPLP中50倍希釈したこと、およびライブラリーの一部を、50℃と58℃の両方においてスクリーニングしたことを除き、実施例13において記載した通りに、HTP反応を行った。
配列番号110と比べた活性(FIOP)を、配列番号110が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表14.1に示す。
(実施例15)
ハイスループットスクリーニングにおける配列番号112と比較した化合物(2)のアミノ基転移活性の改善
実施例14において記載した結果に基づき、配列番号112を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。反応物に加える前に、溶解物を、50mMのトリエタノールアミン-HCl緩衝液pH7.5+1g/LのPLP中20倍希釈し、ライブラリーを58℃においてスクリーニングしたことを除き、実施例14において記載した通りに、HTP反応を行った。
配列番号112と比べた活性(FIOP)を、配列番号112が生成した生成物のピーク面積の合計に対して、バリアントが生成した生成物のピーク面積の合計として計算した。結果を表15.1に示す。
(実施例16)
ハイスループットスクリーニングにおける配列番号120と比較した化合物(2)のアミノ基転移活性の改善
実施例15において記載した結果に基づき、配列番号120を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。反応物に加える前に、溶解物を、50mMのトリエタノールアミン-HCl緩衝液pH7.5+1g/LのPLP中60倍希釈したことを除き、実施例15において記載した通りに、HTP反応を行った。加えて、反応を、MeCN中の10%酢酸を用いて1:1でクエンチした後、それらをさらに、0.1%ギ酸を含有するMeCN中で5000倍希釈し、製造元のプロトコールを使用して、Agilent RapidFire365ハイスループット質量分析計により解析した。
配列番号120と比べた活性(FIOP)を、配列番号120が生成した生成物のピーク面積に対して、バリアントが生成した生成物のピーク面積として計算した。結果を表16.1に示す。
(実施例17)
ハイスループットスクリーニングにおける配列番号138と比較した化合物(2)のアミノ基転移活性の改善
実施例16において記載した結果に基づき、配列番号138を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。反応物に加える前に、溶解物を、50mMのトリエタノールアミン-HCl緩衝液pH7.5+1g/LのPLP中120倍希釈したことを除き、実施例16において記載した通りに、HTP反応を行った。
配列番号138と比べた活性(FIOP)を、配列番号138が生成した生成物のピーク面積に対して、バリアントが生成した生成物のピーク面積として計算した。結果を表17.1に示す。
(実施例18)
ハイスループットスクリーニングにおける配列番号156と比較した化合物(2)のアミノ基転移活性の改善
実施例17において記載した結果に基づき、配列番号156を次の親酵素として選択した。十分に確立した技術(例えば、飽和変異誘発および既に同定した有益な変異の組換え)を使用して、操作した遺伝子のライブラリーを得た。実施例2において記載した通り、それぞれの遺伝子がコードするポリペプチドを、HTPにおいて生成させ、実施例3に記載した通り、可溶性の溶解物を得た。実施例17において記載した通りに、HTP反応を行った。
配列番号156と比べた活性(FIOP)を、配列番号156が生成した生成物のピーク面積に対して、バリアントが生成した生成物のピーク面積として計算した。結果を表18.1に示す。
本出願において引用される全ての刊行物、特許、特許出願および他の文書は、それぞれ個々の刊行物、特許、特許出願または他の文書が、全ての目的について参照により組み込まれることが個別に示されたのと同じ程度まで、全ての目的についてそれぞれの全体が、参照により本明細書に組み込まれる。
様々な具体的な実施形態が説明され、記載されてきたが、様々な変更が、本発明の精神および範囲から逸脱することなくなされ得ることが、認識されるであろう。