I. 序
本発明は、増強された酵素活性を有する初めてC−末端切断型CgtBタンパク質を提供する。本発明は、特定のCgtBタンパク質のための好ましいアクセプターの開示およびCgtBタンパク質を用いる方法も提供する。
代表的なC−末端切断型CgtBタンパク質としては、例えば、C.jejuni OH4383由来のCgtB(CgtBOH4384)、C.jejuniNCTC11168由来のCgtB(CgtB11168)、およびC.jejuni HS:10由来のCgtB(CgtBHS10)が含まれる。マルトース結合タンパク質(MBP)ドメインが、C−末端切断型CgtBOH4384、CgtB11168、またはCgtBHS10タンパク質のC−末端に融合された場合に、酵素活性のさらなる増強が観察された。
II.定義
以下の略語が本明細書中において用いられる:
Ara=アラビノシル;
Fru=フルクトシル;
Fuc=フコシル;
Gal=ガラクトシル;
GalNAc=N−アセチルガラクトサミニル;
Glc=グルコシル;
GlcNAc=N−アセチルグルコサミニル;
Man=マンノシル;および
NeuAc= シアリル(N−アセチルノイラミニル)。
グリコシルトランスフェラーゼ、例えば、CgtBポリペプチドのための「アクセプター基質」または「アクセプター糖類」は、特定のグリコシルトランスフェラーゼのためのアクセプターとして働き得るオリゴ糖部分である。アクセプター基質が、対応するグリコシルトランスフェラーゼおよび糖ドナー基質、ならびに他の必要な反応混合物成分と接触させられ、反応混合物が十分な時間インキュベートされる場合、グリコシルトランスフェラーゼは、糖残基を糖ドナー基質からアクセプター基質へ転移させる。アクセプター基質は特定のグリコシルトランスフェラーゼの種々のタイプについて変わり得る。従って、用語「アクセプター基質」は、特定の用途のための関心対象の特定のグリコシルトランスフェラーゼと共に文脈の中で理解される。β−1,3−グリコシルトランスフェラーゼ、例えば、C.jejuni株OH4383、NCTC11168、およびHS:10由来のCgtB、ならびに付加的なグリコシルトランスフェラーゼのためのアクセプター基質が本明細書中において記載される。いくつかの実施形態において、CgtBアクセプター基質は、末端ガラクトース残基を有する。いくつかの実施形態において、CgtBアクセプター基質は、N−アセチルガラクトサミニル残基を有する。標識されたCgtBアクセプター基質としては、例えば、GalNAcβ−1、4−Galβ−1、4−Glc−FCHASE、GalNAcβ−1、4−[NeuAcα−2,3]−Galβ−1、4−GLc−FCHASE、GalNAcβ−1、4−[NeuAc−α−2,3]−Galβ−1、4−Glc−スフィンゴシン−FCHASE、GalNAcβ−1,4−[NeuAcα−2,8−NeuAcα−2,3]−Galβ−1、4−Glc−FCHASE、GalNAcβ−FCHASE、GalNAc−α−FCHASE、GalNAc−β−p−ニトロフェニル、GalNAc−α−p−ニトロフェニル、.FCHASE−NH−Val−Gly−Val−Thr[GalNAc−α−]Glu−Thr−Pro−COOH、IFNα2b[Thr−134−GalNAc]が含まれる。切断型CgtBタンパク質はまた、ガラクトース残基を、例えば、上記で列挙された構造を有する標識されていないアクセプター基質に付加するために用いられ得る。標識されていないアクセプター基質は、例えば、ガラクトシル化生成物を商業的規模で作るために用いられる。
グリコシルトランスフェラーゼのための「ドナー基質」は、活性化ヌクレオチド糖である。そのような活性化糖は一般に、糖のウリジン、グアノシン、およびシチジン一リン酸誘導体(それぞれ、UMP、GMPおよびCMP)または二リン酸誘導体(それぞれ、UDP、GDP、およびCDP)からなり、その中でヌクレオシド一リン酸または二リン酸は、脱離基として働く。例えば、フコシルトランスフェラーゼのためのドナー基質は、GDP−フコースである。CgtEタンパク質のためのドナー基質としては、例えば、UDP−GalNAcまたはUDP−Galが含まれる。シアリルトランスフェラーゼのためのドナー基質は、例えば、所望のシアル酸を含む活性化糖ヌクレオチドである。CgtBのためのドナー基質は、UDP−Galである。例えば、NeuAcの場合、活性化糖は、CMP−NeuAcである。細菌、植物、および真菌系は、他の活性化ヌクレオチドを使うことができることがある。CgtBタンパク質のためのドナー基質としては、例えば、UDP−Galが含まれる。
還元末の糖類が実際に還元糖であるか否かにかかわらず、オリゴ糖は、還元末端および非還元末端を有すると考えられる。公認の命名法に従い、オリゴ糖は本明細書中において、非還元末端を左に、還元末端を右に描かれる。本明細書中において記載されるすべてのオリゴ糖は、非還元糖類についての名称また略号(例えば、Gal)、続いてグリコシド結合の立体配置(αまたはβ)、環結合、結合に関与した還元糖類の環位置、および次に還元糖類についての名称また略号の名称または略号(例えば、GLcNAc)と共に記載される。2つの糖間の連鎖は、例えば、2,3、2→3、または(2,3)として発現され得る。各糖類は、ピラノースまたはフラノースである。
本明細書中において用いられるように、「ガラクトース部分」は、ガラクトースを含むまたはガラクトースから誘導され得る分子を指す。ガラクトース部分は通常、単糖類、例えば、ガラクトースである。
本明細書中において用いられるように、「ガラクトシル化生成物糖類」は、ガラクトース部分を含む、糖脂質または糖タンパク質、例えば、生体分子にコンジュゲートされていないか、またはコンジュゲートされたオリゴ糖、多糖、もしくは炭水化物部分を指す。上記のガラクトース部分のいずれも用いることができ、例えば、ガラクトースである。好ましい実施形態において、CgtBにより転移されたガラクトース部分は、UDP−Galである。
「ポリ−ガラクトシル化生成物糖類」は、ガラクトース残基のポリマー、例えば、2つ以上のガラクトース残基のポリマーを含む、糖脂質または糖タンパク質、例えば、生体分子にコンジュゲートされていないか、またはコンジュゲートされたオリゴ糖、多糖、もしくは炭水化物部分を指す。いくつかの実施形態において、C−末端切断型CgtBタンパク質(C−末端MBPドメインを有するまたは有さない)により形成される生成物は、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、または90%未満のポリ−ガラクトシル化生成物糖類を有する。
いくつかの実施形態において、他の糖部分、例えば、フコース、シアル酸、グルコース、GalNAcまたはGlcNAcも、付加的なグリコシルトランスフェラーゼの作用を介してアクセプター基質に付加されて、ガラクトシル化生成物糖類を産生する。いくつかの実施形態において、アクセプター基質は、ガラクトース部分を含み、CgtBタンパク質は、分子上の異なる部位に付加的なガラクトース部分を付加するために用いられて、ガラクトシル化生成物糖類を作る。
用語「シアル酸」または「シアル酸部分」は、9−炭素カルボキシル化糖のファミリーの任意のメンバーを指す。シアル酸ファミリーの最も一般的なメンバーは、N−アセチル−ノイラミン酸(2−ケト−5−アセトアミド−3,5−ジデオキシ−D−グリセロ−D−ガラクトノヌロピラノス−1−オン酸(しばしば、Neu5Ac、NeuAc、またはNANAとして略記される)。ファミリーの第2のメンバーは、N−グリコイル−ノイラミン酸(Neu5GcまたはNeuGc)であり、その中で、NeuAcのN−アセチル基は、ヒドロキシル化されている。第3のシアル酸ファミリーメンバーは、2−ケト−3−デオキシ−ノヌロソン酸(KDN)(Nadanoet al.(1986)J.Biol.Chem.261: 11550−11557;Kanamori et al.,J.Biol.Chem.265:21811−21819(1990))。9−O−ラクチル−Neu5Acまたは9−O−アセチル−Neu5Acのような9−O−C1−C6アシル−Neu5Ac、9−デオキシ−9−フルオロ−Neu5Acおよび9−アジド−9−デオキシ−Neu5Acのような9−置換シアル酸も含まれる。シアル酸ファミリーの総説については、例えば、Varki,Glycobiology2: 25−40(1992);Sialic Acids:Chemistry,Metabolism and Function,R.Schauer,Ed.(Springer−Verlag,New York(1992))を参照されたい。シアリル化手順におけるシアル酸化合物の合成および使用は、1992年10月1日公開の国際公開第92/16640号に開示されている。
本出願において必要とされる命名法および一般的な実験手順の多くは、Sambrook,et al.,Molecular Cloning:ALaboratory Manual(2nd Ed.),Vol.1−3,Cold Spring Harbor Laboratory,Cold Spring Harbor,NewYork,1989に見出すことができる。このマニュアルは、以下で「Sambrook et al」として参照される。
用語「C.jejuni由来のCgtB」、「CgtB」、あるいは「C.jejuni由来のCgtB」または「CgtB」をコードする核酸は、(1)例えば、C.jejuni株OH4384 NCTC11168、およびHS:10由来のCgtB核酸(代表的なCgtB核酸については、例えば、配列番号1、3、5、7、または9参照)によりコードされたアミノ酸配列または、例えば、C.jejuni株OH4384 NCTC11168、およびHS:10由来のCgtBのアミノ酸配列(代表的なCgtBタンパク質配列については、例えば、配列番号2、4、6、8、または10参照)に対して、好ましくは25、50、100、200、500、1000、またはそれ以上のアミノ酸の領域にわたって、少なくとも60%アミノ酸配列同一性、65%、70%、75%、80%、85%、90%、好ましくは91%、92%、93%、94%、95%、96%、97%、98%または99%あるいはそれ以上のアミノ酸配列同一性を有し;(2)抗体、例えば、C.jejuni由来のCgtBのアミノ酸配列(上記の例)を含む免疫原に対して生じさせられたポリクロナール抗体、および保存的に修飾されたそれらの変異体に結合し;(3)C.jejuni由来のCgtB、および保存的に修飾されたその変異体をコードする核酸配列に対応するアンチセンスストランドにストリンジェントなハイブリダイゼーション条件下でハイブリダイズし、(4)C.jejuni由来のCgtB核酸、例えば、配列番号1、3、5、7、または9、あるいは触媒ドメインをコードする核酸に対して、好ましくは少なくとも約25、50、100、200、500、1000、またはそれ以上のヌクレオチドの領域にわたって、少なくとも90%、好ましくは少なくとも91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上のヌクレオチド配列同一性を有する、本明細書中において記載される核酸およびポリペプチド多形変異体、対立遺伝子、突然変異体、種間相同体、および活性な切断型タンパク質を指す。好ましくは、触媒ドメインは、配列番号2、4、6、8、または10のCgtB触媒ドメインに対し、少なくとも90%、好ましくは少なくとも91%、92%、93%、94%、95%、96%、97%、98%、99%アミノ酸同一性を有する。ポリヌクレオチドまたはポリペプチド配列は典型的に、Campylobacter、Haemophilus、およびPasteurellaを含むがそれらに限定されない細菌に由来する。本発明の核酸およびタンパク質は両方とも、天然または組換え分子を含む。C.jejuni由来のCgtBタンパク質は典型的に、本明細書中において記載されるように、適切なドナー基質およびアクセプター基質を用いて、当業者に既知の方法に従ってアッセイされ得るβ−1,3−ガラクトシルトランスフェラーゼ活性を有する。いくつかの実施形態は、例えば、CgtB11168(Δ30)、CgtBHS:10(Δ20)およびCgtBOH4384(Δ30)のCgtBタンパク質の切断型形状を含む。付加的な実施形態は、タンパク質、例えば、CgtB11168(Δ30、C−末端MalE)、CgtBHS:10(Δ20、C−末端MalE)およびCgtBOH4384(Δ30、C−末端MalE)のC−末端におけるMBPドメインに融合されたC−末端切断型CgtBタンパク質を含む。
「商業的規模」は、単一反応におけるガラクトシル化生成物のグラムスケール産生を指す。好ましい実施形態において、商業的規模は、約50、75、80、90、100、125、150、175、または200グラム以上のガラクトシル化生成物の産生を指す。
本明細書中において用いられるように、「切断型CgtBポリペプチド」または文法的異形は、切断型CgtBポリペプチドが酵素活性を保持する限り、天然の野生型CgtBポリペプチドに比して、少なくとも1つのアミノ酸残基を取り去るように操作されたCgtBポリペプチドを指す。野生型または天然のCgtBタンパク質の例としては、例えば、配列番号2、4、6、8、または10が含まれる。
本明細書中において用いられるように、「マルトース結合タンパク質(MBP)ドメイン」または文法的異形は、E.coliマルトース結合ドメインタンパク質を指す。MBPドメインは典型的に、細胞とのタンパク質の可溶性を増強するためにタンパク質に融合される。例えば、KapustおよびWaughPro.Sci.8:1668−1674(1999)を参照されたい。他のマルトース結合ドメインが知られており、本明細書中において記載されるように、CgtBタンパク質に融合されることができ、例えば、YersiniaE.coli、Pyrococcus furiosus、Thermococcus litoralis、Thermatoga maritime、およびVibriocholerae由来のMBPドメインである。アミノ酸リンカーは、MBPドメインとCgtBタンパク質との間に置かれ得る。
「保存的に修飾された変異体」は、アミノ酸および核酸配列の双方にあてはまる。特定の核酸配列に関して、保存的に修飾された変異体は、同一または本質的に同一のアミノ酸配列をコードする核酸、または核酸がアミノ酸配列をコードしない場合には、本質的に同一の配列を指す。遺伝コードの縮重のため、多数の機能的に同一の核酸は、任意のタンパク質をコードする。例えば、コドンGCA、GCC、GCGおよびGCUはすべて、アミノ酸アラニンをコードする。従ってコドンによりアラニンが指定されるあらゆる位置に置いて、コドンは、コードされたポリペプチドを変更することなく記載された対応するコドンのうちのいずれにでも変更され得る。そのような核酸変動は、「サイレント変動」であり、これは、保存的に修飾された変動の1種である。ポリペプチドをコードする本明細書中におけるすべての核酸はまた、核酸のあらゆる考え得るサイレント変動を記述する。当業者は、核酸中の各コドン(通常、メチオニンのための唯一のコドンであるAUG、および通常、トリプトファンのための唯一のコドンであるTGGを除く)が、機能的に同一の分子を産生するように修飾され得ることを理解するであろう。従って、ポリペプチドをコードする核酸の各サイレント変動は、発現生成物に関しては、各記述された配列において暗黙的であるが、実際のプローブ配列に関してはそうではない。
アミノ酸配列に関して、当業者は、コードされた配列において単一のアミノ酸または小さいパーセンテージのアミノ酸を変更、付加または欠失する、核酸、ペプチド、ポリペプチド、またはタンパク質配列に対する個々の置換、欠失または付加が、化学的に同様なアミノ酸によるアミノ酸の置換という結果になる「保存的に修飾された変異体」であることを理解するであろう。機能的に同様なアミノ酸を提供する保存的置換表は、当該技術分野においてよく知られている。そのような保存的に修飾された変異体は、本発明の多形変異体、種間相同体、および対立遺伝子に加えられるものであり、これらを除外しない。
当業者は、タンパク質の機能に影響を及ぼすことなく多くのアミノ酸がタンパク質中で互いに置換され得ること、すなわち、保存的な置換が、開示されるCgtBタンパク質のようなタンパク質の保存的に修飾された変異体の基礎であり得ることを理解する。保存的なアミノ酸置換の不完全なリストは、以下の通りである。以下の8つの群は各々、互いに保存的置換であるアミノ酸を含む:1)アラニン(A)、グリシン(G);2)アスパラギン酸(D)、グルタミン酸(E);3)アスパラギン(N)、グルタミン(Q);4)アルギニン(R)、リシン(K);5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V)、アラニン(A);6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W);7)セリン(S)、トレオニン(T)、システイン(C);および8)システイン(C)、メチオニン(M)(例えば、Creighton,Proteins(1984)参照)。
本発明の細胞および方法は、一般にガラクトース部分をドナー基質からアクセプター分子に転移させることによりガラクトシル化生成物を産生するために有用である。本発明の細胞および方法はまた、一般に付加的な単糖類またはサルフェート基をドナー基質からアクセプター分子に転移させることにより、付加的な糖残基を含むガラクトシル化生成物糖を産生するために有用である。付加は一般に、オリゴ糖、多糖(例えば、ヘパリン、carrageninなど)または、糖脂質もしくは糖タンパク質、例えば、生体分子上の炭水化物部分の非還元末端において起こる。ここで定義されるような生体分子としては、炭水化物、オリゴ糖、ペプチド(例えば、糖ペプチド)、タンパク質(例えば、糖タンパク質)、および脂質(例えば、糖脂質、リン脂質、スフィンゴ脂質およびガングリオシド)のような生物学的に重要な分子が含まれるが、それらに限定されない。
本発明の組換えタンパク質は、タンパク質の精製または同定を容易にする分子「精製タグ」を一端に有する融合タンパク質として構築および発現され得る。そのようなタグはまた、グリコシル化反応の間に関心対象のタンパク質の固定のために使われ得る。適切なタグとしては、「エピトープタグ」が含まれ、これは、抗体により特異的に認識されるタンパク質配列である。エピトープタグは一般に、融合タンパク質を明瞭に検出または単離するための容易に利用可能な抗体の使用を可能にするために、融合タンパク質に組み込まれる。「FLAGタグ」は、モノクロナール抗−FLAG抗体により特異的に認識される一般的に用いられるエピトープタグであり、配列AspTyrLysAspAspAspAspLysまたはその実質的に同一の変異体からなる。他の適切なタグが当業者に知られており、例えば、ニッケルもしくはコバルトイオンのような金属イオンまたはmycタグに結合するヘキサシスチジンペプチドのようなアフィニティタグが含まれる。精製タグを含むタンパク質は、精製タグに結合する結合パートナー、例えば、精製タグ、ニッケルもしくはコバルトイオンまたは樹脂、およびアミロース、マルトース、またはシクロデキストリンに対する抗体を用いて精製され得る。精製タグはまた、マルトース結合ドメインおよびデンプン結合ドメインを含む。マルトース結合ドメインタンパク質の精製は、当業者に知られている。デンプン結合ドメインは、参照により本明細書に組み込まれる国際公開第99/15636号に記載されている。ベータシクロデキストリン(BCD)誘導樹脂を用いたデンプン結合ドメインを含む融合タンパク質のアフィニティ精製は、参照によりその全体が本明細書に組み込まれる、2005年2月17日公開の国際公開第2005/014779号に記載されている。
用語「核酸」は、単鎖か二重鎖形のデオシキリボヌクレオチドまたはリボヌクレオチドポリマーを意味し、別に限定されない限り、天然のヌクレオチドと同様な様式で核酸にハイブリダイズする天然ヌクレオチドの既知の類似体を包含する。別に示されない限り、特定の核酸配列は、その相補的配列を含む。用語「核酸」、「核酸配列」、および「ポリヌクレオチド」は、本明細書中において区別なく用いられる。
用語「作動可能に連結された」は、核酸発現制御配列(プロモーター、シグナル配列、または転写因子結合部位のアレイのような)と第2の核酸配列との間の機能的連結を意味し、発現制御配列は、第2の配列に対応する核酸の転写および/または翻訳に影響を及ぼす。
用語「組換え」は、細胞に関連して用いられる場合、細胞が異種核酸を複製、または異種核酸によってコードされたペプチドもしくはタンパク質を発現することを示す。組換え細胞は、細胞の未変性(非組換え)形態内には見出されない遺伝子を含み得る。組換え細胞はまた、細胞の未変性形態中に見出される遺伝子も含むことがあり、その場合、遺伝子は修飾され、人工的手段により細胞内に再導入される。この用語は、核酸を細胞から取り除くことなく修飾された細胞に対し内因性の核酸を含む細胞も包含し、そのような修飾としては、遺伝子置換、部位特異的突然変異、および関連した技術により得られる修飾が含まれる。
「組換え核酸」は、人工的に構築された(例えば、2つの天然のまたは合成の核酸断片を連結することによって形成される)核酸を指す。この用語は、人工的に構築された核酸の複製または転写により産生される核酸にもあてはまる。「組換えポリペプチド」は、組換え核酸(すなわち、細胞に対し未変性ではない、またはその天然の形態から修飾されている核酸)の転写、その後の結果として生じる翻訳により発現される。
本明細書中において用いられるような「異種ポリヌクレオチド」または「異種核酸」は、特定の宿主細胞に対し外来の供給源に起因する、または、もし同じ供給源からであれば、その元の形態から修飾されているものである。従って、原核生物宿主細胞における異種グリコシルトランスフェラーゼ遺伝子は、特定の宿主細胞に対し内因的であるが、修飾されているグリコシルトランスフェラーゼ遺伝子を含む。異種配列の修飾は、例えば、プロモーターと動作可能に連結され得るDNA断片を生成するためにDNAを制限酵素を用いて処理することにより生じることがある。部位特的突然変異のような技術も、異種配列を修飾するために有用である。
「部分配列」は、核酸またはアミノ酸のより長い配列(例えば、ポリペプチド)の一部をそれぞれ含む核酸またはアミノ酸の配列を指す。
「組換え発現カセット」または単に「発現カセット」は、そのような配列と共存できる宿主における構造遺伝子の発現に影響を及ぼすことができる核酸要素を用いて組換え的、または合成的に生成される核酸構築物である。発現カセットは、少なくともプロモーターを、そして任意に転写終結シグナルを含む。典型的には、組換え発現カセットは、転写される核酸(例えば、所望のポリペプチドをコードする核酸)、およびプロモーターを含む。発現を生じさせる際に必要または役立つ付加的な因子も、本明細書中において記載されるように使用され得る。例えば、発現カセットは、宿主細胞からの発現されたタンパク質の分泌物を指示するシグナル配列をコードするヌクレオチド配列も含み得る。転写終結シグナル、エンハンサー、および遺伝子発現に影響する他の核酸配列も、発現カセットに含まれ得る。
本発明の「融合CgtBポリペプチド」または「融合ガラクトシルトランスフェラーゼポリペプチド」は、CgtBまたはβ−1,3−ガラクトシルトランスフェラーゼ触媒ドメインを含むポリペプチドである。融合ポリペプチドは、糖ヌクレオチド(例えば、UDP−ガラクトース)の合成ならびに糖ヌクレオチドからアクセプター分子への糖残基の転移を触媒することができる。典型的には、融合ポリペプチドの触媒ドメインは、触媒ドメインが誘導されるグリコシルトランスフェラーゼおよび融合タンパク質の触媒ドメインと少なくとも実質的に同一である。いくつかの実施形態において、CgtBポリペプチドおよびエピメラーゼ、例えば、UDP−グルコース4’エピメラーゼ、ポリペプチドが融合されて単一のポリペプチドを形成する。ガラクトシルトランスフェラーゼ/UDP−グルコース4’エピメラーゼの例については、例えば、すべての目的のために参照により本明細書に組み込まれる国際公開第l999/031224号を参照されたい。
本明細書において言及されるような「補助酵素」は、例えば、グリコシルトランスフェラーゼ反応のための基質または他の反応物を形成する反応を触媒する際に関与させられる酵素である。補助酵素は、例えば、グリコシルトランスフェラーゼにより糖ドナー部分として使われるヌクレオチド糖の形成を触媒することができる。補助酵素は、ヌクレオチド糖の形成のために必要なヌクレオチド三リン酸の生成において、またはヌクレオチド糖に組み込まれる糖の生成において使われる酵素でもあり得る。補助酵素の1つの例が、UDP−グルコース4’エピメラーゼ、例えば、S.thermophilus(受入umberM30175)由来のGalEである。
「触媒ドメイン」は、通常酵素によって実行される酵素反応を触媒するのに十分な酵素の部分を指す。例えば、CgtBポリペプチドの触媒ドメインは、ガラクトース部分を糖ドナーからアクセプター糖類へ転移するのに十分なCgtBの部分を含む。触媒ドメインは、酵素全体、その部分配列を含むことができ、または自然界で見出されるような酵素または部分配列には付属しない付加的なアミノ酸配列を含むことができる。
用語「単離された」は、酵素の活性を阻害する成分を実質的にまたは本質的に含まない物質を指す。本発明の細胞、糖類、核酸、およびポリペプチドの場合、用語「単離された」は、ある物質の未変性状態において見出されるような、その材料に通常付随する成分を実質的にまたは本質的に含まない物質を指す。典型的には、本発明の糖類、タンパク質または核酸は、少なくとも約50%、55%、60%、65%、70%、75%、80%または85%純粋であり、銀染色ゲル上のバンド強度または純度を決定するための他の方法で測定した場合に、通常少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%純粋である。純度または等質性は、タンパク質または核酸試料のポリアクリルアミドゲル電気泳動、続いての染色時視覚化のような当該技術分野においてよく知られた複数の手段で示すことができる。ある特定の目的のために、高解像度が必要とされ、精製のためのHPLCまたは同様な手段が利用される。オリゴヌクレオチドまたは他のガラクトシル化生成物については、純度は、例えば、薄層クロマトグラフィー、HPLC、または質量分析を用いて決定され得る。
2つ以上の核酸またはポリヌクレオチド配列の文脈における用語「同一の」またはパーセント「同一性」は、2つ以上の配列または部分配列を意味し、これらは、同じであるか、あるいは以下の配列比較アルゴリズムの1つを用いてまたは目視検査により測定される最大一致について比較および整列された場合に、同じである指定されたパーセンテージのアミノ酸残基またはヌクレオチドを有する。
2つの核酸またはポリヌクレオチドの文脈における文言「実質的に同一」は、以下の配列比較アルゴリズムの1つを用いてまたは目視検査により測定される最大一致について比較および整列された場合に、少なくとも60%、好ましくは80%または85%、最も好ましくは少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%ヌクレオチドまたはアミノ酸残基同一性を有する2つ以上の配列または部分配列を指す。好ましくは、実質的な同一性は、長さが少なくとも約50残基である配列の領域上にわたり、より好ましくは、少なくとも約100残基の領域上にわたり、そして最も好ましくは、少なくとも約150残基の領域にわたり存在する。最も好ましい実施形態において、配列は、コード化領域の全長にわたり実質的に同一である。
配列比較のため、典型的には、1つの配列が基準配列の役割を果たし、これと試験配列が比較される。配列比較アルゴリズムが用いられる場合、試験および基準配列がコンピュータに入力され、もし必要であれば、部分配列座標が指定され、配列アルゴリズムプログラムパラメータは指定される。配列比較アルゴリズムは次に、指定されたプログラムパラメータに基づいて、基準配列を基準として、試験配列(単数または複数)についてパーセント配列同一性を計算する。
比較のための配列の最適な整列は、例えば、Smith & Waterman,Adv. Appl.Math.2:482(1981)の局所的相同性アルゴリムにより、Needleman& Wunsch,J.Mol.Biol.48:443(1970)の相同性整列アルゴリズムにより、Pearson & Lipman,Proc.Nat’l. Acad.Sci.USA85:2444(1988)の類似性探求方法により、これらのアルゴリズムのコンピュータ化実施により(Wisconsin Genetics Software Package,GeneticsComputer Group,575 Science Dr.,Madison,WIにおけるGAP,BESTFIT,FASTA,およびTFASTA)、または目視検査(全般的には、CurrentProtocols in Molecular Biology,F.M. Ausubel et al,eds.,Current Protocols,a jointventure between Greene Publishing Associates,Inc.and John Wiley & Sons,Inc.,(1995Supplement)(Ausubel)を参照)により実施され得る。
パーセント配列同一性および配列類似性を決定するのに適したアルゴリズムの例は、BLASTおよびBLAST 2.0アルゴリズムであり、これらは、Altschulet al.(1990)J.Mol.Biol.215:403−410およびAltschuel et al.(1977)Nucleic Acids Res.25:3389−3402においてそれぞれ記載される。BLAST分析を実行するためのソフトウェアは、NationalCenter for Biotechnology Information(ncbi.nlm.nih.gov/)を介して公的に利用可能である。このアルゴリズムは、データベース配列中の同じ長さのワードと整列された場合に、ある正値のしきい値スコアTと一致するか満足する、問い合わせ配列中の長さWの短いワードを識別することにより高スコアリング配列ペア(HSP)を最初に識別するステップを伴う。Tは、近隣ワードスコアしきい値と呼ばれる(上記のAltschulet al)。これらの初期の近隣ワードヒットは、それらを含むより長いHSPを見出す探索を開始するためのシードの役割を果たす。ワードヒットは次に、累積整列スコアが増大できる限り各配列に沿って両方向に拡張される。累積スコアは、ヌクレオチド配列については、パラメータM(1対の一致する残基についての報酬スコア;常に>0)およびN(不一致残基についてのペナルティスコア;常に<0)を用いて計算される。アミノ酸配列については、スコアリングマトリックスが、累積スコアを計算するために使用される。各方向におけるワードヒットの拡張は、以下の場合に停止される:累積整列スコアが、その最大達成値から量Xだけ低下する場合;1つ以上の負スコアリング残基整列の累積のために累積スコアがゼロまたはそれ以下になる場合;またはいずれかの配列の末端に達した場合。BLASTアルゴリズムパラメータW、T、およびXは、整列の感度および速度を決定する。BLASTNプログラム(ヌクレオチド配列のための)は、初期値として、11のワード長(W)、10の期待値(E)、M=5、N=−4、および両方のストランドの比較を用いる。アミノ酸配列については、BLASTPプログラムは、初期値として、3のワード長(W)、10の期待値(E)、およびBLOSUM62スコアリングマトリックス(Henikoff& Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989)参照)を用いる。
パーセント配列同一性の計算に加え、BLASTアルゴリズムは、2つの配列間の類似性の統計分析も実行する(例えば、Karlin& Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873−5787(1993)参照)。BLASTアルゴリズムによって提供される類似性の1つの測度は、最小合計確率(P(N))であり、これは、2つのヌクレオチドまたはアミノ酸配列間の一致が偶然に生じる確率の示度を提供する。例えば、もし基準核酸と試験核酸との比較における最小合計確率が約0.1未満、より好ましくは約0.01未満、最も好ましくは約0.001未満であれば、核酸は基準配列とほぼ同等であると考えられる。
2つの核酸配列またはポリペプチドが実質的に同一であるというさらなる示度は、以下に記載されるように、第1の核酸によってコードされたポリペプチドが、第2の核酸によってコードされたポリペプチドと、免疫学的に交叉反応性であるということである。従って、ポリペプチドは典型的に、例えば、2つのペプチドが保存的置換によってのみ異なる場合、第2のポリペプチドと実質的に同一である。2つの核酸配列が実質的に同一であるという別の示度は、以下で記載されるように、2つの分子がストリンジェントな条件下で互いにハイブリダイズすることである。
文言「〜に特異的にハイブリダイズする」は、複合混合物(例えば、全細胞)DNAまたはRNA中に特定のヌクレオチド配列が存在する場合、ストリンジェントな条件下における、その配列のみへの分子の結合、二重化、またはハイブリダイズを指す。
用語「ストリンジェントな条件」は、プローブがその標的部分配列にハイブリダイズするが、他の配列にはハイブリダイズしない条件を指す。ストリンジェントな条件は、配列依存的であり、異なる環境において異なる。より長い配列は、より高い温度において特異的にハイブリダイズする。一般に、ストリンジェントな条件は、規定されたイオン強度およびpHにおいて特定の配列についての熱的融点(Tm)より約5℃低い温度として選択される。このTmは、標的配列に対し相補的なプローブの50%が、標的配列に対し平衡状態においてハイブリダイズする温度(規定されたイオン強度、pHおよび核酸濃度の下)である。(標的配列が、一般に、Tmにおいて過剰に存在する場合、プローブの50%は、平衡状態で占められる)。典型的には、ストリンジェントな条件は、塩濃度が約1.0MNa+イオン未満であり、典型的には、pH7.0〜8.3において約0.01〜1.0M Na+イオン濃度(または他の塩)であり、温度は、短いプローブ(約10〜50ヌクレオチド)について少なくとも約30℃であり、長いプローブ(例えば、50ヌクレオチドより長い)について少なくとも約60℃の条件である。ストリンジェントな条件はまた、ホルムアミドのような不安定化剤の添加によって達成され得る。高ストリンジェンシーPCR増幅については、高ストリンジェンシーアニーリング温度は、プライマー長さおよび特異性に応じて約50℃〜約65℃の範囲にわたり得るが、約62℃の温度が典型的である。高および低ストリンジェンシー増幅のための典型的なサイクル条件は、90〜95℃、30〜120秒間の変性段階30〜120秒間続くアニーリング段階、および約72℃、1〜2分間の伸長段階を含む。低および高ストリンジェンシー増幅反応のためのプロトコルおよびガイドラインは、例えば、Innis,etal.(1990)PCR Protocols:A Guide to Methods and Applications Academic Press,N. Y.において利用可能である。
抗体に言及する場合、文言「〜に特異的に結合する」または「〜と特異的に免疫反応性である」は、タンパク質、糖類、および他の生物製剤の異種集団の存在下において、タンパク質または他の抗原の存在を決定する結合反応を指す。従って、指定された免疫学的アッセイ条件下では、規定された抗体は、特定のタンパク質に優先的に結合し、そして試料中に存在する他のタンパク質に、有意な量では結合しない。そのような条件下でのタンパク質への特異的結合は、抗体を必要とし、この抗体は、特定の抗原に対するその特異性について選択される。種々のイムノアッセイ形式が、特定の抗原と特異的に免疫反応性である抗体を選択するために使用される。例えば、固相ELISAイムノアッセイは、抗原と特異的に免疫反応性であるモノクロナール抗体を選択するために日常的に使用される。特異的な免疫反応性を決定するために使用され得るイムノアッセイ形式および条件の記載については、HarlowおよびLane(1988)Antibodies,ALaboratory Manual,Cold Spring Harbor Publications,New Yorkを参照されたい。
「抗体」は、抗原と特異的に結合および認識する免疫グロブリン遺伝子またはその断片からのフレームワーク領域を含むポリペプチドを指す。認識される免疫グロブリン遺伝子としては、カッパ、ラムダ、アルファ、ガンマ、デルタ、エプシロン、およびミュー定常域遺伝子、ならびに無数の免疫グロブリン可変領域遺伝子が含まれる。好ましい実施形態において、CgtBタンパク質に特異的に結合する抗体が産生される。軽鎖は、カッパか、ラムダとして分類される。重鎖は、ガンマ、ミュー、アルファ、デルタ、またはエプシロンとして分類され、これらが今度は免疫グロブリンクラスIgG、IgM、IgA、IgDおよびIgEをそれぞれ定義する。典型的には、抗体の抗原結合領域は、結合の特異性および親和性において最も決定的である。
代表的な免疫グロブリン(抗体)構造単位は、四量体を含む。各四量体は、ポリペプチド鎖の2つの同一の対により構成されており、各対は、1つの「軽」(約25kD)および1つの「重」(約50〜70kD)鎖を有する。各鎖のN−末端は、主に抗原認識をつかさどる約100〜110のアミノ酸の可変領域を定義する。可変軽鎖(VL)および可変重鎖(VH)という用語は、これらの軽および重鎖をそれぞれ指す。
抗体は、例えば、無傷の免疫グロブリンとして、または様々なペプチダーゼによる消化によって産生された、いくつかの十分に特徴付けられた断片として存在する。従って、例えば、ペプシンは、抗体をヒンジ領域中のジスルフィド結合下方で消化して、Fabの二量体であるF(ab)’2を産生し、これは、それ自身がジスルフィド結合によってVH−CH1に結合された軽鎖である。F(ab)’2は、穏やかな条件のもとで還元されてヒンジ領域中のジスルフィド連鎖を壊し、それによって、F(ab)’2二量体をFab’単量体に転換することができる。Fab’単量体は本質的に、ヒンジ領域の一部を持つFabである(FundamentalImmunology(Paul ed.,3d ed.1993参照)。様々な抗体断片が、無傷の抗体の消化の観点から定義される一方で、当業者は、そのような断片が、化学的にか、または組換えDNA方法論を用いて新たに合成され得ることを理解するであろう。従って、抗体という用語は、本明細書中において用いられるように、抗体全体の修飾によって産生された抗体断片か、あるいは組換えDNA方法論を用いて新たに合成された抗体断片か(例えば、単鎖Fv)、またはファージディスプレイライブラリーを用いて同定された抗体断片(例えば、McCaffertyet al,Nature 348:552−554(1990)参照)も含む。
抗体、例えば、組換え抗体、モノクロナール抗体、またはポリクロナール抗体の調整については、当該技術分野において知られている多くの手法を用いることができる(例えば、Kohler& Milstein,Nature 256:495−497(1975);Kozbor et al.,Immunology Today 4:72(1983);Coleet al.,pp.77−96 in Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.(1985);Coligan,CurrentProtocols in Immunology(1991);Harlow & Lane,Antibodies,A Laboratory Manual(1988);およびGoding,MonoclonalAntibodies:Principles and Practice(2d ed. 1986)参照)。関心対象の抗体の重鎖および軽鎖をコードする遺伝子は、細胞からクローニングすることができ、例えば、モノクロナール抗体をコードする遺伝子は、ハイブリドーマからクローニングして、組換えモノクロナール抗体を産生するために使用され得る。モノクロナール抗体の重および軽鎖をコードする遺伝子ライブラリーはまた、ハイブリドーマまたはプラズマ細胞から作られ得る。重および軽鎖遺伝子生成物のランダムな組み合わせは、異なる抗原特異性を有する抗体の大きなプールを生成する(例えば、Kuby,Immunology(3rded.1997)参照)。単鎖抗体または組換え抗体の産生のための手法(米国特許第4,946,778号、米国特許第4,816,567号)は、本発明のポリペプチドに対する抗体を産生するために適合させ得る。また、トランスジェニックマウス、または他の哺乳動物のような他の生物体は、ヒト化抗体またはヒト抗体を発現させるために用いられ得る(例えば、米国特許第5,545,807号;同第5,545,806号;同第5,569,825号;同第5,625,126号;同第5,633,425号;同第5,661,016号;Markset al,Bio/Technology 10:779−783(1992);Lonberg et al,Nature 368:856−859(1994);Morrison,Nature368:812−13(1994);Fishwild et al,Nature Biotechnology 14:845−51(1996);Neuberger,NatureBiotechnology 14:826(1996);およびLonberg & Huszar,Intern. Rev.Immunol.13:65−93(1995)参照)。あるいは、ファージディスプレイ技術は、選択された抗原に特異的に結合する抗体およびヘテロメリックFab断片を同定するために用いられ得る(例えば、McCaffertyet al,Nature,348:552−554(1990);Marks et al,Biotechnology 10:779−783(1992)参照)。抗体はまた、二重特異性、すなわち、2つの異なる抗原を認識できるようにすることができる(例えば、国際公開第93/08829号,Trauneckeret al.,EMBO J.10:3655−3659(1991);およびSuresh et al.,Enzymology 121:210(1986)参照)の方法。抗体はまた、ヘテロ接合体、すなわち、2つの共有結合的に接合された抗体、または免疫毒素であり得る(例えば、米国特許第4,676,980号,国際公開第91/00360号;国際公開第92/200373号;および欧州特許第03089号参照)。
1つの実施形態において、抗体は「エフェクター」部分に接合される。エフェクター部分は、診断アッセイにおいて使用するための放射性標識または蛍光標識のような標識部分を含む、任意の数の分子であり得る。
抗体に「特異的に(または選択的に)結合する」あるいは「〜に対して特異的(または選択的)免疫反応性を有する」という文言は、タンパク質またはペプチドに言及する場合、多くの場合タンパク質および他の生体物質の不均一集団における、該タンパク質の存在を決定する結合反応を指す。従って、指定されたイムノアッセイ条件下において、特定の抗体は、バックグラウンドの少なくとも2倍、より典型的にはバックグラウンドの10倍〜100倍を上回って、特定のタンパク質に結合する。そのような条件下における抗体への特異的結合には、特定のタンパク質に対するその特異性について選択された抗体が必要である。例えば、CgtBタンパク質、その多型変異体、対立遺伝子、オルソログ、および、保存的修飾変異体、またはスプライス変異体、あるいはその一部に対して生じさせられたポリクロナール抗体は、CgtBタンパク質に対して特異的免疫反応性を有するが他のタンパク質に対しては有さないポリクロナール抗体のみを得るために選択される。この選択は、他の分子と交叉反応する抗体を除くことによって達成され得る。特定のタンパク質に対して特異的免疫反応性を有する抗体を選択するために、様々なイムノアッセイ形式を用いることができる。例えば、固相ELISAイムノアッセイは、タンパク質に対して特異的免疫反応性を有する抗体を選択するために慣用的に使用される(特異的免疫反応性を決定するために使用できるイムノアッセイ形式および条件の説明については、例えば、Harlow& Lane,Antibodies,A Laboratory Manual(1988)を参照されたい)。
「抗原」は、抗体により認識および結合される分子、例えば、ペプチド、炭水化物、有機分子、または、糖脂質および糖タンパク質のようなより複雑な分子である。抗体結合の標的である抗原の部分が抗原決定基であり、単一の抗原決定基に対応する小さな官能基はハプテンと呼ばれる。
「標識」とは、分光学的、光化学的、生化学的、免疫化学的、または化学的手段により検出可能な組成物である。例えば、有用な標識としては、32P、125I、蛍光色素、高電子密度試薬、酵素(例えば、ELISAにおいて一般に使用される酵素)、ビオチン、ジゴキシゲニン、または、その抗血清もしくはモノクロナール抗体が入手可能なハプテンおよびタンパク質(例えば、放射標識をペプチドに組み込むことによって、例えば、配列番号2のポリペプチドを検出可能にすることができ、これを用いて該ペプチドに対して特異的反応性を有する抗体を検出することができる)が含まれる。
用語「イムノアッセイ」は、抗原に特異的に結合する抗体を使用するアッセイである。イムノアッセイは、抗原を単離、標的化、および/または定量するために特定の抗体の特異的結合特性を使用することを特徴とする。
用語「担体分子」は、T細胞によって認識される抗原決定基を含む免疫原性分子を意味する。担体分子は、タンパク質であってもよく、または脂質であってもよい。ポリペプチドを免疫原性にするために、担体タンパク質がポリペプチドに接合される。担体タンパク質としては、キーホールリンペットヘモシアニン、カブトガニヘモシアニン、およびウシ血清アルブミンが含まれる。
用語「アジュバント」は、抗原に対する免疫応答を非特異的に増強する物質を意味する。アジュバントとしては、完全か、または不完全なフロイントアジュバント;TitermaxGoldアジュバント;ミョウバン;および細菌LPSが含まれる。
用語「接触させる」は、本明細書において以下と互換的に使用される:組み合わせる、添加する、混合する、通す、インキュベーションする、流す等。
III.CgtBポリペプチド
CgtBポリペプチドは、β−1,3−ガラクトシルトランスフェラーゼ酵素であり、ガラクトースをUDP−ガラクトースから、オリゴ糖上の末端GalNAc残基を有するオリゴ糖、二糖類、またはGalNAc単糖類へ転移する機能的活性を有する。全長、野生型、または天然のCgtBタンパク質の例は、例えば、配列番号2または配列番号4または配列番号6または配列番号8または配列番号10である。
本発明の切断型CgtBポリペプチドは、配列番号2または配列番号4または配列番号6または配列番号8または配列番号10の一部分、すなわち、タンパク質のC−末端から1〜30個の間のアミノ酸残基を欠く配列番号2、配列番号4、配列番号6、配列番号8、または配列番号10と同一、または特定のパーセント同一性を共有するアミノ酸配列を含む。いくつかの実施形態において、切断型CgtBタンパク質は、タンパク質のC−末端に融合されたMBPドメインも含む。CgtBポリペプチドは、β−1,3−ガラクトシルトランスフェラーゼ酵素であり、ガラクトースをUDP−ガラクトースから、末端N−アセチル−ガラクトサミンを含むオリゴ糖へ転移する機能的活性を有する。
C.jejuni OH4384由来のCgtBタンパク質に関連するタンパク質をコードする核酸も、他のC.jejuni株、例えば、ATCC43432、ATCC 43460 NCTC 11168およびATC 43438において同定された。これらのタンパク質のアミノ酸配列は、配列番号4、配列番号6、配列番号8および配列番号10にそれぞれ見出される。
CgtBアミノ酸配列は、保存されたアミノ酸残基を同定するために分析され得る。例えば、ClustalXプログラムが、CgtBOH4384、CgtB11168およびCgtBHS10タンパク質を配列比較するために用いられた。結果が図2に示してある。3つの配列すべてにおける同一のアミノ酸残基は、黒い背景中で白く表示され;いずれか2つの配列間で同一のアミノ酸残基は、灰色の背景中で白く表示される(図2A参照)。図2Bは、Genedocにおいて割り当てられるいずれか2つのCgtBタンパク質間の同一性および類似性のパーセンテージを示す。
ClustalXまたは当業者に公知の類似プログラムにより生成された配列比較を用いて、同一の、保存的な、または半保存的な残基を同定することができ、CgtB活性に対して有害であろうアミノ酸残基における変更を予想および回避するためにこれらを使用することができる。そのような配列比較は、タンパク質活性に影響を及ぼすことなく変更され得る可能性が最も高いアミノ酸残基を同定するために用いることもできる。本明細書においてまたはClustalXウェブサイトで同定された保存的残基を選択することにより、あるいは、図2などの図面における対応するアミノ酸の1つに対する修飾を選択することにより、必要に応じて、アミノ酸の変更を行うことができる。
IV.CgtBポリペプチドをコードする核酸の単離
CgtBポリペプチドをコードする核酸としては、上述の全長、天然のCgtBポリペプチド、例えば、配列番号2、配列番号4、配列番号6、配列番号8および配列番号10ならびにそれらの配列の酵素的に活性な切断をコードする核酸が含まれる。本発明のCgtBポリペプチドは、ドナー基質からアクセプター基質へのガラクトース部分の転移を触媒し、その活性を測定するためのアッセイは、本明細書中において開示される。
本明細書に開示された情報に基づくさらなるCgtBポリペプチドをコードする核酸、およびそのような核酸を入手する方法は、当業者に公知である。ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、転写増幅システム(TAS)、または自立配列複製システム(SSR)のようなinvitro法によって、適切な核酸(例えば、cDNA、ゲノム、または部分配列(プローブ))をクローニング、または増幅することができる。多種多様なクローニングおよびinvitro増幅の方法論が、当業者に周知である。これらの手法および、多くのクローニング演習によって当業者を導くのに十分な教示の例は、Berger and Kimmel,Guideto Molecular Cloning Techniques,Methods in Enzymology 152 Academic Press,Inc.,SanDiego,CA(Berger);Sambrook et al.(1989)Molecular Cloning−A Laboratory Manual(2nded.)Vol.1−3,Cold Spring Harbor Laboratory,Cold Spring Harbor Press,NY,(Sambrooket al.);Current Protocols in Molecular Biology,F.M.Ausubel et al.,eds.,Current Protocols,ajoint venture between Greene Publishing Associates,Inc.and John Wiley & Sons,Inc.,(1994Supplement)(Ausubel);Cashion et al.,米国特許第5,017,478号;およびCarr,欧州特許第0,246,864号に見出される。
標準分子生物学方法、例えば、PCRは、任意の既知のCgtB配列の切断を生成するために使用され得る。
CgtBポリペプチドをコードするDNA、またはその部分配列は、例えば、クローニングおよび制限酵素による適切な配列の制限消化を含む上述の適切な方法のいずれかによって調製することができる。1つの好ましい実施形態において、CgtBポリペプチドをコードする核酸は、慣用のクローニング法によって単離される。例えば、配列番号1において提供されるCgtBポリペプチドのヌクレオチド配列を用いて、ゲノムDNA試料中のCgtBポリペプチドをコードする遺伝子に、あるいは全RNA試料中のCgtBポリペプチドをコードするmRNAに特異的にハイブリダイズするプローブを提供することができる(例えばサザンブロットまたはノーザンブロットにおいて)。ひとたびCgtBポリペプチドをコードする標的核酸が同定されたら、当業者に公知の標準的方法に従ってこれを単離することができる(例えば、Sambrooket al.(1989)Molecular Cloning:A Laboratory Manual,2nd Ed.,Vols.1−3,Cold Spring HarborLaboratory;Berger and Kimmel(1987)Methods in Enzymology,Vol.152:Guide to MolecularCloning Techniques,San Diego:Academic Press,Inc.;またはAusubel et al.(1987)CurrentProtocols in Molecular Biology,Greene Publishing and Wiley−Interscience,New Yorkを参照されたい)。さらに、単離された核酸を制限酵素で切断して、全長CgtBポリペプチドをコードする核酸、または、例えば、CgtBポリペプチドの触媒ドメインの少なくとも部分配列をコードする部分配列を含む、その部分配列を作製することができる。次に、CgtBポリペプチドまたはその部分配列をコードするこれらの制限酵素断片を、例えばCgtBタンパク質をコードする核酸を産生するために、ライゲーションすることができる。
CgtBポリペプチドをコードする核酸、またはその部分配列は、発現産物についてアッセイすることによって特性決定することができる。発現タンパク質の物理的、化学的、または免疫学的特性の検出に基づくアッセイを用いることができる。例えば、クローニングされたCgtB核酸にコードされるタンパク質がドナー基質からアクセプター基質へのガラクトース部分の移動を触媒することができる能力によって、該核酸を同定することができる。1つの方法において、反応産物を検出するためにキャピラリー電気泳動が用いられる。この高感度アッセイは、Wakarchuket al.(1996)J.Biol.Chem.271(45):28271−276に記載されるようにフルオレセインで標識される糖類または二糖類のアミノフェニル誘導体のいずれかの使用を伴う。CgtB活性をアッセイするために、GalNac−β−FCHASEを基質として用いることができる。他のグリコシルトランスフェラーゼの反応産物は、キャピラリー電気泳動を用いて検出することができ、例えば、ナイセリアlgtC酵素をアッセイするためには、FCHASE−AP−LacまたはFCHASE−AP−Galのいずれかを用いることができるが、一方ナイセリアlgtB酵素に関しては、適切な試薬はFCHASE−AP−GlcNAc(Wakarchuk、上記)である。α2,8−シアリルトランスフェラーゼをアッセイするために、GM3−FCHASEが基質として用いられる。例えば、参照により本明細書に組み込まれる米国特許第6,503,744号を参照されたい。オリゴ糖反応生成物を検出するためのその他の方法としては、薄層クロマトグラフィーおよびGC/MSが含まれ、これらは、参照により本明細書に組み込まれる米国特許第6,503,744号に開示されている。
また、CgtBポリペプチドをコードする核酸、またはその部分配列を化学的に合成することもできる。適切な方法としては、Naranget al.(1979)Meth. Enzymol.68:90−99のホスホトリエステル法;Brown et al.(1979)Meth.Enzymol.68:109−151のホスホジエステル法;Beaucageet al.(1981)Tetra.Lett.,22:1859−1862のジエチルホスホラミダイト法;および米国特許第4,458,066号の固体支持体法が含まれる。化学合成によって、一本鎖オリゴヌクレオチドが産生される。これを、相補配列とのハイブリダイゼーションによって、または、鋳型として上記一本鎖を用いたDNAポリメラーゼによる重合によって、二本鎖DNAへ変換することができる。DNAの化学合成は約100塩基の配列に制限されることが多いが、より短い配列をライゲーションすることによってより長い配列が得られることを当業者は認識している。
CgtBポリペプチドをコードする核酸、またはその部分配列を、ポリメラーゼ連鎖反応(PCR)のようなDNA増幅法を用いてクローニングすることができる。従って、例えば、1つの制限酵素部位(例えば、NdeI)を含むセンスプライマーおよび別の制限酵素部位(例えば、HindIII)を含むアンチセンスプライマーを用いて、核酸配列または部分配列がPCR増幅される。これによって、所望のCgtBポリペプチドまたは部分配列をコードしかつ末端制限酵素部位を有する核酸が産生される。次にこの核酸を、第2の分子をコードする核酸を含有しかつ対応する適切な制限酵素部位を有するベクター内に、容易にライゲーションすることができる。当業者は、GenBankまたはその他の情報源より提供される配列情報を用いて、適切なPCRプライマーを決定することができる。適切な制限酵素部位を、CgtBタンパク質またはそのタンパク質部分配列をコードする核酸に、部位特異的突然変異誘発によって付加することもできる。CgtBタンパク質をコードするヌクレオチド配列または部分配列を含むプラスミドは、適切な制限エンドヌクレアーゼで切断され、次に、標準的方法によって増幅および/または発現のための適切なベクターへライゲーションされる。invitro増幅法を通じて当業者を導くのに十分な技術の例は、Berger、Sambrook、およびAusubel、ならびにMullis et al.,(1987)米国特許第4,683,202号;PCRProtocols A Guide to Methods and Applications(Innis et al.,eds)Academic Press Inc.SanDiego,CA(1990)(Innis);Arnheim & Levinson(October 1,1990)C&EN 36−47;The Journal OfNIH Research(1991)3:81−94;(Kwoh et al.(1989)Proc.Natl.Acad.Sci.USA 86:1173;Guatelliet al.(1990)Proc.Natl.Acad.Sci.USA 87,1874;Lomell et al.(1989)J.Clin.Chem.,35:1826;Landegrenet al.,(1988)Science 241:1077−1080;Van Brunt(1990)Biotechnology 8:291−294;Wu andWallace(1989)Gene 4:560;およびBarringer et al.(1990)Gene 89:117に見出される。
細菌CgtBタンパク質をコードするいくつかの核酸を、本明細書に開示されるCgtB核酸の配列に基づくPCRプライマーを用いて増幅することができる。CgtBタンパク質をコードする核酸を増幅するために使用できるPCRプライマーの例としては、以下のプライマー対が含まれる:
C.jejuni OH4384および関連する株由来のcgtBは、以下のものを用いて増幅できる:
C.jejuni NCTC 11168および関連する株由来のcgtBは、以下のものを用いて増幅できる:
C.jejuni O:10および関連する株由来のcgtBは、以下のものを用いて増幅できる:
細菌によっては、特定の染色体遺伝子座、例えばC.jejuniのLOS遺伝子座を増幅し、次に、該遺伝子座において典型的に見出されるCgtB核酸を同定することによって、CgtBタンパク質をコードする核酸を単離することができる(例えば、米国特許第6,503,744号を参照されたい)。CgtBタンパク質をコードする核酸を含むLOS遺伝子座を増幅するために使用できるPCRプライマーの例としては、以下のプライマー対が含まれる:
特定の核酸から発現された組換えCgtBポリペプチドのその他の物理特性を公知のCgtBポリペプチドの特性と比較して、アクセプター基質特異性および/または触媒活性の決定因子であるCgtBポリペプチドの適切な配列またはドメインを同定する別の方法を提供することができる。あるいは、推定CgtBポリペプチドまたは組換えCgtBポリペプチドを変異させることができ、かつ、グリコシルトランスフェラーゼとしてのその役割、または特定の配列もしくはドメインの役割を、変異していない、天然の、または対照のCgtBポリペプチドにより通常産生される糖質の構造における変動を検出することにより確立できる。CgtBポリペプチドをコードする核酸を操作するための分子生物学的技術、例えば、PCRによって、本発明のCgtBポリペプチドの変異または修飾が促進され得ることを当業者は認識するであろう。
本明細書に記載のように、ポリペプチドを変異させるか修飾するための標準的方法を用いることによって、ならびに、アクセプター基質活性および/または触媒活性のような活性についてこれらを試験することによって、新たに同定されたCgtBポリペプチドの機能的ドメインを同定することができる。様々なCgtBポリペプチドの機能的ドメインを用いて、CgtBポリペプチドおよび1つ以上のCgtBポリペプチドの機能的ドメインをコードする核酸を構築することができる。次に、望ましいアクセプター基質または触媒活性について、これらの多−CgtB融合タンパク質を試験することができる。
CgtBタンパク質をコードする核酸をクローニングするための代表的なアプローチにおいて、クローニングされたCgtBポリペプチドの既知の核酸またはアミノ酸配列を整列化および比較し、様々なCgtBポリペプチド間の配列同一性の量を決定する。この情報を用いて、関心対象のCgtBタンパク質の間の配列同一性の量に基づき、CgtB活性、例えば、アクセプター基質活性および/または触媒活性を付与または調節するタンパク質ドメインを同定および選択することができる。例えば、関心対象のCgtBタンパク質間の配列同一性を有するドメイン、および、既知の活性と関連するドメインを用いて、該ドメインを含有しかつ該ドメインに関連する活性(例えば、アクセプター基質特異性および/または触媒活性)を有するCgtBタンパク質を構築することができる。
V.宿主細胞におけるCgtBポリペプチドの発現
E.coli、その他の細菌宿主、および酵母を含む様々な宿主細胞中で、本発明のCgtBタンパク質を発現させることができる。宿主細胞は好ましくは、例えば、酵母細胞、細菌細胞、または糸状菌細胞のような微生物細胞である。適切な宿主細胞の例としては、中でも、例えば、Azotobactersp.(例えば、A.vinelandii)、Pseudomonas sp.、Rhizobium sp.Erwinia sp.、Escherichia sp.(例えば、E.coli)、Bacillus、Pseudomonas、Proteus、Salmonella、Serratia、Shigella、Rhizobia、Vitreoscilla、ParacoccusおよびKlebsiellasp.が含まれる。細胞は、以下を含む複数の属のいずれかであり得る:Saccharomyces(例えば、S.cerevisiae)、Candida(例えば、C.utilis、C.parapsilosis、C.krusei、C.versatilis、C.lipolytica、C.zeylanoides、C.guilliermondii、C.albicans、およびC.humicola)、Pichia(例えば、P.farinosaおよびP.ohmeri)、Torulopsis(例えば、T.candida、T.sphaerica、T.xylinus、T.famata、およびT.versatilis)、Debaryomyces(例えば、D.subglobosus、D.cantarellii、D.globosus、D.hansenii、およびD.japonicus)、Zygosaccharomyces(例えば、Z.rouxiiおよびZ.bailii)、Kluyveromyces(例えば、K.marxianus)、Hansenula(例えば、H.anomalaおよびH.jadinii)、ならびにBrettanomyces(例えば、B.ランビカスおよびB.anomalus)。有用な細菌の例としては、これらに限定されるわけではないが、Escherichia、Enterobacter、Azotobacter、Erwinia、Klebsiella、Bacillus、Pseudomonas、Proteus、およびSalmonellaが含まれる。
ひとたび宿主細胞中で発現されると、CgtBポリペプチドは、ガラクトシル化生成物を産生するために用いることができる。例えば、標準的なタンパク質精製手法を用いてCgtBポリペプチドを単離することができ、かつこれを、ガラクトシル化生成物を作製するための本明細書に記載のinvitro反応において使用することができる。透過処理済み宿主細胞と同じく、部分的に精製されたCgtBポリペプチドも、ガラクトシル化生成物を作製するためのin vitro反応において用いることができる。ガラクトシル化生成物を産生するためのinvivo系(例えば、発酵産生)において、宿主細胞を使用することもできる。
典型的には、CgtBポリペプチドをコードするポリヌクレオチドを、所望の宿主細胞中で機能するプロモーターの制御下に置く。特定の用途に応じて、極めて多種多様なプロモーターが周知であり、本発明の発現ベクター中で使用可能である。通常、プロモーターが活性となるべき細胞によって、プロモーターが選択される。リボソーム結合部位、転写終結部位などのその他の発現制御配列も、任意で含まれる。1つ以上のこれらの制御配列を含む構築物は、「発現カセット」と呼ばれる。従って、本発明は、所望の宿主細胞における高レベル発現のための融合タンパク質をコードする核酸が組み込まれる発現カセットを提供する。
特定の宿主細胞における使用に適した発現制御配列は、該細胞中で発現する遺伝子のクローニングによって得られることが多い。通常使用される原核制御配列は、本明細書においてリボソーム結合部位配列と共に任意でオペレーターを伴う転写開始用プロモーターを含むと定義されており、ベータ−ラクタマーゼ(ペニシリナーゼ)およびラクトース(lac)プロモーター系(Changeet al.,Nature(1977)198:1056)、トリプトファン(trp)プロモーター系(Goeddel et al.,Nucleic Acids Res.(1980)8:4057)、tacプロモーター(DeBoer,etal.,Proc.Natl.Acad.Sci.U.S.A.(1983)80:21−25)、ならびに、ラムダ−由来PLプロモーターおよびN−遺伝子リボソーム結合部位(Shimatakeet al.,Nature(1981)292:128)のような、通常使用されるプロモーターを含む。特定のプロモーター系は、本発明にとり重要ではなく、原核生物中で機能する任意の利用可能なプロモーターを用いることができる。
E.coli以外の原核細胞におけるCgtBタンパク質の発現のためには、特定の原核生物種において機能するプロモーターが必要である。そのようなプロモーターは、該種からクローニングされた遺伝子より入手可能であり、あるいは、異種プロモーターが使用可能である。例えば、ハイブリッドtrp−lacプロモーターは、E.coliに加えてBacillus中でも機能する。
リボソーム結合部位(RBS)は、本発明の発現カセット中に都合よく含まれる。例えば、E.coli中のRBSは、開始コドンから3〜11ヌクレオチド上流に位置する3〜9ヌクレオチド長のヌクレオチド配列からなる(Shineand Dalgarno, Nature(1975)254:34;Steitz,In Biological regulation and development:Geneexpression(ed.R.F.Goldberger),vol.1,p.349,1979,Plenum Publishing,NY)。
酵母におけるCgtBタンパク質の発現については、都合のよいプロモーターとしては、GAL1−10(Johnson andDavies(1984)Mol.Cell.Biol.4:1440−1448)、ADH2(Russell et al(1983)J.Biol.Chem.258:2674−2682)、PHO5(EMBOJ.(1982)6:675−680)、およびMFα(Herskowitz and Oshima(1982)in The Molecular Biology ofthe Yeast Saccharomyces(eds.Strathern,Jones,and Broach)Cold Spring Harbor Lab.,ColdSpring Harbor,N.Y.,pp.181−209)が含まれる。酵母における使用に適した別のプロモーターは、Cousens et al.,Gene 61:265−275(1987)に記載のADH2/GAPDHハイブリッドプロモーターである。例えば、真菌Aspergillusの株(McKnight et al.、米国特許第4,935,349号)のような糸状菌に関して、有用なプロモーターの例としては、ADH3プロモーター(McKnightet al.,EMBO J.4:2093 2099(1985))およびtpiAプロモーターのようなAspergillus nidulans糖分解遺伝子由来のプロモーターが含まれる。適切なターミネーターの例は、ADH3ターミネーターである(McKnightet al.)。
本発明において、構成的なプロモーターまたは調節されたプロモーターのいずれかを用いることができる。融合タンパク質の発現が誘導される前に宿主細胞が高密度に増殖できるので、調節されたプロモーターが有利であり得る。異種タンパク質の高レベル発現は、状況によっては細胞増殖を遅延させる。誘導性プロモーターとは、例えば、温度、pH、無気条件または有気条件、光、転写因子および化学物質のような環境因子または発達因子によってその発現レベルが修飾可能である遺伝子の発現を導くプロモーターである。そのようなプロモーターは、本明細書において「誘導性」プロモーターと呼ばれ、これによって、グリコシルトランスフェラーゼまたはヌクレオチド糖合成に関与する酵素の発現のタイミングを制御することが可能になる。E.coliおよびその他の細菌宿主細胞に関して、誘導性プロモーターは当業者に公知である。これらには、例えば、lacプロモーター、バクテリオファージラムダPLプロモーター、ハイブリッドtrp−lacプロモーター(Amannet al.(1983)Gene 25:167;de Boer et al.(1983)Proc.Nat’l.Acad.Sci.USA 80:21)、およびバクテリオファージT7プロモーター(Studieret al.(1986)J. Mol.Biol.;Tabor et al.(1985)Proc.Nat’l.Acad.Sci.USA 82:1074−8)が含まれる。これらのプロモーターおよびその使用は、上記のSambrooket al.で論じられている。原核生物における発現のために好ましい特定の誘導性プロモーターは、ガラクトース代謝に関与する酵素をコードする単数または複数の遺伝子から得られたプロモーター成分(例えば、UDPガラクトース4−エピメラーゼ遺伝子(galE)由来のプロモーター)に連結されたtacプロモーター成分を含む、二重プロモーターである。二重tac−galプロモーターは、国際公開第98/20111号に記載されている。
遺伝子発現制御シグナルに機能的に連結された関心対象のポリヌクレオチドを含む構築物であって、該シグナルが適切な宿主細胞中に配置された場合に該ポリヌクレオチドの発現を駆動する構築物は、「発現カセット」と呼ばれる。本発明の融合タンパク質をコードする発現カセットは、宿主細胞への導入用の発現ベクター内に配置されることが多い。ベクターは典型的には、発現カセットに加えて、1つ以上の選択された宿主細胞中でベクターが独立して複製を行うことを可能にする核酸配列を含む。一般に、この配列は、宿主染色体DNAとは独立してベクターが複製を行うことを可能にする配列であり、複製起点または自立複製配列を含む。そのような配列は、様々な細菌について知られている。例えば、プラスミドpBR322由来の複製起点は、大部分のグラム陰性細菌に適している。あるいは、ベクターは、宿主細胞ゲノム補体に一体化され、細胞がDNA複製を受ける際に複製されることにより、複製することができる。細菌細胞における酵素の発現のために好ましい発現ベクターはpTGKであり、これは、二重tac−galプロモーターを含み、国際公開第98/20111号に記載されている。
ポリヌクレオチド構築物の構築には一般に、細菌中で複製可能なベクターの使用が必要である。細菌からのプラスミドの精製に関しては、極めて多くのキットが市販されている(例えば、EasyPrepJ、FlexiPrepJ、どちらもPharmaciaBiotech製;StrataCleanJ、Stratagene製;およびQIAexpress Expression System、Qiagenを参照されたい)。次に、単離および精製されたプラスミドを、その他のプラスミドを産生するようにさらに操作することができ、かつ細胞のトランスフェクションのために使用することができる。StreptomycesまたはBacillusにおけるクローニングも可能である。
選択可能マーカーは、本発明のポリヌクレオチドを発現させるために用いられる発現ベクター中に組み込まれることが多い。これらの遺伝子は、選択的培養培地中で増殖する形質転換宿主細胞の生存または増殖に必要な、タンパク質のような遺伝子産物をコードすることができる。選択遺伝子を含むベクターで形質転換されていない宿主細胞は、上記培養培地中で生存しないと考えられる。典型的な選択遺伝子は、アンピシリン、ネオマイシン、カナマイシン、クロラムフェニコール、もしくはテトラサイクリンなどの抗生物質またはその他の毒素に対する耐性を付与するタンパク質をコードする。あるいは選択可能マーカーは、栄養要求性の欠乏を補完するか複合培地からは入手できない重要な栄養素を供給するタンパク質をコードしてもよく、例えば、BacillusについてはD−アラニンラセマーゼをコードする遺伝子である。ベクターは、例えば、E.coliにおいて、または宿主細胞に導入される前にベクターが複製されるその他の細胞において機能的である選択可能マーカーを1つ有することが多い。いくつかの選択可能マーカーは、当業者に公知であり、例えば、上記のSambrooket al.に記載されている。
上記で列挙した成分の1つ以上を含む適切なベクターの構築には、上記で引用した参考文献に記載の標準的なライゲーション技術が用いられる。単離されたプラスミドまたはDNA断片は、切断され、調整され、かつ、必要なプラスミドを作製するために望ましい形態で再ライゲーションされる。構築されたプラスミド中の正しい配列を確認するために、制限エンドヌクレアーゼ消化のような標準的手法によって、および/または公知の方法による配列決定によって、プラスミドを解析することができる。これらの目的を達成するための分子クローニング技術は、当技術分野で公知である。組換え核酸の構築に適した多種多様なクローニングおよびinvitro増幅法は、当業者に周知である。これらの手法および多くのクローニング実習によって当業者を導くのに十分な教示の例は、Berger and Kimmel,Guideto Molecular Cloning Techniques,Methods in Enzymology,Volume 152,Academic Press,Inc.,SanDiego,CA(Berger);およびCurrent Protocols in Molecular Biology,F.M. Ausubel et al.,eds.,CurrentProtocols,a joint venture between Greene Publishing Associates,Inc.and John Wiley& Sons,Inc.,(1998 Supplement)(Ausubel)に見出される。
本発明の発現ベクター構築のための出発材料としての使用に適した様々な一般的ベクターが、当技術分野で周知である。細菌におけるクローニングに関して、一般的なベクターとしては、pBLUESCRIPT(商標)のようなpBR322由来ベクター、およびλ−ファージ由来ベクターが含まれる。酵母においては、ベクターは、酵母組込みプラスミド(例えば、YIp5)および酵母複製プラスミド(YRpシリーズのプラスミド)およびpGPD−2を含む。哺乳動物細胞における発現は、pSV2、pBC12BI、およびp91023を含む一般に入手可能な様々なプラスミド、ならびに、溶解ウイルスベクター(例えば、ワクシニアウイルス、アデノウイルス、およびバキュロウイルス)、エピソームウイルスベクター(例えば、ウシパピローマウイルス)、およびレトロウイルスベクター(例えば、マウスレトロウイルス)を用いて達成できる。
選ばれた宿主細胞中に発現ベクターを導入するための方法は特に重要ではなく、そのような方法は当業者に公知である。例えば、塩化カルシウム形質転換によって、E.coliを含む原核細胞中に、および、リン酸カルシウム処置またはエレクトロポレーションによって真核細胞中に、発現ベクターを導入することができる。その他の形質転換法もまた適している。
翻訳カップリングを用いて、発現を増強してもよい。この戦略では、プロモーターの下流に配置された、翻訳系固有の高発現遺伝子に由来する上流の短いオープンリーディングフレーム、および、終結コドンによる数アミノ酸コドンの後に続くリボソーム結合部位が用いられる。終結コドンの直前には第2のリボソーム結合部位があり、終結コドンの後ろは翻訳開始のための開始コドンである。この系によってRNA中の二次構造が解消され、効率的な翻訳開始が可能になる。Squires,et.al.(1988),J.Biol.Chem.263:16297−16302を参照されたい。
CgtBポリペプチドは、細胞内で発現させることができ、または、細胞から分泌させることができる。細胞内発現は高収量につながることが多い。必要ならば、再折りたたみ工程の実施により、可溶性で活性な融合タンパク質の量を増大させることもできる(例えば、上記のSambrooket al.;Marston et al.,Bio/Technology(1984)2:800;Schoner et al.,Bio/Technology(1985)3:151を参照されたい)。CgtBポリペプチドが細胞から、周辺質または細胞外培地のいずれかへ分泌される実施形態においては、DNA配列は、切断可能なシグナルペプチド配列と連結される。シグナル配列は、細胞膜を介した融合タンパク質の移行を導く。E.coli中での使用に適したプロモーター−シグナル配列単位を含むベクターの例は、pTA1529であり、これは、E.coliphoAプロモーターおよびシグナル配列を有する(例えば、上記のSambrook et al.;Oka et al.,Proc.Natl.Acad.Sci.USA(1985)82:7212;Talmadgeet al.,Proc.Natl.Acad.Sci. USA(1980)77:3988;Takahara et al.,J.Biol.Chem.(1985)260:2670を参照されたい)。別の実施形態においては、例えば、精製、分泌、または安定性を促進するために、CgtBタンパク質は、プロテインAまたはウシ血清アルブミン(BSA)の部分配列と融合される。
また、本発明のCgtBポリペプチドを、その他の細菌タンパク質にさらに連結することもできる。正常な原核制御配列は転写および翻訳を指示するので、このアプローチにより高収量が得られることが多い。E.coliにおいては、異種タンパク質を発現させるためにlacZ融合物を用いることが多い。pUR、pEX、およびpMR100シリーズのような適切なベクターは容易に入手可能である(例えば、上記のSambrooket al.を参照されたい)。特定の用途に関しては、精製後に非グリコシルトランスフェラーゼおよび/またはアクセサリー酵素アミノ酸を融合タンパク質から切断することが望ましい。臭化シアン、プロテアーゼ、または第Xa因子による切断を含む当該技術分野で公知のいくつかの方法のいずれかによって、これを達成することができる(例えば、上記のSambrooket al.;Itakura et al.,Science(1977)198:1056;Goeddel et al.,Proc.Natl.Acad.Sci.USA(1979)76:106;Nagaiet al.,Nature(1984)309:810;Sung et al.,Proc.Natl.Acad.Sci.USA(1986)83:561を参照されたい)。所望の切断箇所で融合タンパク質のための遺伝子内に切断部位を設けることができる。
複数の転写カセットを単一の発現ベクター内に配置することによって、または、クローニング戦略において使用される各発現ベクターについて異なる選択可能マーカーを利用することによって、2つ以上の組換えタンパク質を単一の宿主細胞中で発現させてもよい。
そのN−末端の完全性を維持しているE.coli由来の組換えタンパク質を得るための適切な系は、Miller et al.Biotechnology7:698−704 (1989)に記載されている。この系において、関心対象の遺伝子は、ペプチダーゼ切断部位を含む酵母ユビキチン遺伝子の最初の76残基へのC−末端融合物として産生される。2つの部分の接合部における切断は、無傷の真性N−末端残基を有するタンパク質の産生という結果になる。
VI.CgtBポリペプチドの精製
本発明のCgtBタンパク質を、例えば、細胞内タンパク質として、または細胞から分泌されるタンパク質として発現させることができ、そして本発明の方法においてこの形態で使用可能である。例えば、発現された細胞内CgtBポリペプチドまたは分泌CgtBポリペプチドを含む粗製細胞抽出物を、本発明の方法において使用することができる。
あるいは、硫安塩析、アフィニティカラム、カラムクロマトグラフィー、ゲル電気泳動等を含む当該技術分野の標準的手順により、CgtBポリペプチドを精製することができる(一般的に、R.Scopes,ProteinPurification,Springer−Verlag,N.Y.(1982),Deutscher,Methods in Enzymology Vol.182:Guideto Protein Purification.,Academic Press,Inc.N.Y.(1990)を参照されたい)。少なくとも約70、75、80、85、90%の均一性の実質的に純粋な組成物が好ましく、92、95、98〜99%またはそれ以上の均一性が最も好ましい。例えば、抗体産生のための免疫原として、精製タンパク質を使用してもよい。
本発明のCgtBポリペプチドの精製を容易にするために、タンパク質をコードする核酸は、アフィニティ結合試薬を利用することのできるエピトープまたは「タグ」、すなわち精製タグ用のコード配列を含むこともできる。適切なエピトープの例としては、mycおよびV−5レポーター遺伝子が含まれ;これらのエピトープを有する融合タンパク質の組換え体産生に有用な発現ベクターが市販されている(例えば、Invitrogen(CarlsbadCA)ベクターであるpcDNA3.1/Myc−HisおよびpcDNA3.1/V5−Hisが哺乳動物細胞中での発現に適している)。本発明のCgtBポリペプチドにタグを付着させるために適したさらなる発現ベクター、および対応する検出系は当業者に公知であり、いくつかが市販されている(例えば、FLAG”(Kodak,RochesterNY))。適切なタグの別の例はポリヒスチジン配列であり、これは金属キレートアフィニティリガンドに結合することができる。典型的には、隣接する6個のヒスチジンが使用されるが、7個以上または5個以下も利用可能である。ポリヒスチジンタグに対する結合部分として働くことができる適切な金属キレートアフィニティリガンドとしては、ニトリロ三酢酸(NTA)が含まれる(Hochuli,E.(1990)“Purificationof recombinant proteins with metal chelating adsorbents”In Genetic Engineering:Principlesand Methods,J.K.Setlow,Ed.,Plenum Press,NY;Qiagen(Santa Clarita,CA)より市販)。その他の精製タグまたはエピトープタグとしては、例えば、AU1、AU5、DDDDK(EC5)、Eタグ、E2タグ、Glu−Glu、6残基ペプチド、ポリオーマ中間Tタンパク質に由来するEYMPME、HA、HSV、IRS、KT3、Sタグ、S1タグ、T7タグ、V5タグ、VSV−G、β−ガラクトシダーゼ、Gal4、緑色蛍光タンパク質(GFP)、ルシフェラーゼ、プロテインC、プロテインA、セルロース結合タンパク質、GST(グルタチオンS−トランスフェラーゼ)、step−タグ、Nus−S、PPI−ase、Pfg27、カルモジュリン結合タンパク質、dsbAおよびその断片、ならびにグランザイムBが含まれる。エピトープ配列に特異的に結合するエピトープペプチドおよび抗体は、例えば、Covance Research Products,Inc.;BethylLaboratories,Inc.; Abcam Ltd.;およびNovus Biologicals,Incより市販されている。
精製タグとしては、マルトース結合ドメインおよびデンプン結合ドメインも含まれる。精製タグを含むタンパク質は、該精製タグと結合する結合パートナー、例えば、該精製タグに対する抗体、ニッケルイオンもしくはコバルトイオンまたは樹脂、および、アミロース、マルトース、またはシクロデキストリンを用いて精製することができる。精製タグとしては、デンプン結合ドメイン、E.coliチオレドキシンドメイン(ベクターおよび抗体は、例えば、SantaCruz Biotechnology,Inc.およびAlpha Diagnostic International,Inc.より市販されている)、およびSUMOタンパク質(ベクターおよび抗体は、例えば、LifeSensors Inc.より市販されている)のカルボキシ末端側の半分も含まれる。E.coli由来のマルトース結合ドメインおよびA.nigerのアミラーゼ由来のSBD(デンプン結合ドメイン)のようなデンプン結合ドメインは、国際公開第99/15636号に記載され、これは参照により本明細書に組み込まれる。ベータシクロデキストリン(BCD)誘導体化樹脂を用いた、デンプン結合ドメインを含む融合タンパク質のアフィニティ精製は、2005年2月17日公開の国際公開第2005/014779号に記載されており、その全文が参照により本明細書に組み込まれる。いくつかの実施形態において、CgtBポリペプチドは、2つ以上の精製タグまたはエピトープタグを含む。
タグとしての使用に適したその他のハプテンは当業者に公知であり、例えば、Handbook of Fluorescent Probesand Research Chemicals(6th Ed.,Molecular Probes,Inc.,Eugene OR)に記載されている。例えば、ジニトロフェノール(DNP)、ジゴキシゲニン、バルビツレート(例えば、米国特許第5,414,085号を参照されたい)、およびいくつかの種類のフルオロフォアは、これらの化合物の誘導体であるので、ハプテンとして有用である。ハプテンおよびその他の部分をタンパク質およびその他の分子に連結するためのキットが市販されている。例えば、ハプテンがチオールを含む場合、SMCCのようなヘテロ二官能性リンカーを用いて、捕捉試薬上に存在するリシン残基にタグを付着させることができる。
その生物活性を減少させることなくCgtBポリペプチドの触媒ドメインまたは機能ドメインを修飾できることを、当業者は認識するであろう。融合タンパク質への触媒ドメインのクローニング、発現、または組み込みを促進するために、いくつかの修飾をおこなってもよい。そのような修飾は当業者には周知であり、例えば、そのような修飾としては、例えば、開始部位を提供するためにアミノ末端に付加されたメチオニンを提供するための触媒ドメインをコードするポリヌクレオチドのいずれかの末端へのコドンの付加、あるいは、好都合に配置された制限酵素部位または終結コドンもしくは精製配列を作製するためにいずれかの末端に配置されたさらなるアミノ酸(例えばポリHis)が含まれる。
VII.ドナー基質及びアクセプター基質
CgtBポリペプチドによって使用される適切なドナー基質としては、例えば、UDP−Galが含まれる。Guo et al.,AppliedBiochem. and Biotech.68:1−20(1997)。
典型的には、アクセプター基質は、β−1,3結合によるガラクトース残基の付加のための末端GalNAcまたは誘導体を含む。適切なアクセプターの例としては、β1,4結合によってGalに連結される末端GlcNAc、および還元末端においてアグリコン基に連結される末端GalNAcが含まれる。適切な標識アクセプターとしては、例えば、GalNAcβ−1,4−Galβ−1,4−Glc−FCHASE、GalNAcβ−1,4−[NeuAcα−2,3]−Galβ−1,4−Glc−FCHASE、GalNAcβ−1,4−[NeuAc−α−2,3]−Galβ−1,4−Glc−スフィンゴシン−FCHASE、GalNAcβ−1,4−[NeuAcα−2,8−NeuAcα−2,3]−Galβ−1,4−Glc−FCHASE、GalNAcβ−FCHASE、GalNAc−α−FCHASE、GalNAc−β−p−ニトロフェニル、GalNAc−α−p−ニトロフェニルが含まれる。いくつかの実施形態において、アクセプター残基は、例えば、ペプチド、タンパク質、脂質、またはプロテオグリカンに付着さたオリゴ糖の一部である。FCHASE−NH−Val−Gly−Val−Thr[GalNAc−α−]Glu−Thr−Pro−COOH、IFNα2b[Thr−134−GalNAc。切断型CgtBタンパク質はまた、ガラクトース残基を、例えば、上記で列挙された構造を有する標識されていないアクセプター基質に付加するために使用できる。標識されていないアクセプター基質は、例えば、ガラクトシル化製品を商業的規模で作製するために用いられる。
本発明のCgtBポリペプチドおよび方法によって使用される適切なアクセプター基質としては、多糖およびオリゴ糖が含まれるが、これらに限定されない。本明細書に記載のCgtBポリペプチドは、好都合な出発材料から所望の生成物を産生するための多酵素系においても使用することができる。
本発明のCgtBポリペプチドおよび方法によって使用される適切なアクセプター基質としては、本発明の方法によって修飾可能なタンパク質、脂質、ペプチド、糖タンパク質、糖脂質、糖ペプチド、ガングリオシド、およびその他の生物学的構造体(例えば、細胞全体)が含まれるが、これらに限定されない。これらのアクセプター基質は典型的には、上述の多糖またはオリゴ糖分子を含む。本発明の方法により修飾することができる代表的な構造としては、当業者に公知の細胞上の糖脂質、糖タンパク質および炭水化物構造体のいくつかが含まれる。
本発明は、所望のオリゴ糖部分を有するオリゴ糖、糖タンパク質および糖脂質を産生する能力に関して選択されるCgtBポリペプチドを提供する。同様に、もし存在すれば、所望の活性化糖基質に基づいて、または生成物であるオリゴ糖において見出される糖に基づいて、アクセサリー酵素が選択される。
糖タンパク質の合成については、様々な量の関心対象のCgtBポリペプチド(例えば、0.01〜100 mU/mgタンパク質)を、該関心対象のCgtBタンパク質によるグリコシル化のための潜在的アクセプター部位を有するオリゴ糖に連結された糖タンパク質(例えば1〜10mg/ml)と反応させることにより、適切なCgtBポリペプチドを容易に同定することができる。本発明の組換えCgtBタンパク質が所望のアクセプター部位において糖残基を付加できる能力を比較し、所望の特性(例えば、アクセプター基質選択性または触媒活性)を有するCgtBポリペプチドを選択する。
一般に、所望のガラクトシル化オリゴ糖部分を有するオリゴ糖、糖タンパク質、および糖脂質の酵素的合成の有効性を、組換え的に産生された本発明のCgtBポリペプチドの使用によって増強させることができる。組換え技術は、オリゴ糖、糖タンパク質および糖脂質の大規模なinvitro修飾に必要な組換えCgtBポリペプチドの大量産生を可能にする。
いくつかの実施形態において、本発明のCgtBポリペプチドおよび方法による使用に適したオリゴ糖、糖タンパク質、および糖脂質は、グリコシル化反応の際に固体支持体上に固定化された糖タンパク質および糖脂質であり得る。用語「固体支持体」は、半固体支持体も包含する。好ましくは、グリコシル化反応が完了した後にそれぞれの糖タンパク質または糖脂質を放出できるように、標的糖タンパク質または糖脂質は可逆的に固定化される。多くの適切なマトリクスが、当業者には公知である。例えば、イオン交換を用いて、グリコシル化反応が進行する間、糖タンパク質または糖脂質を適切な樹脂上に一時的に固定化することができる。関心対象の糖タンパク質または糖脂質に特異的に結合するリガンドを、親和性に基づく固定化に用いることもできる。例えば、糖タンパク質に特異的に結合する抗体が適している。また、関心対象の糖タンパク質自体が抗体であるかその断片を含む場合、アフィニティ樹脂としてプロテインAまたはGを使用することができる。関心対象の糖タンパク質または糖脂質に特異的に結合する色素およびその他の分子も、適している。
好ましくは、アクセプター糖類が全長糖タンパク質の切断型である場合、これは、好ましくは、全長糖タンパク質の生物学的に活性な部分配列を含む。代表的な生物学的に活性な部分配列としては、酵素活性部位、レセプター結合部位、リガンド結合部位、抗体の相補性決定領域、および抗原の抗原性領域が含まれるが、これらに限定されない。
VIII.ガラクトシル化生成物の産生
in vitro反応混合物中でまたはin vivo反応によって、例えば、CgtBポリペプチドをコードするヌクレオチドを含む組換え微生物の発酵性増殖によってガラクトシル化生成物を作製するために、CgtBポリペプチドを用いることができる。
A.in vitro反応
in vitro反応混合物中でガラクトシル化生成物を作製するために、CgtBポリペプチドを用いることができる。in vitro反応混合物は、CgtBポリペプチド、部分精製CgtBポリペプチド、または精製CgtBポリペプチド、ならびに、ドナー基質 アクセプター基質、および適切な反応緩衝液を含む、透過処理済み微生物を含み得る。invitro反応に関しては、CgtBポリペプチドなどの組換えグリコシルトランスフェラーゼタンパク質、アクセプター基質、ドナー基質、およびその他の反応混合物成分を、水性反応培地中での混合によって組み合わせる。所望のガラクトシル化生成物に応じて、付加的なグリコシルトランスフェラーゼをCgtBポリペプチドと組み合わせて用いることができる。培地は一般に、約5〜約8.5のpH値を有する。培地の選択は、培地がpH値を所望のレベルで維持できる能力に基づく。したがって、いくつかの実施形態において、培地は約7.5のpH値に緩衝されている。緩衝液が使用されない場合、使用される特定のガラクトシルトランスフェラーゼに応じて、培地のpHは、約5〜8.5に維持されるべきである。CgtBポリペプチドについては、pH範囲を約7.0〜8.0に維持することが好ましい。シアリルトランスフェラーゼについては、範囲は、好ましくは約5.5〜約8.0である。
酵素量または濃度は活性単位で表されるが、これは触媒作用の初速度の尺度である。1活性単位は、所与の温度(典型的には37℃)およびpH値(典型的には7.5)において、1分間あたり生成物1μmolの形成を触媒する。従って、10単位の酵素は、温度37℃およびpH値7.5において1分間で基質10μmolが生成物10μmolに変換される触媒量の酵素である。
反応混合物は、二価の金属カチオン(Mg2+、Mn2+)を含み得る。反応培地はまた、もし必要であれば、可溶化界面活性剤(例えば、TritonまたはSDS)およびメタノールまたはエタノールのような有機溶媒を含んでもよい。酵素は、溶液中で遊離させて利用することができ、または、ポリマーのような支持体に結合させることができる。従って、反応混合物は、当初は実質的に均一であるが、いくらかの沈殿物が反応の間に形成され得る。
上記プロセスが実行される温度は、凍結温度のすぐ上から感受性の高い酵素の大部分が変性する温度までの範囲をとり得る。この温度範囲は、好ましくは約0℃〜約45℃であり、より好ましくは約20℃〜約37℃である。
このように形成された反応混合物は、グリコシル化されるべき生体分子に付着したオリゴ糖基上に存在する所望のオリゴ糖決定基を所望の高収率で得るのに十分な期間、維持される。大規模調製については、約0.5〜240時間、より典型的には約1〜36時間、反応を進行させることが多い。
グリコシルトランスフェラーゼサイクルの一部として、1回以上のグリコシルトランスフェラーゼ反応を実行できる。グリコシルトランスフェラーゼサイクルの好ましい条件および説明が記載されている。いくつかのグリコシルトランスフェラーゼサイクル(例えば、シアリルトランスフェラーゼサイクル、ガラクトシルトランスフェラーゼサイクル、およびフコシルトランスフェラーゼサイクル)が、米国特許第5,374,541号および国際公開第9425615A号に記載されている。その他のグリコシルトランスフェラーゼサイクルは、以下に記載されている:Ichikawaet al.J.Am.Chem.Soc.114:9283(1992)、Wong et al.J.Org.Chem.57:4343(1992)、DeLuca,etal.,J.Am.Chem.Soc.117:5869−5870(1995)、およびIchikawa et al.In Carbohydrates and CarbohydratePolymers.Yaltami,ed.(ATL Press,1993)。
上記のグリコシルトランスフェラーゼサイクルについて、プロセス中で使用される様々な反応物の濃度または量は、温度およびpH値などの反応条件を含む数多くの要因、ならびにグリコシル化されるべきアクセプター糖類の選択および量に依存する。グリコシル化プロセスによって触媒量の酵素の存在下での活性化ヌクレオチドの再生、活性化されたドナー糖および産生されたPPiの捕捉が可能になるので、このプロセスは、上述の化学量論的基質の濃度または量によって制限される。本発明の方法に従って使用できる反応物の濃度の上限は、そのような反応物の溶解度によって決定される。
好ましくは、アクセプターが消費されるまでグリコシル化が進行するように、活性化ヌクレオチド、リン酸ドナー、ドナー糖および酵素の濃度が選択される。以下で論じられる考察は、シアリルトランスフェラーゼの文脈ではあるものの、その他のグリコシルトランスフェラーゼサイクルにも一般に適応可能である。
それぞれの酵素は、触媒量で存在する。特定の酵素の触媒量は、該酵素の基質の濃度によって、ならびに、温度、時間およびpH値のような反応条件によって変動する。予め選択した基質濃度および反応条件下での所与の酵素についての触媒量を決定するための手段は、当業者に知られている。
B.in vivo反応
in vivo反応、例えば、CgtBポリペプチドを含む組換え微生物の発酵性増殖によってガラクトシル化生成物を作製するために、CgtBポリペプチドを用いることができる。組換え微生物の発酵性増殖は、アクセプター基質、例えばGalNAc、およびドナー基質またはドナー基質の前駆体、例えばガラクトースを含む培地の存在下で生じ得る。例えば、Priemet al.,Glycobiology 12:235−240(2002)を参照されたい。微生物がアクセプター基質およびドナー基質またはドナー基質の前駆体を吸収し、生細胞中で、アクセプター基質へのドナー基質の付加が起こる。例えば、糖輸送タンパク質を発現させることによって、アクセプター基質の摂取を促進するように微生物を改変することができる。例えば、ラクトースがアクセプター糖類である場合、LacYパーミアーゼを発現するE.coli細胞を使用することができる。アクセプター糖類の分解を低減するため、または、ドナー糖類もしくはドナー糖類の前駆体の産生を増大するために、その他の方法を用いることができる。いくつかの実施形態において、宿主微生物の操作によってガラクトシル化生成物の産生が増強される。例えば、E.coliにおいて、例えばCMP−シアレート合成酵素を欠いた宿主株(NanA−)を用いることによって、シアル酸の分解を最小限にすることができる。(いくつかのE.coli株において、CMP−シアレート合成酵素が分解酵素であることが分かっている。)また、E.coliにおいて、ラクトースが例えばアクセプター糖類であるかまたはガラクトシル化生成物合成における中間体である場合、LacZ−である宿主細胞を用いることによってラクトース分解を最小限にすることができる。
C.ガラクトシル化生成物の特性決定および単離
例えば、所望の生成物の産生が生じたことを判定することにより、または、アクセプター基質のような基質が消尽されたことを判定することにより、ガラクトシル化生成物の産生をモニターすることができる。例えば、ペーパーもしくはTLCプレートを用いるクロマトグラフィーなどの技術を用いて、または質量分析法、例えば、MALDI−TOF質量分析法により、あるいはNMR分光法により、オリゴ糖のようなガラクトシル化生成物を同定できることを当業者は認識するであろう。ガラクトシル化生成物の同定法は当業者に公知であり、例えば、すべての目的について参照により本明細書に組み込まれる米国特許第6,699,705号において、およびVarkiet al.,Preparation and Analysis of Glycoconjugates,in Current Protocols in MolecularBiology,Chapter 17(Ausubel et al.eds,1993)において見出される。
CgtBポリペプチドを用いて産生される生成物は、精製せずに使用することができる。しかしながら、標準的な周知の手法、例えば、薄層もしくは厚層クロマトグラフィー、イオン交換クロマトグラフィー、または膜濾過を、ガラクトシル化糖類の回収のために用いることができる。また、例えば、本発明の譲受人に譲受された豪州特許第735695号に記載のナノ濾過膜または逆浸透膜を利用した膜濾過を用いることができる。さらなる例として、タンパク質を除去するために、約1000〜約10,000ダルトンの分子量カットオフを膜が有する膜濾過を用いることができる。別の例として、塩を除去するために、次にナノ濾過または逆浸透を用いることができる。ナノフィルター膜は逆浸透膜の一種であり、これは、一価の塩は通過させるが、使用する膜に応じて約200〜約1000ダルトンを上回る多価塩および非荷電溶質は保持する。従って、例えば、本発明の組成物および方法によって産生されるオリゴ糖は膜内部で保持されることができ、混入塩は通過することになる。糖タンパク質ガラクトシル化生成物は、本明細書に記載のものを含む標準的なタンパク質精製手法を用いて単離または精製することができる。
C.jejuni株において見出されるリポオリゴ糖(LOS)構造は、構造的に多様であり、その多様性は、LOS遺伝子座から発現されたグリコシルトランスフェラーゼと相関している。例えば、ガラクトースは、CgtBタンパク質によってβ−1,3立体配置に付加される。ガラクトシル化オリゴ糖生成物の構造は、CgtBタンパク質の配列と同様に、種々のC.jejuni株において変わる。例えば、図1および2を参照されたい。しかしながら、様々な天然のCgtBタンパク質はすべて、β−1,3−ガラクトシルトランスフェラーゼ活性を有する。本研究により、β−1,3−ガラクトシルトランスフェラーゼ活性のために必要とされるコアCgtB構造、および修飾されたCgtBタンパク質と関連する驚くほど改善された酵素活性が同定される。
以下の例において用いられる略号は次の通りである:CE、キャピラリー電気泳動;FCHASE、6−(フルオレセイン−5−カルボキサミド)ヘキサン酸、スクシンイミジルエステル;HEPES、N−(2−ヒドロキシエチル)ピペラジン−N’−2−エタンスルホン酸;IPTG、イソプロピル−1−チオ−β−D−ガラクトピラノシド、LOS、リポオリゴ糖;LPS、リポ多糖;MES、2−(N−モルホリノ)エタンスルホン酸;PCR、ポリメラーゼ連鎖反応。
彼の報告全体を通してCgtB酵素アッセイにおいて用いられるアクセプター糖は、それらの対応するガングリオシドヘッドグループの後に命名した(lyso−GM2のケースを除き、たとえそれらがそれらのグリコン部分に存在するのみであったとしても)。従って、GA2はGalNAcβ−1,4−Galβ−1,4−Glc−FCHASEであり、GM2−FCHASEはGalNAcβ−1,4−[NeuAcα−2,3]−Galβ−1,4−Glc−FCHASEであり、lyso−GM2はGalNAcβ−1,4−[NeuAc−α−2,3]−Galβ−1,4−Glc−スフィンゴシン−FCHASEである。GD3−FCHASEはNeuAcα−2,8−NeuAcα−2,3−Galβ−1,4−Glc−FCHASEであり、GM3−FCHASEはNeuAcα−2,3−Galβ−1,4−Glc−FCHASEである。CgtB反応の生成物であるGMla−FCHASEは、Galβ−1,3−GalNAcβ−1,4−[NeuAcα−2,3]−Galβ−1,4−Glc−FCHASEである。IFNα2b[Tn]−FCHASEはIFNα2b[GalNAcα]−FCHASEであり、IFNα2b[T−Ag]−FCHASEはIFNα2b[Galβ1,3−GalNAcα]−FCHASEであり(両方の例における標識ペプチドアクセプター);IFNα2b[Tn]はIFNα2b[GalNAcα]であり、IFNα2b[T−Ag]はIFNα2b[Galβ1,3−GalNAcα]である(両方の例におけるタンパク質アクセプター)。
(実施例1)
CgtB変異体配列比較および解析
3種類の天然CgtBタンパク質が同定されており、3つのC.jejuni株由来のCgtBタンパク質:CgtBOH4384、CgtB11168、およびCgtBOH:10により表される。天然CgtBタンパク質の多重配列比較が図2Aに示してある。3つのCgtBタンパク質のいずれか2つを用いたペア比較は、それらが、全長配列にわたって54〜59%配列同一性および67〜75%配列類似性を共有することを示している(図2B)。CgtBの高度に保存されたアミノ末端ドメインは、ドナー結合ドメインであると考えられる。CgtBにおいて、このドメインは、3つの配列間の配列同一性に基づいて最初の108の位置として描かれている。いずれか2つのCgtBタンパク質間のN−末端ドメインのペア比較は、N−末端ドメインが高度に保存されており、いずれか2つのCgtBタンパク質が少なくと87%の配列同一性および少なくとも92%の配列類似性を共有していることを示す(図2B)。
CgtBタンパク質のカルボキシ−末端ドメインは、アクセプター結合ドメインであり、CgtBの位置109から末端までを含む。C−末端ドメインを用いたペア比較は、より多くの配列ダイバージェンスを明らかにしており、いずれか2つのCgtBタンパク質は、少なくとも37%の配列同一性および少なくとも54%の配列類似を共有している(図2B)。アクセプター結合ドメインにおいて観察される配列ダイバージェンスは、アクセプターLOS分子において観察される相違、例えば、それらの外部コアにおける分岐シアル酸残基の有無、と相関している。
CgtBOH4384、CgtB11168、およびCgtBOH:10の活性のために必要とされる最小のアミノ酸構造を決定するために、切断型CgtBタンパク質を発現させる核酸を構築した。
(実施例2)
構築物およびタンパク質精製
本研究において使用した細菌株およびプラスミドが表Iに列挙してある。
本研究のために使用したすべてのオリゴヌクレオチドプライマーが図5に列挙してある。増幅反応は、以前記載されたように、生成C.jejuniDNAを用いて行った(Gilbert,M.et al.,J Biol Chem.277:327−337(2002))。アンプリコンを、QIAquick PCR精製キット(QIAGENInc.,Mississauga,Ontario)を用いて精製し、NdeIおよびSalI末端(pCWori+またはpCWmalE−N中)か、EcoRIおよびSalI末端(pCWmalE−C中)を用いてクローニングした。pCWmalE−CおよびpCWmalE−Nを用いて、C−末端およびN−末端MalE融合タンパク質を作製した(malEはマルトース結合タンパク質についてコードする)。以前記載されたようにDNAシークエンス反応を実行した(GilbertM.et al.,J Biol Chem.277:327−337(2002))。C.jejuniの様々な血清型由来のcgtBのヌクレオチド配列は、Genbankにおいて入手可能である(cgtB
OH4384、cgtB
HS:10、およびcgtB
11168についてのエントリはそれぞれ、AF130984、AF400048、およびAL139077)。CgtB配列間の類似性および同一性百分率を、PairwiseBLAST(BLAST 2 Sequnces;ncbi.nlm.nih.gov/blast/bl2seq/bl2.htmlにてオンライン)を使用して決定した。
上記のように液体培地中で増殖させた細胞を、NaHEPES 20mM pH7.0、200mM NaCl、5mM β−メルカプトエタノール、1mMEDTA、10%グリセロール(緩衝液A)中に10%(w/v)で再懸濁させ、Emulsiflex(Avestin,Ottawa,Ontario)を2回通して溶解した。細胞可溶化物を、4℃で30分間、20000×gで遠心分離した(SS−34ローター)。必要に応じ、上清を緩衝液A中に希釈し、アミロース樹脂の20mLカラム(New England Biolabs,Ltd.,Pickering,Ontario)に適用した。試料適用後、カラムを2カラム容量で洗い、非結合タンパク質を溶出した。結合タンパク質を、緩衝液B(緩衝液Aに20mMマルトースを添加したもの)でカラムを洗うことにより溶出し、溶出物を2mLフラクションに収集した。溶出されたタンパク質を含有するフラクションをプールし、100容量の酢酸ナトリウム50mMpH6.0、グリセロール20%に対して4℃で一晩透析した。タンパク質定量を、BCA試薬(Pierce)を用いて行った。
(実施例3)
酵素アッセイ
オリゴ糖アクセプターおよびインターフェロンアルファ2b(IFNα2b)ペプチド(VGVTETP,成熟IFNα2bタンパク質の位置103〜109に対応)を、以前に記載されたように、FCHASEで標識した(Wakarchuk,W.etal.,J Biol Chem.271:19166−19173(1996))。IFNα2b−FCHASEは、アセトニトリルの勾配(4カラム容量にわたり0〜100%)を有する10mM酢酸アンモニウムpH5.5中でのPRP−1カラム(10x250mm,HammiltonCompany,Reno,NV)を用いた逆相クロマトグラフィーにより精製した。CgtB活性アッセイを、細胞溶解物中で、または精製酵素を使用して、50mM MESpH6.0、0.5mMのFCHASE−アクセプター(特に指定のない限り)、10mM MnCl2、10mM DTT、1mM UDP−Ga中で、37℃で5〜30分間行った。すべての反応を、10μLの50%アセトニトリル、10mMEDTAおよび1%SDSの添加により停止し、H2Oで希釈し、10〜15μMの最終濃度のFCHASE−標識化合物を得に。レーザーモジュール488(BeckmanCoulter,CA)を備えたP/ACE MDQキャピラ電気泳動システムを使用したこと以外は、以前に記載されたように(Wakarchuk,W.W.et al.,MethodsMol Biol.213:263−274(2003))、試料をキャピラリー電気泳動によって分析した。反応の定量化を、MDQ32Karatソフトウェアを用いたトレースピークの積分により実行した。
(実施例4)
IFNα2b−FCHASEおよびIFNα2bのグリコシル化
IFNα2bタンパク質をCell Sciences(Canton,MA)から購した。IFNα2b−FCHASEおよびIFNα2bを、GALNT2−MBP(NEOSETechnologiesからの寄贈)を用いてIFNα2b[Tn]−FCHASEおよびIFNα2b[Tn]に変換した(DeFrees,S.et al.Glycobiology.16:833−843(2006))。IFNα2b[Tn]−FCHASEを、上記のように逆相クロマトグラフィーによって精製した。IFNα2b[Tn]を、NH4OAcpH4.5の0.01〜1M勾配を用いたMini S4.6/5.0カラム(GE Healthcare Bio−Sciences,Baie d’Urfe,Quebec)を使用して陽イオン交換クロマトグラフィーによって精製した。
精製IFNα2b[Tn]−FCHASE 500μg(360ナノモル)を、15mUの精製CJL−136、50mM MESpH6.0、10mM MnCl2、1mM DTTおよび2mM UDP−Galを含有する反応中でIFNα2b[T−Ag]−FCHASEに変換した。反応を30分後に停止し、SepPak Cl8カラム(Waters Corporation,Milford,MA)上で浄化し、IFNα2b[T−Ag]−FCHASEを、上記のように逆相クロマトグラフィーにより精製した。
IFNα2b[Tn]を、50mM NaOAc pH6.0中の2.5mgのIFNα2b[Tn]、10mM MnCl2、1mMDTT、2mM UDP−Gal、50mM NaClおよび5mUの精製CJL−136を含有する1mL反応中でIFNα2b[T−Ag]に変換した。
反応を、室温で一晩放置した。翌日、反応に、1mM UDP−Galおよび2.5mUの精製CJL−136を補った。新たに合成されたIFNα2b[T−Ag]を、上記のように陽イオン交換クロマトグラフィーによって精製した。
(実施例5)
質量分析
Prince CEシステム(Prince Technologies,Emmen, The Netherlands)を、4000QTRAP質量分析器(AppliedBiosystems/MDS Sciex,Streetsville,Canada)に連結した。シース液(イソプロパノール−メタノール、2:1)を1.0μL/分の流量で送出した。分離は、脱イオン水中の酢酸アンモニウム15mM、pH9.0を用いて、長さ約90cmの露出型石英ガラスキャピラリー上で得た。5kVのエレクトロスプレーイオン化電圧を、陽イオンモードに使用した。パルス窒素レーザー(337nm)を備えたVoyager−DESTR質量分析器(Applied Biosystems,Foster City,CA)上で、ポジティブモードで加速電圧として20kVの電圧を用いてMALDI−TOF質量スペクトルを取得した。
(実施例6)
CgtB変異体のアクセプター選好性
各全長CgtBタンパク質を、E.coli由来のMalEタンパク質とのN−末端融合物として発現させ(表I)、精製した。次に、3つの精製酵素を、それらのアクセプター選好性を調べるために、合成アクセプターGalNAcα−、GalNAcβ−、GM21−、lyso−GM21−、およびGA21−FCHASEでアッセイした(表II)。このデータは、様々なアクセプターに関する各CgtB変異体の活性のスクリーニングを表す。表IIのデータは、相対活性で呈示されており、GM2−FCHASEに関して測定した活性が、CJL−10(CgtBOH4384(FL、N−末端MalE))およびCJL−20(CgtB11168(FL、N−末端MalE))についての基準として用いられたのに対し、GA2−FCHASEに関する活性は、CJL−29(CgtBOH:10(FL、N−末端MalE))についての基準であった。各CgtBタンパク質についての基準アクセプターは、対応する株のLOSの構造との構造的類似性に基づいて選ばれた(図1)。
活性傾向は、CgtBOH4384(FL、N−末端MalE)およびCgtB11168(FL、N−末端MalE)が、非脂質含有アクセプターGM2−FCHASEと比較して、lyso−GM2−FCHASEアクセプターと最も活性的であることを示した。どちらの単糖アクセプターとの活性も、四糖アクセプターGM2−FCHASEとの活性よりも低かった(表II)。CgtBOH:10(FL、N−末端MalE)の場合、非シアリル化アクセプターGA2−FCHASEとのその活性は、どのシアリル化アクセプターまたは単糖アクセプターとの活性よりも有意に高かった(表II)。
合わせて考えると、これらのデータは、3つのCgtBタンパク質が異なるアクセプター選好性を有することを示す。特に、違いは、シアリル化および非シアリル化アクセプター間(GM2−、lyso−GM2−対 GMA2−FCHASE)で観察された差は、アクセプターのシアリル化が、アクセプター選好性における重要な決定因子であることを示している。これは、in vivoの各株の内部コアLOSのシアリル化状態と完全に相関する。lyso−GM2−FCHASEとのCgtB
OH4384(FL、N−末端MalE)およびCgtB
11168(FL、N−末端MalE)のより高い活性は、天然LOSアクセプターの脂質A部分を模倣するアクセプターのスフィンゴシン脂質アグリコンに帰せられる。
(実施例7)
CgtB酵素改良:カルボキシ末端欠失の構築
E.coliにおける未修飾cgtBの発現は、CgtBタンパク質の目に見える過剰産生をもたらさなかった。タンパク質は、膜と完全に会合していた(GilbertM.et al.,J Biol Chem.275:3896−3906(2000);Linton,D.et al.,Mol Microbiol.37:501−14(2000))。他の細菌グリコシルトランスフェラーゼにより、C−末端残基のショートストレッチの除去が、E.coliにおける組換え酵素の可溶性の増加をもたらし得ることが示されている(Wakarchuk,W.W.etal.,Protein Eng.11:295−302(1998);Chiu,C.P.et al.,Nat Struct Mol Biol.11:163−170(2004))。10、20、および30個のアミノ酸がCgtBOH4384およびCgtB11168タンパク質のC末端から切断されたが、これらの修飾タンパク質は、親構築物よりも少しも可溶性ではなく、ずっと高いレベルで発現もされなかった(データは示してない)。これらの融合タンパク質がそもそも多少可溶性であったので、切断体は次に、N−末端MalE−CgtB融合タンパク質に組み込まれた。切断体は、これらの融合タンパク質の可溶性をあまり改善せず、実際、より長い欠失は、活性にとり有害であった(表III)。
CgtB
OH4384およびCgtB
11168タンパク質双方からの10および20個のアミノ酸残基のC−末端切断は、予備的精製において十分に精製せず、それ以上追求されなかった。30個のアミノ酸残基欠失は、CgtB
OH4384およびCgtB
11168タンパク質双方の活性にとって有害であったが、これらのタンパク質は若干より可溶性なので、精製および特性決定できるかもしれない。N−末端においてMalEに融合された全長CgtBタンパク質は、N−末端においてMalEに融合された対応する切断型CgtBタンパク質と比較して、試験されたすべてのアクセプターとより良好な活性を示し、これは、活性において約2倍から約15倍までの範囲であった(表III)
CgtB
OH:10によって、他の2つの切断があまり活性的ではなかったので、20個のアミノ酸切断のみが調べられた。この場合、切断後の活性減少は、GalNAcのα−アノマーに関してのみ見られるが、ベータ−アノマーに関する活性は、実際には若干増大する。「最良の」アクセプターGA2−FCHASEに関する活性も、他の酵素/アクセプターの組み合わせについて観察されたように、タンパク質の切断後に減少した。
(実施例8)
融合順序の反転およびCgtB特異的活性に対する影響
以前の例からのデータは、CgtBのカルボキシ末端が、アクセプター相互作用にとって重要であり、切断に対して敏感であることを示した。融合の反転を、MalEを切断型CgtBタンパク質のC−末端に融合させることにより評価した。これらの融合物を、以前に記載されたように構築し、精製し、アッセイした。ひとたびこれらの切断型CgtB−MalEC−末端融合物が生成されると、それらを、他のCgtB構築物との並列比較において使用し、どのタンパク質が最も活性的であり、どのアクセプターに対して活性があるかを評価した(表III)。意外にも、反転された遺伝子順序、すなわち、N−末端MalE融合物ではなくC−末端MalE融合物は、以前に構築されたCgtB融合物および切断体よりもずっと活性があるCgtBタンパク質を産生した。例として、アクセプターとして四糖GM2−FCHASEを用いると、CgtBOH4384(Δ30、C−末端MalE)タンパク質は、CgtBOH4384(FL、N−末端MalE)タンパク質より11倍もの増大を示す。この改善は、ヒトタンパク質(以下を参照されたい)におけるコア1O−グリコシル化を産生するためのモデル系である核糖ペプチドアクセプターが、今や効果的に修飾できるかもしれないという点でも重要であった。
それほど顕著ではないが、CgtB−C−末端−MalE融合物からの改善された活性の驚くべき傾向は、C.jejuni株NCTC11168およびOH:10についても見られた(表III)。いくつかの違いが見られ;1つの著しい例外は、GalNAcのα−アノマーに対するCgtB11168(Δ30、C−末端MalE)の活性が不変であることである。
CgtBOH4384(Δ30、C−末端MalE)は、試験したすべてのCgtBタンパク質の中で最高の特異的活性を有していた(表III)。従って、その動力学的パラメータを、単糖アクセプターGalNAcα−FCHASEおよびGalNAcβ−FCHASEを用い、そのドナー糖UDP−Galについて調べた(表IV)。
N−末端MalE−CgtBを用いて動力学的パラメータを得ようとする試みは、単糖アクセプターの低い溶解度によって妨げられてきており、アクセプター飽和の条件に近づくことは決してできないことを意味する(データは示されない)。2つ単糖アクセプターの溶解度制限のため、アッセイは飽和条件下で実行されず、従って、表IVに報告される値は、実際の動力学的パラメータの推定値である。GalNacα−FCHASEについてK
m(app)値は1.68mMであり、GalNAcβ−FCHASEについての値は3.18mMである。GalNAcβ−FCHASEについてのK
m(app)、V
max、およびk
cat値は、GalNAcα−FCHASEについての値より2.1倍高い。しかしながら、特異性定数、k
cat/K
mは、これら2つのアクセプターについて非常に類似しており、これは、CgtB
OH4384(Δ30、C−末端MalE)が、これら2つのアノマーを強く区別しないことを示し、これにより、このenyzmeは、コア1型二糖を産生するための非常によい触媒になる。
(実施例9)
IFNα2b[Tn]−FCHASEペプチドに関する活性
GalNAcα−FCHASEについて測定された最も高い活性は、CgtBOH4384(Δ30、C−末端MalE)の活性であった(531.5mU/mg、表III)。従って、CgtBOH4384(Δ30、C−末端MalE)は、ペプチドおよびタンパク質上でO−結合グリカンを作製するツールとして評価された。N−末端MalECgtBOH4384構成物(全長およびΔ30)も、比較のため試験した。キャピラリー電気泳動の30分後のIFNα2b[Tn]−FCHASEのガラクトシル化の分析により、91.9%の材料がIFNα2b[T−Ag]−FCHASEに変換されており、4.4%の望ましくない副生成物(それぞれ、4.3%および0.1%のIFNα2b[Gal−T−Ag]−FCHASEおよびIFNα2b[Gal−Gal−T−Ag]−FCHASE)もあったことが明らかになった。これらの望ましくないポリ−ガラクトシル化生成物は、より単純な単糖アクセプターに関してはずと大きい割合で見られ、GM2−FCHASEアクセプターではより小さい割合で見られた。反応条件は、反応液中のドナーの濃度を2mMより低く保持することによってペプチドアクセプターのポリ−ガラクトシル化を最小限にするように最適化した。ポリガラクトシル化のレベルは可変であった:ペプチドアクセプターに関して10%を超える副生成物が観察されることは決してなかったのに対して、単糖アクセプターでは、30%を超えるポリガラクトシル化生成物が容易に得られた。
反応生成物を、キャピラリー電気泳動質量分析法(CE−MS;図3A〜B)により分析した。IFNα2b[Tn]−FCHASEのCE−MSスペクトル(図3A)は、m/z1377.2に1価プロトン化分子イオンを、およびm/z 689.4に2化プロトン化イオンを含んでいる。ナトリウムおよびカリウム付加物を伴う2価プロトン化イオンが、m/z700.3および708.3においてそれぞれ検出された。加えて、そのカルボキシ−末端プロリル残基を失っている全長IFNα2b−FCHASEおよびIFNα2b−FCHASEに対応するイオンも、m/z1174.1および1059.0においてそれぞれ観察された。IFNα2b[T−Ag]−FCHASEのCE−MSスペクトルにおける優勢な化学種は、m/z 1538.9における1価帯電イオン、m/z778.7に対応するアンモニウム付加物を伴うm/z 770.0における2価プロトン化イオンであった(図3B)。予想されるように、IFNα2b[T−Ag]−FCHASEの分子量は、IFNα2b[Tn]−FCHASEの分子量よりも162ダルトン高く、従って、CgtBOH4384(Δ30、C−末端MalE)によるペプチドのガラクトシル化が確認される。
(実施例10)
タンパク質IFNα2b[Tn]に対する活性
IFNα2bタンパク質をin vitroでグリコシル化することが可能である(DeFrees,S.et al.Glycobiology.16:833−843(2006))。従って、改善されたCgtB(CJL−136)を、このタンパク質上にコア1二糖を作製することについて評価した。IFNα2bのMALDIスペクトル(図4A)およびIFNα2b[Tn]のMALDIスペクトル(図4B)は、m/z19293および19512にピークを示しており、これらのピークは、IFNα2bおよび対応するグリコシル化生成物の予想分子量と合致する。CgtBOH4384(Δ30、C−末端MalE)によるIFNα2b[Tn]のガラクトシル化から生成されたIFNα2b[T−Ag]のMALDIスペクトル(図4C)は、19665のm/zを有する主要な化学種を示しており、これは、図4Bにおける主ピーク比較した場合、付加的なヘキソシル残基の存在と合致する。m/z19665における化学種の存在は、IFNα2b[Tn]タンパク質がCJL−136によってガラクトシル化され得るという証拠である。非標識基質を使用した場合、検出限界内で、ポリ−ガラクトシル化生成物は産生されなかった。
(実施例11)
CgtBβ−1,3−ガラクトシルトランスフェラーゼ生成物のポリ−ガラクトシル化
いくつかの反応条件の下で、CgtBOH4384は、第2のGal残基を、オリゴ糖基質に、例えば、GM2−誘導体から合成されたGM1a−誘導体に付加する。第2のGalの付加の程度は制御が困難であるが、長いインキュベーション時間および大過剰のドナーの存在においてより高くなる傾向がある。CgtBOH4384は、CgtB11168およびCgtBHS:10よりずっと活性なので、第2のGalの付加が、CgtBOH4384についてより明白であったか、またはCgTB11168およびCgtBHS:10の場合に本当に存在していなかったかは不明確であった。C−末端にMalEを有する切断型CgtB構築物を用いて、60分間のインキュベーション後に約90%のGM1a(CgtBHS:10のためのGA2)を得るように反応を設定した(表5参照)。反応混合物は、アクセプター(1mM)の3倍過剰のドナー(3mM)を含有していた。CgtB11168(Δ30、C−末端MalE)およびCgtBHS:10(Δ20、C−末端MalE)の場合、60分間のインキュベーション後および一晩のインキュベーション後、ジ−Gal生成物の痕跡しかなかった。GM2およびGM1a変換収率が80%以上になるとすぐに、ジ−Gal生成物は、CgtBOH4384(Δ30、C−末端MalE)について明白である。ジ−Gal生成物は、長時間にわたるインキュベーションにおいて、約25%の平坦域に達した。
(実施例12)
in vitroにおけるヒト成長ホルモンのガラクトシル化
MalE−ヒト成長ホルモン(MalE−hGH)タンパク質を、E.coli中で発現させた。ヒトGalNAcT2も、E.coli中で発現させ、invitroでMalE−hGHタンパク質をグリコシル化するために用いた。グルコシル化MalE−hGHタンパク質を濃縮し、50mM NaOAc(pH6.0)+50mMNaClを含有する反応混合物に添加し、10mM MnCl2(新たに作製したストックから)、1mM DTT、2.0mM UDP−Galおよび6ミリ−単位のCgtB
11168(Δ30、C−末端MalE)を添加し、この反応を室温(21℃)で23時間インキュベートした。A280データから、存在する融合タンパク質の量は26nmoleであると推定された。試料を、SDS−PAGE分離を用い、続いてcomassie染色およびT−Agを認識するピーナッツ凝集素によるウェスタンブロットにより分析した。約1.0μgの各調製物を、クーマシー染色用ゲル上にロードし、約0.5μgをPNA−ブロット用に使用した。4℃で4ヶ月間保持したMalE−hGHの調製物1μg(A)も、それらの保存条件下での融合タンパク質の安定性を決定するために、ゲル上にロードした。結果は、図6、レーンA〜Dに示してある。レーンBおよびCは、それぞれ非グリコシル化MalE−hGHおよび[Tn]−MalE−hGHである。([Tn]−MalE−hGHは、ヒトGalNAcT2の作用により形成される。)レーンDは、CgtB
11168(Δ30、C−末端MalE)反応の生成物である。PNAブロット後のレーンDにおける増大した染色は、CgtB
11168(Δ30、C−末端MalE)タンパク質が、invitroでMalE−hGHタンパク質をガラクトシル化したことを示す。
本明細書および添付の特許請求の範囲において使用されるように、単数形「a」、「and」、および「the」は、特に文脈により明確に指示されない限り、複数の指示対象を含むことが留意されなければならない。従って、例えば、「1つの核酸」への言及は、複数のそのような核酸を含み、「そのポリペプチド」への言及は、1つまたは複数のポリペプチドおよび当業者に公知のその同等物への言及が含まれ、その他も同様である。
上記の発明は、理解を明確にするために説明および例を用いてある程度詳細に記載されてきたが、本発明の教示に照らして、添付の特許請求の範囲の趣旨や範囲から逸脱することなく特定の変更および修飾を加えることが可能であることは、当業者であれば容易に理解できよう。
本明細書において論じられた刊行物は、本出願の出願日以前のそれらの開示についてのみ提供されるものである。本明細書におけるいかなる記載も、先行発明により本発明がそのような刊行物に先行する権利を有さないことの承認として解釈されるべきでない。さらに、提供された公開日は実際の公開の日付と異なることがあり、これは個別に確認する必要があり得る。全ての引用は、参照により本明細書に組み込まれる。