JP2009095322A - 安定な変異型タンパク質の製造方法 - Google Patents

安定な変異型タンパク質の製造方法 Download PDF

Info

Publication number
JP2009095322A
JP2009095322A JP2007272442A JP2007272442A JP2009095322A JP 2009095322 A JP2009095322 A JP 2009095322A JP 2007272442 A JP2007272442 A JP 2007272442A JP 2007272442 A JP2007272442 A JP 2007272442A JP 2009095322 A JP2009095322 A JP 2009095322A
Authority
JP
Japan
Prior art keywords
amino acid
acid residue
protein
site
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007272442A
Other languages
English (en)
Other versions
JP5382675B2 (ja
Inventor
Masaya Honda
真也 本田
Yoshito Sawada
義人 澤田
Hiroyuki Matsumaru
裕之 松丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2007272442A priority Critical patent/JP5382675B2/ja
Priority to PCT/JP2008/068861 priority patent/WO2009051226A1/ja
Publication of JP2009095322A publication Critical patent/JP2009095322A/ja
Application granted granted Critical
Publication of JP5382675B2 publication Critical patent/JP5382675B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

【課題】タンパク質の本来の機能を損なわず、かつ、該タンパク質に比べて、例えば、熱安定性、変性剤に対する化学的安定性、および蛋白分解酵素に対する耐性等のタンパク質分子の安定性を向上させるための普遍的な方法を開発し、有用な変異型タンパク質を提供する。
【解決手段】タンパク質の立体構造座標データを用いて、該タンパク質のアミノ酸配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメント中のアミノ酸残基を変異対象部位として選定し、該変異対象部位を置換する他のアミノ酸残基として、該部分セグメントのコンフォメーションと同様乃至類似のコンフォメーションにおいて出現頻度の高いアミノ酸残基を選定して、上記変異対象部位を置換し、有用な変異型タンパク質を得る。
【選択図】なし

Description

本発明は、任意のタンパク質の立体構造座標データを用いて、該タンパク質より安定な新規な変異型タンパク質を製造する方法に関するものである。
各種のゲノムプロジェクトの成果として、自然界に存在する野生型タンパク質のアミノ酸配列に関する莫大な情報を利用することが現在可能になっている。また、遺伝子工学を用いて、任意のアミノ酸配列を有するタンパク質を組替えタンパク質として生産することも可能になっている。したがって、野生型タンパク質のアミノ酸配列の一部のアミノ酸残基が置換された人工的なアミノ酸配列を有する変異型タンパク質を組替えタンパク質として生産することも現在は可能である。
すなわち、遺伝子工学技術は任意のアミノ酸の置換を可能にし、タンパク質分子の構造・機能に果たす各位置のアミノ酸残基の役割に関する膨大な知識を我々にもたらし、この知識の理解と整理を基盤として、いくつかの研究が、現に、計画されたアミノ酸残基の置換により天然タンパク質の性質をより好ましい方向に合目的的に改変することが可能であることを示してきた。たとえば、古くはMatthewsらによる一連のT4リゾチームの安定化研究がある(非特許文献1参照)。また、自然界でまれに存在する左巻きらせん型構造を形成するタンパク質に対して、グリシン残基またはアスパラギン残基への置換が該タンパク質を安定化するとの発明がある(特許文献1)。しかし、多くの場合、安定性の向上は機能の低下をもたらす、または、機能の向上は安定性の低下をもたらすなど、改変には好まざる影響が伴うことが一般的で、複数の要求を同時に満足することは容易ではない。また、これまでの多くの研究は、特定の構造のみに対する方法で、任意の構造に対して有効な汎用な方法とはなっていない。
一方で、タンパク質の3次元的な立体構造に関しても急速に解析が進展しつつあり、主に自然界に存在する野生型タンパク質およびその組替えタンパク質を対象とした4万を超える立体構造座標データが公共データベースから入手可能な状況になっており、この座標データのより有効で高度な活用も望まれている。
特開平05-308963号公報 Matsumura M., Signor G., and Matthews B. W. (1987)Substantial increase of protein stability by multiple disulphide bonds Nature, 342, 291-293.
本発明の課題は、このような任意のタンパク質の立体構造座標データを利用することにより、該タンパク質の本来の機能を損なわず、かつ、該タンパク質に比べて、例えば、熱安定性、変性剤に対する化学的安定性、および蛋白分解酵素に対する耐性等のタンパク質分子の安定性を向上させるための普遍的な方法を開発し、有用な変異型タンパク質を提供することにある。
本発明者は上記課題を解決するため、鋭意研究の結果、以下の(a)〜(g)の知見を獲得し、さらに該知見を発展させ、タンパク質の立体構造座標データを用いることで、機能に与える不利益を最小限に留めつつ任意のタンパク質の安定性を高確度で向上させる方法を開発し、本発明を完成するに至ったものである。
(a)タンパク質分子には、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントが存在する。
(b)配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメント内に変異箇所を設定することで、タンパク質分子全体に及ぼす不測の不利益を抑えつつタンパク質の構造安定性を向上させることが期待できる。
(c)タンパク質分子には、配列上遠方のアミノ酸残基との相互作用が強いアミノ酸残基が存在する。
(d)配列上遠方のアミノ酸残基との相互作用が強いアミノ酸残基を変異箇所から除外することで、タンパク質分子全体に及ぼす不測の不利益を抑えることが期待できる。
(e)タンパク質分子の主鎖のコンフォメーションを形成する蓋然性が高いアミノ酸配列は、多数のタンパク質の局所構造の統計解析により推定することができる。
(f)多数のタンパク質の局所構造の統計解析により導かれた人工的なアミノ酸配列は、特定の主鎖のコンフォメーションを自律的に形成する。
(g)アミノ酸残基の置換において側鎖のサイズが大きく変わる場合は、タンパク質分子におけるアミノ酸残基の埋もれ度を評価することで、その影響を予想することができる。
即ち、本発明は、以下のとおりのものである。
1.タンパク質の立体構造座標データを用いて、該タンパク質のアミノ酸配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントを探索し、該部分セグメントを変異導入領域として選定することを特徴とする、タンパク質の変位導入領域の選定方法。

2.変異導入領域が、以下の数式(1)、(2)及び(3)に基づき算出された局所コンタクト指数(Iloc)が、正の値を示すアミノ酸残基の連続する領域から選出されることを特徴とする、上記1に記載のタンパク質の変異導入領域の選定方法。
上記数式(1)中、ni,jはタンパク質中のアミノ酸残基iと同アミノ酸残基jの間のコンタクト原子数 (i≠j)、Nはタンパク質分子の鎖長を表し、Cp,qはタンパク質分子内の水素原子を除く重原子pと重原子qの間のコンタクト数を表す。Cp,qは2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数を表し、dは0.3〜1.2 nmである。
上記数式(2)中、Dloc kはタンパク質のk番目のアミノ酸残基の局所コンタクト数密度を表し、wはk番目のアミノ酸残基についての配列上近傍の範囲を規定するウィンドウ幅を表し、wLはk番目のアミノ酸残基の左側のウィンドウ幅、wRはk番目のアミノ酸残基の右側ウィンドウ幅をそれぞれ表す。wL及びwRはそれぞれ1〜15の整数である。
上記数式(3)中、Iloc kはタンパク質のk番目のアミノ酸残基の局所コンタクト指数を表し、μD loc及びσD locは、それぞれ以下の式で表され、μD locはタンパク質の全アミノ酸残基の局所コンタクト数密度(Dloc)の平均値、σD locはタンパク質の全アミノ酸残基の局所コンタクト数密度(Dloc)の標準偏差を表す。

3.タンパク質の立体構造座標データを用いて、該タンパク質のアミノ酸配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を探索し、探索されたアミノ酸残基の中から変異対象部位のアミノ酸残基を選定することを特徴とする、タンパク質中の変異対象部位の選定方法。

4.変異対象部位のアミノ酸残基が、以下の数式(4)及び(5)に基づき算出される非局所コンタクト指数(Inl)が少なくとも0.1以上であるアミノ酸残基から選定されることを特徴とする、上記3に記載のタンパク質中の変異対象部位の選定方法。
上記数式(4)中、Nnl i はi番目のアミノ酸残基の非局所コンタクト原子数、Nはタンパク質分子の鎖長を表し、C’p’,qはアミノ酸残基iの側鎖の重原子p’とアミノ酸残基jの重原子qとの間のコンタクト数を表し、wLとwRは上記数式(2)で示したのと同様である。C'p,qは2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数を表し、dは上記数式(1)で示したのと同様である。
上記数式(5)中、Inl i はi番目のアミノ酸残基の非局所コンタクト指数、Nnl i は上記数式(4)で示したのと同様であり、αは任意の定数を表す。

5.変異対象部位のアミノ酸残基が、以下の数式(6)で算出される変異適性指数(IM)が少なくとも0.1以上であるアミノ酸残基から選出されることを特徴とする、上記3に記載のタンパク質中の変異対象部位の選定方法。
上記数式(6)中、IM i はi番目のアミノ酸残基の変異適性指数を示し、Iloc iはタンパク質のi番目のアミノ酸残基の局所コンタクト指数を表しInl i はi番目のアミノ酸残基の非局所コンタクト指数を表す。

6.タンパク質の変異対象部位のアミノ酸残基を置換する他のアミノ酸残基を選定する方法であって、該タンパク質の立体構造座標データを用いて、変異対象部位を含む部分セグメントの主鎖のコンフォメーションを特定し、該特定されたコンフォメーションを安定に形成するアミノ酸配列を決定し、該決定されたアミノ酸配列における上記変異対象部位と対応する位置の各アミノ酸残基を上記変異対象部位のアミノ酸残基を置換する他のアミノ酸残基として選定することを特徴とする、上記置換する他のアミノ酸残基の選定方法。

7.タンパク質の変異対象部位を含む部分セグメントの主鎖のコンフォメーションと同様あるいは類似するコンフォメーションを探索し、探索されたコンフォメーションを形成するアミノ酸配列における上記変異対象部位と対応する位置の各アミノ酸残基の中から、出現頻度の高いアミノ酸残基を上記変異対象部位のアミノ酸残基として選定することを特徴とする、請求項6に記載の置換する他のアミノ酸残基の選定方法。

8.タンパク質の変異対象部位のアミノ酸残基が、上記1または2に記載の変異導入領域中のアミノ酸残基から選定されるか、あるいは上記3〜5に記載のいずれかの方法により選定されたものであることを特徴とする、上記6または7に記載の置換する他のアミノ酸残基の選定方法。

9.タンパク質の変異対象部位を含む部分セグメントの主鎖2面角をタンパク質局所構造データベースProSegの検索ウィンドウに入力し、得られた位置特異的スコア行列(PSSM)のスコアに基づき、以下の数式(7)から算出される交換の好ましさ(p)を算出し、交換の好ましさ(p)が1.0以上であるアミノ酸残基を置換する他のアミノ酸残基として選定することを特徴とする、上記6〜8に記載の置換する他のアミノ酸残基の選定方法。
上記数式(7)中、pkは変位対象部位kのアミノ酸残基の交換の好ましさを表し、sPSSM k(original)は変異対象部位kの置換前のアミノ酸残基のスコア、sPSSM k(candidate)は変異対象部位kを置換する他のアミノ酸残基のスコアを表す。

10.以下の式(8)で算出される変異対象部位のアミノ酸残基の露出表面積比Rが、0.3以上になることを条件として、変異対象部位のアミノ酸残基の側鎖サイズより大きくなる側鎖サイズのアミノ酸残基を、置換する他のアミノ酸残基として選択することを特徴とする、上記6〜9のいずれかに記載の置換する他のアミノ酸残基の選定方法。
式8中、Riは変異対象部位iのアミノ酸残基の露出表面積比を表し、ASAFOLD,SIDE(i)はi番目のアミノ酸残基の側鎖の天然状態における露出表面積、ASAUNFOLD,SIDE(i)は変異対象部位iのアミノ酸残基の側鎖の変性状態における露出表面積をそれぞれ表す。

11.タンパク質の変異対象部位のアミノ酸残基を、上記1または2に記載の変異導入領域中のアミノ酸残基から選定するか、あるいは上記3〜5に記載のいずれかの方法により選定し、該選定された変異対象部位のアミノ酸残基を、上記6〜10のいずれかに記載の方法により選定された、他のアミノ酸残基により置換することを特徴とする、変異型タンパク質の製造方法。

12.上記11に記載の方法により得られた変異型タンパク質。

13.以下の(a)〜(e)の変異を1以上有する変異型プロテインGのB1ドメインであることを特徴とする上記12に記載の変異型タンパク質。
(a)Asp36Glu
(b)Asn37Leu
(c)Asp47Pro
(d)Ala48Lys
(e)Ala48Glu

14.上記12または13の記載の変異型タンパク質をコードする核酸。

15.上記14の核酸を含有する組換えベクター。

16.上記14の核酸または上記15の組換えベクターを含む形質転換体。
本発明のタンパク質の変異手法は、タンパク質の種類によらず適用でき、広く汎用性を有する。
この手法を用いることにより、タンパク質の本来の機能を損なうことなく、有用な性質、特にタンパク質の変性、失活要因に対抗する安定性を付加することができる。事実、この手法を連鎖球菌由来のタンパク質であるプロテインGの細胞膜外ドメインに適応して、3種の変異型タンパク質を得たが、得られたすべての変異型タンパク質において、野生型のプロテインG細胞膜外ドメインに比べ、熱安定性、変性剤に対する化学的安定性、および蛋白分解酵素に対する耐性が共に向上した。加えて、プロテインGの細胞膜外ドメインが本来有する抗体(免疫グロブリンG)結合活性は、3種の変異型タンパク質のすべてにおいて野生型のプロテインG細胞膜外ドメインと同等であった。これより、現在市場に流通している多くのプロテインG細胞膜外ドメイン含有製品において、野生型と代替することにより、製品の長期保存や長期使用に伴う機能劣化の低減、安定性向上に伴う製品の利用条件や対象範囲の拡大、製品の保存、操作および管理の容易化が期待できる。
一方、本発明の手法は、タンパク質分子の局所的性質に着目するところに特徴を有するが、このことは、本発明が、特定の立体構造のタンパク質または特定の機能のタンパク質に限られることなく、立体構造座標データが利用可能なすべてのタンパク質に適用可能であることを意味している。上記変異型プロテインGは、本発明の手法の有効性を実証するものであり、本発明によれば、安定で有用な変異型タンパク質の製造が、プロテインG細胞膜外ドメインにとどまることなく、様々なタンパク質について可能になり、医療・農業・バイオテクノロジー分野を始めとするタンパク質を利用するあらゆる産業分野の発展に寄与するところが大きい。
以下、本発明を詳細に説明する。
本発明は、タンパク質本来の機能を損なうことなく、有用な性質、特にタンパク質の安定性を向上させた変異タンパク質を得るための方法及び、これを用いて得られた有用な変異タンパク質に関するものであり、該方法は、変異対象タンパク質における変異導入部位を選定し、該変異導入部位のアミノ酸残基を他のアミノ酸残基に置換するプロセスを含み、変異導入部位の選定は、以下のプロセスA、B、またはCを含む。図1にその好ましいフローを示す。
1.変異導入部位の選定
〔プロセスA〕
タンパク質の立体構造座標データを用いて、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントを探索するプロセス。
このプロセスにおいて使用するタンパク質の立体構造座標データは、例えば、国際的なタンパク質立体構造データベースであるProtein Data Bankよりダウンロードすることにより取得でき、また、タンパク質のX線結晶解析法や核磁気共鳴測定法などの実験的手法を利用して決定することも、あるいはホモロジーモデリングなどの情報論的手法を利用して予測することもできる。
次に、変異導入対象とするタンパク質の立体構造座標データを用いて、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントを探索し、該部分セグメントを変異導入領域として選定する。好ましくは、以下に示す方法で決定する。即ち、以下の数式(1)、(2)及び(3)で定義されるコンタクト原子数n、局所コンタクト数密度Dloc、局所コンタクト指数Ilocを算出する。
式(1)中、ni,jは残基iと残基jの間のコンタクト原子数(i≠j)、Nはタンパク質分子(またはサブユニット)の鎖長を表す。Cp,qはタンパク質分子内の水素原子を除く重原子pと重原子qの間のコンタクト数で、2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数である。dは0.3〜1.2 nm、好ましくは0.4〜0.7nm、さらに好ましくは0.5nmとする。
上記式(2)中、Dloc kはタンパク質のK番目のアミノ酸残基の局所コンタクト数密度を表す。
wはk番目のアミノ酸残基の配列上近傍の範囲を規定するウィンドウ幅を表し、wLはk番目のアミノ酸残基の左側のウィンドウ幅、wRはk番目のアミノ酸残基の右側ウィンドウ幅をそれぞれ表す。wLとwRはそれぞれ1〜15の整数、好ましくは3〜7の整数、さらに好ましくは4とする。wLとwRは必ずしも等しくなくて良い。w は、wLとwRの和に、k番目のアミノ酸残基を含める意味で1を足したものである。
すなわち、wは、“配列上近傍のアミノ酸残基”を表現するパラメータであり、この設定により、k-wL番目からk+wR番目のアミノ酸残基が、k番目のアミノ酸残基の配列上近傍に位置するアミノ酸残基と定義される。
例として、プロテインGの各構成アミノ酸残基相互のコンタクト原子数ni,jを示す図3を参照すれば、Dloc kは、四角で表される一辺wの正方形の内部のni,j を足し合わせた値の1/2に相当する値である。なお、図3中横軸及び縦軸はタンパク質のアミノ酸番号を表し、各アミノ酸番号の交点における小四角の濃淡は、各アミノ酸残基相互のコンタクト原子数nijを表す。
すなわち、上記式により算出したDloc k は、変異対象のタンパク質におけるk番目のアミノ酸残基と、該アミノ酸残基を中心とするその近傍領域すなわち設定されたウィンドウ枠内の各アミノ酸残基とのコンタクト原子数の合計(局所コンタクト数密度)を示す。本発明においては、タンパク質のアミノ酸配列を構成する各アミノ酸残基について各Dlocを算出する。
上記式(3)中、Iloc kはk番目のアミノ酸残基の局所コンタクト指数、μD locはDlocの平均値、σD locはDlocの標準偏差を表し、それぞれ以下の式で示される。
上記式(3)により算出されるIloc kは、タンパク質のk番目のアミノ酸における局所コンタクト数密度の平均値からの乖離度を表し、該算出値が0の場合は平均と同じであるが、プラス値の場合は平均を超え、その絶対値が大きいほど局所コンタクト数密度が大きく、マイナス値の場合は平均未満で、その絶対値が大きいほど局所コンタクト数密度が低いことを示す。
タンパク質を構成するアミノ酸残基を、局所的な相互作用を介してタンパク質分子の構造安定化に寄与しているアミノ酸残基と非局所的な相互作用を介して寄与しているアミノ酸残基とに区別する必要がある場合、Ilocはそのための適切な指数となる。すなわち、Ilocが大きいアミノ酸残基は、その配列上近傍のアミノ酸残基(ウィンドウ枠内のアミノ酸残基)と強く相互作用しているアミノ酸残基であることを示唆し、Ilocが大きいアミノ酸残基が連続する領域は、その対象タンパク質において局所的な相互作用を介して立体構造を安定化している部分セグメントである可能性が高い。本発明においては、少なくともIlocが正の値を示すアミノ酸残基が連続する領域を変異導入領域として選定する。
以上のプロセスAは、プログラムされたコンピュータの利用によって遂行することができる。
なお、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントをタンパク質の立体構造座標データをもとに選定する方法は、上記手法のみではないので、本発明のIloc値と定性的に同様の傾向を示すパラメータを用いる限りにおいて、上述と異なる方法で選定しても良い。
〔プロセスB〕
タンパク質の立体構造座標データを用いて、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を探索するプロセス。
このプロセスにおいては、上記プロセスAと同様にして得た、変異導入対象のタンパク質の立体構造座標データを用いて、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を探索する。この探索は、好ましくは、以下の数式(4)、(5)で定義される非局所コンタクト原子数Nnl、非局所コンタクト指数Inlを算出に基づき行う。
上記数式(4)中、Nnl i はi番目のアミノ酸残基の非局所コンタクト原子数、Nはタンパク質分子の鎖長を表す。C’p’,qはアミノ酸残基iの側鎖の重原子p’とアミノ酸残基jの重原子qとの間のコンタクト数で、2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数である。dはプロセスAと同様に設定される。また、wLとwRはそれぞれアミノ酸残基iの左側ウィンドウ幅、右側ウィンドウ幅を表し、プロセスAと同様に設定される。
この数式(4)により設定されるNnl i はi番目のアミノ酸残基の側鎖と全てのアミノ酸残基とのコンタクト数の合計から、i番目のアミノ酸残基の側鎖と配列上その近傍のアミノ酸残基すなわちウィンドウ枠内のアミノ酸残基とのコンタクト数の合計を除いたものであって、該アミノ酸残基の側鎖と、該残基を中心とするウィンドウ枠の外側に位置する各アミノ酸残基すなわち遠方の各アミノ酸残基とのコンタクト数の合計を示す。配列上遠方のアミノ酸残基と多数接触している側鎖を有するアミノ酸残基ほど大きなNnl値を示すことになる。
本発明においては、各アミノ酸残基についてのNnl値を比較から、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を見いだしてもよいが、以下の数式(5)に基づき非局所コンタクト指数を求めれば、0〜1の間に規格化して評価することができる。
上記式5中、Inl i はi番目のアミノ酸残基の非局所コンタクト指数、Nnl i は上記と同様であり、αは非局所コンタクト数の縮減を意図する任意の定数である。αは正の実数、好ましくは1〜10の実数、さらに好ましくは3とする。
上式より、配列上遠方のアミノ酸残基との接触が無いアミノ酸残基のInlは1であり、接触が多いアミノ酸残基のInlは0に近づく。本実施例では、Inlの値がより大きいアミノ酸残基は、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基であり、反対にInlの値がより小さいアミノ酸残基は配列上遠方のアミノ酸残基と相互作用が強いアミノ酸残基である。本発明においては少なくともInl値が0.1以上のアミノ酸残基を候補として選定する。
以上のプロセスBは、タンパク質を構成するアミノ酸配列の中から、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を探索するプロセスであり、単独で遂行することも可能であるが、上記プロセスAにおいて選定された部分セグメントの構成アミノ酸残基中に、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を見いだすことにより、すなわち、プロセスAにこのプロセスBを付加することにより、より的確に変異対象候補部位を絞り込むことが可能となる。
以上のプロセスBは、プログラムされたコンピュータの利用によって遂行することができる。
なお、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基をタンパク質の立体構造座標データをもとに求める手法は、このプロセスBのみ手法のみに限らないので、本発明のInl値と定性的に同様の傾向を示すパラメータを用いる限りにおいて、上述と異なる方法で求めても良い。
〔プロセスC〕
プロセスA、あるいはプロセスB、あるいはプロセスAおよびプロセスBの結果を用いて、該タンパク質を構成するアミノ酸配列の中から変異対象部位とするアミノ酸残基を選定するプロセス。
このプロセスは、変異対象部位とするアミノ酸残基を選定するプロセスであり、プロセスAで選定された、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されていると予測される部分セグメントに含まれるアミノ酸残基の中から、変異対象部位とするものを選定してもよいが、あるいはプロセスBで選定された、配列上遠方のアミノ酸残基との相互作用が弱いと予測されるアミノ酸残基を変異対象部位として選定してもよいが、より好ましくは、プロセスAで選定された配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されていると予測される部分セグメントに含まれるアミノ酸残基であって、かつプロセスBで選定された配列上遠方のアミノ酸残基との相互作用が弱いと予測されるアミノ酸残基を変異対象部位として選定する。
この変異部位のアミノ酸残基の選定は、特定の手法に限定されるわけではないが、後者の場合、好ましくは、上記プロセスAで算出される各アミノ酸残基についてのIloc値及びプロセスBで算出される同Inl値を用いて、以下の式(6)で定義される変異適性指数IMを算出する。算出したIMの値がより大きいアミノ酸残基は変異対象部位として好適であり、このIM値を算出することにより、より簡便かつ効率的に変異対象部位を選定することができる。
式6中、IM i はi番目のアミノ酸残基の変異適性指数を示す。本発明においてはIM値が、0.1以上、好ましくは0.5以上のアミノ酸残基を変異対象部位として選定することが好ましい。
以上のプロセスCは、プログラムされたコンピュータの利用によって遂行することができる。
なお、プロセスAおよび/またはプロセスBの結果を用いて、アミノ酸配列の中から変異対象部位とするアミノ酸残基を選定する方法はこの手法のみに限らないので、本発明のIM値と定性的に同様の傾向を示すパラメータを用いる限りにおいて、上述と異なる方法で選定しても良い。
2.置換後アミノ酸残基の選定
一方、本発明は、変異対象部位として選定されたアミノ酸残基を置換する他のアミノ酸残基(以下、置換後アミノ酸残基という。)を選定し、変異型タンパク質のアミノ酸配列を決定するプロセスを含む。このアミノ酸残基の選定は、以下のプロセスD、E、およびF、あるいはプロセスGを含み、さらにプロセスHを含む。図2にその好ましいフローを示す。
〔プロセスD〕
変異対象のタンパク質の立体構造座標データを用いて、変異対象部位を含む部分セグメントの主鎖のコンフォメーションを特定するプロセス
このプロセスで使用するタンパク質の立体構造座標データは、プロセスAと同様に取得できる。次に、取得した立体構造座標データを用いて、変異対象部位を含む部分セグメントの主鎖のコンフォメーションを特定する。好ましくは、以下に示す方法で特定すると良い。即ち、対象とするタンパク質の主鎖の二面角(φ、ψ、ω)を算出し、さらにその結果から変異部位を含む前後数残基分の部分セグメントの主鎖二面角を抜き出すことにより、変異対象部位を含む部分セグメントの主鎖のコンフォメーションを特定する。ここで変異対象部位とは、例えば、上記プロセスA、あるいはプロセスB、あるいはプロセスA及びBあるいはさらにプロセスCを付加して選定されたアミノ酸残基、あるいは類縁体の配列解析や公知文献などの情報にもとづき特定したアミノ酸残基であり、あるいは任意のアミノ酸残基であってもよい。
以上のプロセスDの計算は、プログラムされたコンピュータの利用によって遂行することができる。
なお、部分セグメントの主鎖のコンフォメーションをタンパク質の立体構造座標データをもとに特定する方法は上記手法のみ限らず、たとえば、変異部位を含む前後数残基分の部分セグメントのカルテシアン座標などの、主鎖二面角と同等の情報を用いる限りにおいて、上述と異なる方法で変異部位を含む部分セグメントの主鎖のコンフォメーションを特定しても良い。
〔プロセスE〕
プロセスDで特定した部分セグメントの主鎖のコンフォメーションを安定に形成するアミノ酸配列を決定するプロセス。
このプロセスは、種々のタンパク質が有する主鎖のコンフォメーションの中から、プロセスDで特定した部分セグメントの主鎖のコンフォメーションと同様あるいは類似のものを抽出し、抽出されたコンフォメーションを形成するアミノ酸配列中の各アミノ酸残基において、出現頻度の高いアミノ酸残基の種類を特定することにより実現できる。あるいは、プロセスDで特定した部分セグメントの主鎖のコンフォメーションを安定に形成するアミノ酸配列は、理論科学的知見に基づく予測あるいは実験科学的試験に基づく結果から決定することもできる。ここで理論科学的知見とは、たとえば非特許文献「T. E. Creighton, Proteins: Structures and Molecular Properties (1933) W H Freeman & Co.」、「G. A. Petsko, Protein Structure and Function (2003) Sinauer Associates Inc.」、「I. Eidhammer, Protein Bioinformatics: An Algorithmic Approach to Sequence and Structure Analysis (2004) John Wiley & Sons Inc.」に記載の、当該事業者においては周知であるタンパク質分子に関わる物理学的知見あるいは統計学的知見を指す。また、実験科学的試験とは、たとえば非特許文献「Methods in Enzymology, Vol.1〜30, Elsevier Inc.」に記載の、当該事業者においては周知であるタンパク質に関わる各種の理化学試験方法を指す。
上記出現頻度の高いアミノ酸残基の種類の特定は、例えば、以下に示すプロセスを挙げることができる。
すなわち、(独)産業技術総合研究所で開発され、公開されているタンパク質局所構造データベースProSegの検索ウィンドウにプロセスDで計算した部分セグメントの主鎖二面角の値を入力することで、プロセスDで特定した部分セグメントの主鎖のコンフォメーションと同様あるいは類似した主鎖のコンフォメーションを有するタンパク質の局所構造クラスタを検索する。ついで、同様のあるいは類似した局所構造クラスタの統計値を表示させ、表示された位置特異的スコア行列(PSSM)のスコアを参照することにより、プロセスDで特定した部分セグメントの主鎖のコンフォメーションと同様あるいは類似のコンフォメーションを形成する場合のアミノ酸配列において、出現頻度が高いアミノ酸残基を特定する。
すなわち、上記構造データベースProSegにおいては、局所構造クラスタごとに、そのアミノ酸配列位置に対応した各アミノ酸残基の出現可能性の度合いを示す統計値(PSSM)が格納されており、プロセスDで計算した部分セグメントの主鎖二面角の値を入力することにより、格納された種々のタンパク質の局所構造クラスタの中から、プロセスDで特定した部分セグメントの主鎖のコンフォメーションと同様あるいは類似のコンフォメーションを抽出し、該コンフォメーション形成するアミノ酸配列の位置毎の各アミノ酸残基の出現頻度の度合いを知ることができる。
この出現頻度の度合いの高いアミノ酸残基は、プロセスDで特定したコンフォメーションと同様あるいは類似するコンフォメーションを形成するために重要なアミノ酸残基と解釈することができ、上記プロセスDで特定した部分セグメントを含むこのようなコンフォメーションを有するタンパク質に対し、その構造安定化に対する寄与度が大きいアミノ酸残基である可能性が高い。
以上のプロセスEは、プログラムされたコンピュータの利用によって遂行することができる。
上記出現可能性が高いアミノ酸残基を特定する方法は、上記手法のみに限らないので、ProSegにて表示されるPSSMのスコアと定性的に同様の傾向を示すパラメータを用いる限りにおいて、上述と異なる方法で推定しても良い。
なお、ProSegにおけるPSSMの定義は、非特許文献(Sawada Y. and Honda S. 2006 Biophysical J., 91(4), 1213-1223.)に明記されている。
〔プロセスF〕
変異対象部位のアミノ酸残基に代える置換後アミノ酸残基の種類を選別するプロセス。
このプロセスFは、プロセスEの結果を用いて、変異対象部位のアミノ酸残基に代える置換後アミノ酸残基の種類を選別するプロセスであり、好ましくは、以下に示す手法で選別することができる。即ち、プロセスEで求めたPSSMのスコアを用いて、以下の式(7)で定義される交換の好ましさpを算出する。
式7中、pkは変異対象部位であるk番目のアミノ酸残基の交換の好ましさ、sPSSM k(original)は変異対象部位kの置換前のアミノ酸残基のスコア、sPSSM k(candidate)は変異対象部位kの置換するアミノ酸残基のスコアである。算出したpkの値がより大きくなるアミノ酸残基の種類を、変異対象部位のアミノ酸残基に代える置換後アミノ酸残基の種類として選別する。
本発明において置換後アミノ酸残基の選定においては、p値が1.0以上の、好ましくは2.0以上のアミノ酸残基が好ましい。
この選別手法について図6の結果を例として以下具体的に説明する。
図6はプロテインG・B1ドメインの部分セグメント(43−51)の主鎖2面角を入力して得られたPSSM出力データである。変異前のプロテインG・B1ドメインの部分セグメントの47番目はAspであるが、そのPSSMスコアは、1.3279である。これに対してProは4.1811であり、AspをProに置換した場合のp(k=47)は、3.1487となり、1.0より大きい。また、他のいかなるアミノ酸に置換した場合に比べてもPro への置換のp(k=47)は大きい。このような場合、本発明において、置換後アミノ酸残基としてProを選別する。
以上のプロセスFは、プログラムされたコンピュータの利用によって遂行することができる。
なお、置換後アミノ酸残基の種類を選別する方法上記手法のみにかぎらないので、本発明のp値と定性的に同様の傾向を示すパラメータを用いる限りにおいて、上述と異なる方法で選別しても良い。
〔プロセスG〕
タンパク質の立体構造座標データを用いて、アミノ酸残基の埋もれ度を評価し、アミノ酸残基の置換の許容度を判定するプロセス
このプロセスは、上記プロセスDと同様にして得た、変異導入対象のタンパク質の立体構造座標データを用いて、アミノ酸残基の埋もれ度を評価し、アミノ酸残基の置換の許容度を求めるプロセスである。
好ましくは、以下の式(8)で定義される露出表面積比Rを算出し、アミノ酸残基の埋もれ度を評価する。
式8中、Riは変異対象部位であるi番目のアミノ酸残基の露出表面積比を表す。
ASAFOLD,SIDE(i)はi番目のアミノ酸残基の側鎖の天然状態における露出表面積、
ASAUNFOLD,SIDE(i)はi番目のアミノ酸残基の側鎖の変性状態における露出表面積を示す。
ASAFOLD,SIDE(i)については、取得した立体構造座標データを用いて算出する。露出表面積の定義およびその理論的特性は、当事業者において周知であり、たとえば「T. E. Creighton (1993) Proteins: Structures and Molecular Properties 2nd ed., W. Freeman and Company, New York, pp.227-232」等の非特許文献にて詳説されている。また、露出表面積の算出は、たとえば、Surface Racer 3.0 for Linux(Dr. Oleg Tsodikov, The University of Michigan)などのインターネットで入手可能なフリーのソフトウエアを用いて計算することができる。
Riの値が大きいということは天然状態の立体構造において、i番目のアミノ酸残基の側鎖の埋もれ度が小さく、大部分が溶媒に露出していることを意味する。したがって、置換後のアミノ酸残基の側鎖のサイズが置換前に比べて大きくなる場合も、タンパク質分子全体に与えるストレスが少ないことが予想される。
一方、算出したRiの値が小さい部位はアミノ酸残基の埋もれ度が大きいと評価し、このような部位で置換後のアミノ酸残基の側鎖のサイズが置換前に比べて大きくなる場合は、その置換は許容されないと判定する。本発明においてはRiの値が0.3以上、好ましくは0.5以上のアミノ酸残基を置換後アミノ酸残基として選別する。
以上の算出法に関して、プロテインG・B1ドメインを例として以下具体的に説明する。
プロセスDと同様にして得たプロテインG・B1ドメインの立体構造座標データ、炭素、窒素、酸素、硫黄各原子のファンデルワールス半径、溶媒である水分子の近似半径(1.4Å)をSurface Racer 3.0 for Linuxに入力すると、プロテインG・B1ドメインを構成する各重原子の露出表面積が出力される。これをもとに、たとえば47番目のAspの側鎖は、ASAFOLD,SIDE(Asp47)=72.86Å2と算出される。一方、変性状態の構造モデルに対応するトリペプチドGlyAspGlyの立体構造座標データを、Surface Racer 3.0 for Linuxに入力することにより、ASAUNFOLD,SIDE(Asp)=116.99 Å2が求められる。これを式8に代入して、Ri=0.62を得る。この場合、Riが0.3以上であることから、47番目のAspでは、置換後のアミノ酸残基の側鎖のサイズが置換前に比べて大きくなる場合も、タンパク質分子全体に与えるストレスが少ないことが予想される。
置換後アミノ酸残基を選別は、プロセスG単独で行うことも可能ではあるが、上記プロセスFにより選別された置換後アミノ酸残基について、プロセスGを付加することにより、埋もれ度を算出し、その許容度の判定を行えば、より好適な置換後アミノ酸残基を選別することが可能となる。
以上のプロセスGは、プログラムされたコンピュータの利用によって遂行することができる。
なお、アミノ酸残基の埋もれ度をタンパク質の立体構造座標データをもとに評価する方法は上記手法のみに限らないので、本発明のR値と定性的に同様の傾向を示すパラメータを用いる限りにおいて、上述と異なる方法でアミノ酸残基の置換の許容度を判定しても良い。
〔プロセスH〕
プロセスFおよび/またはプロセスGの結果を用いて、変異型タンパク質を構成するアミノ酸配列を設計するプロセス。
本プロセスは、選定された変異対象部位と、プロセスFあるいはプロセスG、若しくはプロセスFとプロセスGを組み合わせた手法により選別された該部位における好適な置換後アミノ酸残基の種類に基づき、変異型タンパク質のアミノ酸配列を設計するプロセスである。このプロセスで設計される変異型タンパク質は、点置換であっても多重置換であってもよい。
また、本プロセスにおいて、対象とするタンパク質に関する公知の構造機能情報(たとえば活性部位を構成するアミノ酸残基など)を活用して、設計した変異型タンパク質を構成するアミノ酸配列について、さらに適当か否かの検討を加えてもよい。
3.変異型タンパク質の製造
本発明においては、設計されたアミノ酸配列に基づき、変異型タンパク質を製造するが、この製造プロセスにおいては、変異型タンパク質の合成・単離・精製・分析プロセスを含む。
タンパク質を合成する方法としては、遺伝子工学的手法と有機化学的手法があり、両手法とも広く知られており、本発明における変異型タンパク質の合成に用いることができる。歴史的な経緯から前者により合成されたタンパク質を組替えタンパク質と呼ぶが、十分な精製プロセスを経れば、遺伝子工学的手法による組替えタンパク質と有機化学的手法によるタンパク質の間に物質化学的な差が生じることはない。
遺伝子組換え手法による変異型タンパク質の合成においては、まず、該タンパク質をコードする遺伝子を合成するが、設計されたアミノ酸配列をコードする遺伝子と相同性の高い塩基配列を有する核酸(たとえば、野生型の遺伝子)が利用できる場合は、まずその核酸を取得し、ついで、カセット変異法や部位特異的変異導入法によって目的の設計されたアミノ酸配列をコードする遺伝子を合成することができる(左右田健次、中村聡、高木博史、林秀行(1999)「タンパク質 科学と工学」、講談社サイエンティフィク)。
相同性の高い塩基配列を有する核酸が利用できない場合は、100塩基程度までのオリゴヌクレオチドを複数化学合成し、これらを組み合わせ、オーバーラップ伸張法などを用いて目的の遺伝子を全合成することができる(左右田健次、中村聡、高木博史、林秀行(1999)「タンパク質 科学と工学」、講談社サイエンティフィク、 Horton R. M., Hunt H. D., Ho S. N., Pullen J. M. and Pease L. R. (1989). Engineering hybrid genes without the use of restriction enzymes: gene splicing by overlap extension. Gene 77, 61-68.)。
ついで、目的の遺伝子をベクターに組み込む。ベクターとしては、プラスミド、ファージ、コスミドなどを利用することができる(左右田健次、中村聡、高木博史、林秀行(1999)「タンパク質 科学と工学」、講談社サイエンティフィク)。その後、ベクターを用いて宿主の細胞を形質転換する。宿主の細胞としては、大腸菌、枯草菌、放線菌、酵母、昆虫細胞、動物細胞などを利用することができる(大野茂男、西村善文監修(1997)タンパク質実験プロトコール1−機能解析編、秀潤社)。
薬剤耐性などの選択マーカーを利用して選別後、これらの形質転換体を培養する。一定期間培養した後、大量発現した細胞を破砕し、変異型タンパク質を含む菌体破砕液を抽出する。なお、タンパク質の生合成に関わる因子のみを混合させた、いわゆる無細胞合成系を利用すると、生細胞を用いることなく、ベクターから変異型タンパク質を含む粗精製液を得ることができる(岡田雅人、宮崎香(2004)タンパク質実験ノート(上)、羊土社)。
これらの菌体破砕液や粗精製液から目的の変異型タンパク質を精製する。精製法としては、遠心分離、硫安分画、イオン交換クロマトグラフィー、ゲルろ過クロマトグラフィー、アフィニティクロマトグラフィーなどを利用することができる(大野茂男、西村善文監修(1997)タンパク質実験プロトコール2−構造解析編、秀潤社)。
有機化学的手法によるタンパク質の合成は、固相ペプチド合成法などにより行うことができる。好ましくは自動合成機を利用して、活性化されたアミノ酸誘導体の重縮合反応を繰り返すことにより、設計されたアミノ酸配列を有する保護ポリペプチドを樹脂上で合成する。ついで、この保護ポリペプチドを樹脂上から切断すると共に側鎖の保護基も同時に切断する。この切断反応には、樹脂や保護基の種類、アミノ酸の組成に応じて適切なカクテルがあることが知られている(大野茂男、西村善文監修(1997)タンパク質実験プロトコール2−構造解析編、秀潤社)。この後、有機溶媒層から粗精製タンパク質を水層に移し、目的の変異型タンパク質を精製する。精製法としては、逆相クロマトグラフィーなどを利用することができる(大野茂男、西村善文監修(1997)タンパク質実験プロトコール2−構造解析編、秀潤社)。
精製したタンパク質が目的通りのアミノ酸配列からなる変異型タンパク質であるか否かを分析する。分析方法としては、SDS-PAGE、ウェスタンブロッティング、質量分析、アミノ酸分析、アミノ酸シーケンサーなどを利用することができる(大野茂男、西村善文監修(1997)タンパク質実験プロトコール2−構造解析編、秀潤社)。
本発明においては、設計される変異型タンパク質のアミノ酸配列は1つのみに限らないので、得られた変異型タンパク質本来の機能、性質を有しているか否かあるいは耐熱性等の安定性を指標にしてスクリーニングすることにより、目的にかなう変異型タンパク質を取得することができる。
以下、実施例を用いて本発明を具体的に説明する。ただし、本発明の技術的範囲はこれらの実施例に限定されるものではない。
実施例1
本実施例においては、任意のタンパク質の立体構造座標データを用いて、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントを推定するプロセスAを例示する。
まず、以下に示す表1に示すタンパク質の立体構造座標データを、国際的なタンパク質立体構造データベースであるProtein Data Bank(PDB; http://www.rcsb.org/pdb/home/home.do)よりダウンロードした。
ついで、以下で定義されるコンタクト原子数(contact atom number)を各タンパク質分子(またはサブユニット)の立体構造座標データを用いて算出した。
ここでni,jは残基iと残基jの間のコンタクト原子数 (i≠j)、Nはタンパク質分子(またはサブユニット)の鎖長を表す。Cp,qはタンパク質分子内の水素原子を除く重原子pと重原子qの間のコンタクト数で、Cp,qは2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数である。本実施例ではd=0.5nmと固定して計算した。算出した結果の例として、表1に示すタンパク質のni,jを図3に示す。
図中、横軸、縦軸は各タンパク質のアミノ酸番号を示し、右上のバーの濃淡はコンタクト原子数nの大きさの指標を表す。横軸のアミノ酸番号iと縦軸のアミノ酸番号jの交点にある小四角は、タンパク質中の2つのアミノ酸番号で特定されるアミノ酸残基間のni,jの値をその濃淡で示したものであり、上記指標により、タンパク質分子内のすべてのアミノ酸残基間のコンタクト原子数を把握できる。
この図3によれば、各タンパク質において、アミノ酸番号の近いアミノ酸残基間と大きいコンタクト原子数を示すアミノ酸残基や、遠方に位置するアミノ酸残基と大きいコンタクト原子数を示すアミノ酸残基が存在することが明らかである。
次に、以下で定義される局所コンタクト数密度(local contact number density)を算出した。
ここでDloc kはk番目のアミノ酸残基の局所コンタクト数密度を表す。w、wL、wRはそれぞれウィンドウ幅、左側ウィンドウ幅、右側ウィンドウ幅を表す。図3において、正方形で表される一辺wの正方形の内部のni,j を足し合わせた値の1/2がDloc kに相当することになる。なお、wは、“配列上近傍のアミノ酸残基”を表現するパラメータである。即ち、k-wL番目からk+wR番目のアミノ酸残基をk番目のアミノ酸残基の配列上近傍に位置するアミノ酸残基と見なす。本実施例ではwL=wR=4、すなわちw=9と固定して計算した。
次に、以下で定義される局所コンタクト指数(local contact index)を算出した。
ここでIloc kはk番目のアミノ酸残基の局所コンタクト指数、μD locはDlocの平均値、σD locはDlocの標準偏差を表す。タンパク質が、wを単位とする部分セグメントにより構成されると考えると、アミノ酸残基が局所的に密に接触している部分セグメントのIlocは正の値として、局所的に疎に接触している部分セグメントのIlocは負の値として表される。算出した結果の例として、Protein G(1PGA)の場合のIloc算出結果を図4に示す。これによれば、局所コンタクト指数Ilocが正で大きい値を示す領域と負の領域があることが明確に分かる。
本実施例では、Ilocの値がより大きい領域を、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントとした。
なお、本実施例の計算は、intel fortran complier for linux ver9.0 (インテル)を用いて新たに開発したプログラム、Red Hat Enterprise Linux WS release 3 (Taroon Update 8)(レッドハット)(以上ソフトウエア)、Dell Precision Workstation370(デル)(以上ハードウエア)を用いて行った。
実施例2
本実施例においては、任意のタンパク質の立体構造座標データを用いて、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を推定するプロセスBを例示する。
実施例1と同様に立体構造座標データをダウンロードし、各タンパク質分子(またはサブユニット)について、以下で定義される非局所コンタクト原子数(non-local contact atom number)を計算した。
ここでNnl i はi番目のアミノ酸残基の非局所コンタクト原子数である。Nはタンパク質分子(またはサブユニット)の鎖長を表す。C’p’,qはアミノ酸残基iの側鎖の重原子p’とアミノ酸残基jの重原子qとの間のコンタクト数で、2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数である。本実施例ではd=0.5nmと固定して計算した。なお、アミノ酸残基iがGlyの場合はC’p’,qは0とした。wLとwRはそれぞれ左側ウィンドウ幅、右側ウィンドウ幅で、本実施例では上記実施例1と同様にwL=wR=4と固定して計算した。上式は、すべてのアミノ酸残基に対するコンタクト数の和から配列上近傍のアミノ酸残基に対するコンタクト数の和を除いたものなので、配列上遠方のアミノ酸残基と多数接触している側鎖をもつアミノ酸残基は大きなNnl値を示すことになる。
次に、以下で定義される非局所コンタクト指数(non-local contact index)を算出した。
ここでInl i はi番目のアミノ酸残基の非局所コンタクト指数である。αは非局所コンタクト数の縮減を意図する任意の定数で、本実施例ではα =3と固定して計算した。上式より、配列上遠方のアミノ酸残基との接触が無いアミノ酸残基のInlは1であり、接触が多いアミノ酸残基のInlは0に近づく。算出した結果の例として、Protein G(1PGA)の場合のInlを図5に示す。図4と対比すれば明らかように、Ilocの値がより大きい領域、すなわち、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている領域においても配列上遠方のアミノ酸残基と強く相互作用しているアミノ酸残基(Inlの値がより小さいアミノ酸残基)があることが分かる。
本実施例では、Inlの値がより大きいアミノ酸残基を、配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基とした。
なお、本実施例の計算は、intel fortran complier for linux ver9.0 (インテル)を用いて新たに開発したプログラム、Red Hat Enterprise Linux WS release 3 (Taroon Update 8)(レッドハット)(以上ソフトウエア)、Dell Precision Workstation370(デル)(以上ハードウエア)を用いて行った。
実施例3
本実施例においては、タンパク質を構成するアミノ酸配列の中から変異部位とするアミノ酸残基を選定するプロセスCを例示する。
実施例1により得られたIlocの算出値と実施例2により得られたInlの算出値を用いて以下で定義される変異適性指数(good mutation index)を算出した。
ここでIM i はi番目のアミノ酸残基の変異適性指数を示す。
算出した結果の例として、Protein G(1PGA)の場合のIMを図6に示す。その値が大きいほど、配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントであって、かつ配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基である。すなわち、変異適正指数が高いアミノ酸番号のアミノ酸残基は、変異対象部位として好適であることを示す。
この結果に基づき、Protein G(1PGA)について、本実施例ではIM i>0.5のアミノ酸残基、即ち、Ala24、Thr25、Lys28、Gln32、Asn35、Asp36、Asn37、Asp47、Ala48、Thr49を変異部位の候補とした。
なお、本実施例の計算は、intel fortran complier for linux ver9.0 (インテル)を用いて新たに開発したプログラム、Red Hat Enterprise Linux WS release 3 (Taroon Update 8)(レッドハット)(以上ソフトウエア)、Dell Precision Workstation370(デル)(以上ハードウエア)を用いて行った。
実施例4
本実施例においては、任意のタンパク質の立体構造座標データを用いて、変異部位を含む部分セグメントの主鎖のコンフォメーションを特定するプロセスDを例示する。
実施例1と同様に立体構造座標データをダウンロードし、これを用いてタンパク質分子(またはサブユニット)の主鎖二面角(φ,ψ,ω)を計算した。主鎖二面角の定義は、「有坂、バイオサイエンスのための蛋白質科学入門」を参照した。ついで、変異部位を含む前後(w-1)/2残基分の部分セグメントの主鎖二面角を抜き出すことにより、変異部位を含む部分セグメントの主鎖のコンフォメーションを特定した。wはウィンドウ幅で、本実施例では実施例1と同様にw=9と固定して計算した。算出した結果の例として、Protein G(1PGA)の部分セグメント(43-51)の場合を図7に示す。
なお、本実施例の計算は、intel fortran complier for linux ver9.0 (インテル)を用いて新たに開発したプログラム、Red Hat Enterprise Linux WS release 3 (Taroon Update 8)(レッドハット)(以上ソフトウエア)、Dell Precision Workstation370(デル)(以上ハードウエア)を用いて遂行した。
実施例5
本実施例においては、プロセスDで特定した部分セグメントの主鎖のコンフォメーションと同様あるいは類似のコンフォメ―ションにおいて、出現可能性の高いアミノ酸残基の種類を特定するプロセスEを例示する。
まず、(独)産業技術総合研究所で開発され、公開されているタンパク質局所構造データベースProSeg (http://riodb.ibase.aist.go.jp/proseg/index.html)の検索ウィンドウに実施例4で計算した部分セグメントの主鎖二面角の値を入力することで、実施例4で選定した部分セグメントの主鎖のコンフォメーションと類似した主鎖のコンフォメーションを有するタンパク質の局所構造クラスタを検索した。ついで、最も類似した局所構造クラスタの統計値の詳細を表示させた。検索した結果の例として、Protein G(1PGA)の部分セグメント(43-51)の結果を図8に示す。
PSSMの各位置でスコアが高いアミノ酸の組み合わせからなる配列は、その主鎖のコンフォメーションを安定に形成する可能性が高い。
なお、本実施例の計算は、firefox ver 2.0.0.4 for linux(mozilla.org)、Red Hat Enterprise Linux WS release 3 (Taroon Update 8)(レッドハット)(以上ソフトウエア)、Dell Precision Workstation370(デル)(以上ハードウエア)を用いて行った。
実施例6
本実施例においては、プロセスEの結果を用いて、変異部位のアミノ酸残基に代わって置き換えるアミノ酸残基の種類を選別するプロセスFを例示する。
まず、実施例5で求めたPSSMのスコアを用いて、以下で定義される交換の好ましさ(preference of permutation)を算出した。
ここで、pkはk番目のアミノ酸残基の交換の好ましさ、sPSSM k(original)は変異部位kの置換前のアミノ酸残基のスコア、sPSSM k(candidate)は変異部位kの置換後のアミノ酸残基のスコアである。PSSMのスコアは、各部分セグメントの中心に位置するアミノ酸残基(図8における0番列)の数値を用いた。置換後のアミノ酸残基としては、原則、PSSMのスコアが最も大きいアミノ酸残基を候補とした。ただし、Cysは除外した。また、PSSMのスコアが大きいアミノ酸残基が複数存在した場合は、最大のものに加えてそれらについても候補とした。pkは変異部位kにおける置換後の効果の目安であり、pkが大きいほど大きな効果が期待できる。本実施例では、pk≧2.0となる交換についてのみ検討対象として残すこととした。
実施例3で特定したProtein G(1PGA)における、10箇所の変異部位候補Ala24、The25、Lys28、Gln32、Asn35、Asp36、Asn37、Asp47、Ala48、Thr49を他のアミノ酸で置換する場合に算出されるpk値を図9に示す。図中に示した各アミノ酸置換のうち、Ala24Glu、The25Trp、Lys28Ala、Gln32Ala、Thr49Thrはpk<2.0のため除外し、Asn35Lys、Asp36Glu、Asn37Leu、Asp47Pro、Ala48Lys、Ala48Gluを置き換えるアミノ酸残基の候補と選別した。
ちなみに上記Thr49Thr が意味することは、Protein G(1PGA)の49番目のスレオニン残基においては、同様あるいは類似のコンフォメ―ションの対応位置においてもスレオニン残基がもっとも高い頻度で位置しており、すなわち、天然のアミノ酸残基が最適のアミノ酸残基であったことを示している。
なお、本実施例の計算は、intel fortran complier for linux ver9.0 (インテル)を用いて新たに開発したプログラム、Red Hat Enterprise Linux WS release 3 (Taroon Update 8)(レッドハット)(以上ソフトウエア)、Dell Precision Workstation370(デル)(以上ハードウエア)を用いて行った。
実施例7
本実施例においては、任意のタンパク質の立体構造座標データを用いて、アミノ酸残基の埋もれ度を評価し、アミノ酸残基の置換の許容度を判定するプロセスGを例示する。
アミノ酸残基の置換を行う計画において、置換後のアミノ酸残基の側鎖のサイズが置換前に比べて大きくなる場合については、置換前のアミノ酸残基の、以下で定義される露出表面積比(ratio of accessible surface area)を算出して検討した。
ここでRiはi番目のアミノ酸残基の露出表面積比、ASAFOLD,SIDE(i)はi番目のアミノ酸残基の側鎖の天然状態における露出表面積、ASAUNFOLD,SIDE(i)はi番目のアミノ酸残基の側鎖の変性状態における露出表面積を示す。
本実施例において、露出表面積(Accessible Surface Area)の定義は、「Ooi, et al., 1987, Proc. Natl. Acad. Sci. USA 84, 3086-3090.」を参照した。また、変性状態の構造モデルとしては、トリペプチドGly-Xaa-Glyを採用した。すなわち、ASAUNFOLD,SIDE(i)はASAGXG,SIDE(Xi)と等しいとみなした。また、i番目のアミノ酸残基が、側鎖が存在しないアミノ酸残基(つまりGly)であった場合は、Glyの主鎖部分の露出表面積の比をRiとみなした。以上をまとめると式8は以下のごとく書き換えられる。
ここでASAFOLD,SIDE(i)はi番目のアミノ酸残基(Gly以外)の側鎖の天然状態における露出表面積、ASAGXG,SIDE(Xi)はi番目のアミノ酸残基(Gly以外)と同じ種類のアミノ酸残基Xaaが中心に配置されたトリペプチドGly-Xaa-GlyにおけるXaaの側鎖の露出表面積、ASAFOLD,MAIN(i)はi番目のGlyの主鎖の天然状態における露出表面積、ASAGXG,MAIN(Xi)はトリペプチドGly-Gly-Glyにおける中心のGlyの主鎖の露出表面積を示す。
ASAFOLD,SIDE(i)とASAFOLD,MAIN(i)については、実施例1と同様にしてダウンロードしたタンパク質分子(またはサブユニット)の立体構造座標データを用い、ASAGXG,SIDE(Xi)とASAGXG,MAIN(Xi)については、統合計算化学システムMOEを利用して作成したトリペプチドGly-Xaa-Glyの立体構造座標データを用いた。また、露出表面積の計算は米国ミシガン大学で開発されたSurface Racer 3.0 for Linuxを利用した。
Protein G(1PGA)の場合の結果を図10に示す。実施例6で選別したもののうち、置換後のアミノ酸残基の側鎖のサイズが置換前に比べて大きくなるものはAsn35Lys、Asp36Glu、Asp47Pro、Ala48Lys、Ala48Gluであるが、これらは、何れもRi>0.5であり、置換後のアミノ酸残基の側鎖のサイズが置換前に比べて大きくなっているものの、許容できると判定した。
なお、本実施例の計算は、intel fortran complier for linux ver9.0 (インテル)を用いて新たに開発したプログラム、Surface Racer 3.0 for Linux(Dr. Oleg Tsodikov, The University of Michigan)、MOE v2006.08(Chemical Computing Group Inc.)、Red Hat Enterprise Linux WS release 3 (Taroon Update 8)(レッドハット)(以上ソフトウエア)、Dell Precision Workstation370(デル)、Dell DimensionXPS/Gen3 (windows XP SP2) (デル)(以上ハードウエア)を用いて行った。
実施例8
本実施例においては、プロセスFおよび/またはプロセスGの結果を用いて、変異型タンパク質を構成するアミノ酸配列を設計するプロセスHを例示する。
実施例7で判定したアミノ酸残基置換の許容度を勘案し、変異型タンパク質のアミノ酸配列を設計した。上記したように、Protein G(1PGA)の場合、実施例6において、Asn35Lys、Asp36Glu、Asn37Leu、Asp47Pro、Ala48Lys、Ala48Gluの6つの置換候補を選別したが、このうち、置換後のアミノ酸残基の側鎖のサイズが置換前に比べて大きくなるものはAsn35Lys、Asp36Glu、Asp47Pro、Ala48Lys、Ala48Gluの5つであリ、実施例7で述べたように、これら置換は何れも許容されると判定できるので、実施例6で選別したすべての候補を残した。
実施例9
本実施例においては、プロテインG変異型タンパク質をコードする遺伝子を合成し、次いで大腸菌を用いて表2に示す組換えタンパク質(M-PG01、M-PG09、M-PG10、M-PG11)を合成した。
(1)M-PG遺伝子の合成
表3に示される5’-、3’-末端に相補領域を有する56〜59merのオリゴDNA断片を表4の組み合わせで用い、アニールおよびポリメラーゼ伸長反応(55℃,1分,72℃,1分→50℃,1分,72℃,1分→44℃,15秒,72℃,1分)により、Protein G(1PGA)の1〜56番目のアミノ酸配列からなる野生型タンパク質をコードする遺伝子(配列番号5)、Protein G(1PGA)の1〜56番目のアミノ酸配列中、Asp36Glu/Asn37Leuなる変異を有するタンパク質をコードする遺伝子(配列番号6)、Protein G(1PGA)の1〜56番目のアミノ酸配列中、Asp36Glu/Asn37Leu/Asp47Pro/Ala48Glu なる変異を有するタンパク質をコードする遺伝子(配列番号7)、およびProtein G(1PGA)の1〜56番目のアミノ酸配列中、Asp36Glu/Asn37Leu/Asp47Pro/Ala48Lysなる変異を有するタンパク質をコードする遺伝子(配列番号8)からなる各PG遺伝子を合成した。上記遺伝子をそれぞれ順にM-PG01遺伝子、M-PG09遺伝子、M-PG10遺伝子、M-PG11遺伝子という。
これらを各遺伝子それぞれ鋳型にし、制限酵素認識配列を含むプライマーを加えPCR法(アニール45℃, 15秒 → 55℃, 5秒)にて増幅を行い、M-PG01遺伝子、M-PG09遺伝子、M-PG10遺伝子、M-PG11遺伝子を合成した。使用したプライマーは、センスプライマー (ATAGCTCCATG GACACTTACAAATTAATCC(配列番号16))とアンチセンスプライマー(attggatcc ttattcagtaactgtaaaggt(配列番号17))である。得られた増幅物をアガロース電気泳動法(3%, 100V)で確認後、QIAquick PCR Purification kit (Qiagen) を用いて精製した。
(2)クローニング
制限酵素Nco IとBamH I (日本ジーン,37℃,一昼夜)で消化し脱リン酸化(宝酒造,CIAP,50℃,30分)させたプラスミドpET16b(Novagen)と、同じ制限酵素で消化したM-PG遺伝子をライゲーション(東洋紡, Ligation High,16℃,1時間)し、得られたプラスミドベクターを用いて保存用大腸菌DH5α株(東洋紡,Competent high)を形質転換し、100μg/mLアンピシリンを含むLBプレート培地で選択した。正しい挿入配列をもつ形質転換体をcolony PCR、DNA sequencing (AB, BigDye Terminator v1.1)により選別し、Qiaprep Spin Miniprep kit (Qiagen) を用いてプラスミドを抽出した。これを用い、さらに発現用大腸菌BL21(DE3)株(Novagen)を形質転換した。
(3)組換えタンパク質の発現と精製
LB培地で前培養した大腸菌BL21(DE3) 形質転換体を、2.5ml / 500mlでLB培地に継代し、O.D.600 = 0.8〜1.0になるまで振とう培養した。最終濃度0.5mM でIPTGを加え、さらに37℃で2時間振とう培養した。回収した菌体を10mlのPBSに懸濁し、超音波破砕を行った。破砕液は濾過滅菌後、IgG Sepharose 6 Fast Flowカラム (GEヘルスケアバイオサイエンス)をセットした液体クロマトグラフィー装置AKTApurifier (GEヘルスケアバイオサイエンス)に注入し、アフィニティクロマトグラフィー法(running buffer: 50mM Tris-HCl(pH7.6), 150mM NaCl, 0.05% Tween20, elution buffer: 0.5M 酢酸)および/またはRESOURCE Sカラム (GEヘルスケアバイオサイエンス)をセットした液体クロマトグラフィー装置AKTApurifier (GEヘルスケアバイオサイエンス)に注入し、イオン交換クロマトグラフィー法(running buffer: 20mM クエン酸(pH3.5), elution buffer: 20mM クエン酸(pH3.5), 1M NaCl)によりM-PG組換えタンパク質を精製した。分画したフラクションはNaOHで中和後、遠心濃縮機(RABCONCO, CentriVap concentrator)で濃縮し、50mM リン酸緩衝液(pH6.8)で透析した。各溶液を凍結乾燥し、粉末状の組換えタンパク質(M-PG01、M-PG09、M-PG10、M-PG11)を-20℃で保存した。
実施例10
本実施例においては、プロテインG変異型タンパク質の分子量をMALDI-TOF型質量分析計で計測することで、合成したタンパク質を同定した。
まず、単離精製した変異型タンパク質をそれぞれ15〜25μMの濃度の水溶液に調製した。変異型タンパク質の濃度は表5のモル吸光係数を用いて決定した。次いで、質量分析用サンプルプレートにマトリックス溶液(50%(v/v)アセトニトリル‐0.1%TFA水溶液にα-シアノ-4-ヒドロキシ桂皮酸を飽和させた溶液)1μlを滴下し、これに各試料溶液を1μl滴下してサンプルプレート上で混合、乾燥させた。その後、質量分析装置Voyager(Applied Biosystems)にて、強度2500-3000のLaserを照射し質量スペクトルを得た。質量スペクトルにより検出されたピークの分子量と合成した変異型タンパク質のアミノ酸配列より算出された理論分子量を比較した結果、いずれの試料も両者は測定誤差内で一致し、目的のタンパク質(M-PG01、M-PG09、M-PG10、M-PG11)が合成されていることが確認された。また、質量スペクトルに目的のタンパク質以外の有意なピークは見出されなかった。
実施例11
本実施例においては、プロテインG変異型タンパク質の純度をポリアクリルアミドゲル電気泳動法(PAGE)で確認した。
単離精製した変異型タンパク質をそれぞれ75μMの濃度の水溶液に調製したのち、Tricine-SDS-PAGEもしくはTricine-native-PAGE(16%T,2.6%C,100V,100min)を行いCBB(G-250)染色によりバンドを検出し純度を確認した。変異型タンパク質の濃度は表5のモル吸光係数を用いて決定した。その結果、測定したすべての試料は単一のバンドとして検出され、各タンパク質(M-PG01、M-PG09、M-PG10、M-PG11)が、単一成分として精製されたことが確認された。
実施例12
本実施例においては、プロテインG変異型タンパク質の抗体に対する結合性を表面プラズモン共鳴(SPR)法により評価した。SPR法は、生体高分子間の特異的相互作用を経時的に測定し、反応を速度論的観点から定量的に解釈できる優れた方法であることが認識されている。
まず、センサーチップCM5 (Biacore) の測定セルにヒト免疫グロブリンのFc領域 (Jackson ImmunoResearch)をアミンカップリング法により固定化した。測定のコントロールとして、カルボキシメチル基をエタノールアミンでブロッキングした対照セルを用いた。次いで、単離精製した変異型タンパク質を、ランニング緩衝液であるHBS-P (10mM HEPES pH7.4, 150mM NaCl, 0.05% v/v Surfactant P20)に溶解し、600, 500, 400, 300, 200, 100nMの6種の濃度の試料溶液を調製した。変異型タンパク質の濃度は表5のモル吸光係数を用いて決定した。SPRの測定は、Biacore T100 (Biacore)を用い、反応温度25℃で行った。収集したデータは、Biacore T100 Evaluation Software (Biacore)を用いて解析し、1:1のラングミュアモデルにフィッティングさせ、結合速度定数kon、解離速度定数koff、および解離平衡定数KDを算出した。
その結果、測定したすべての変異型タンパク質(M-PG09、M-PG10、M-PG11)において、ヒト免疫グロブリンのFc領域に対する結合性は、野生型のアミノ酸配列を有するコントロールタンパク質(M-PG01)に比べて同程度で、野生型と同等の速度論的特性を保持していることが明らかになった(図11、 表5)。
実施例13
本実施例においては、変異型タンパク質の熱安定性を評価した。円偏光二色性(CD)スペクトルは、タンパク質の二次構造の変化を鋭敏に反映する分光学的分析方法であることが知られている。CDスペクトルの強度に相当するモル楕円率を試料の温度を変化させながら観測することで、どの程度の温度で各々のプロテインG変異型タンパク質が変性するのかを明らかにすることができる。
単離精製した変異型タンパク質をそれぞれ15〜25μMの濃度で含む水溶液(50mMリン酸ナトリウム緩衝液、pH6.8)に調製した。変異型タンパク質の濃度は表5のモル吸光係数を用いて決定した。この試料溶液を円筒型セル(セル長0.1cm)に注入し、J805型円偏光二色性分光光度計(日本分光)を用いて、20℃の温度で測定波長を260nmから195nmに移動させCDスペクトルを得た。同じ試料を98℃に加熱、さらに98℃から20℃に冷却し260nmから195nmの円二色性スペクトルを得た。加熱後再冷却したスペクトルのモル楕円率は80%以上回復し、変異型タンパク質の立体構造の可逆性が確認された。
次いで、測定波長を222nmに固定し20℃から100℃に1℃/minの速度で昇温させてモル楕円率の経時変化を測定した。得られた熱融解曲線について二状態相転移モデルの理論式(有坂文雄 (2004) バイオサイエンスのための蛋白質科学入門、裳華房)を用いて解析し、変性温度Tm、およびTmにおける変性のエンタルピー変化ΔHmを決定した。その結果、測定したすべての変異型タンパク質(M-PG09、M-PG10、M-PG11)の熱安定性が、野生型のアミノ酸配列を有するコントロールタンパク質(M-PG01)に比べて、向上していることが明らかになった(図12、表5)。
実施例14
本実施例においては、プロテインG変異型タンパク質の変性剤に対する化学的安定性を評価した。すべての変異型タンパク質はトリプトファン残基を分子内にひとつ有し、トリプトファンから発せられる蛍光は変異型タンパク質の変性により大きく強度が変化する。したがって、変異型タンパク質の水溶液に変性剤である塩酸グアニジンを少しずつ添加しながらトリプトファンからの蛍光強度を観測することで、どの程度の濃度で各々の変異型タンパク質が変性するのかを明らかにすることができる。実際の測定は、塩酸グアニジンを含まないタンパク質溶液(A液)と高濃度の塩酸グアニジンを含むタンパク質溶液(B液)の二液を種々の割合で混合することで行われる。
まず、単離精製した変異型タンパク質を50mMのリン酸緩衝液(pH6.86)に溶解し、それぞれの最終濃度0.30〜0.33μMに調製し、A液を用意した。変異型タンパク質の濃度は表5のモル吸光係数を用いて決定した。一方、B液は、8.15M 塩酸グアニジン水溶液に500mMのリン酸緩衝液を9:1の比率で混ぜ、7.34 M 塩酸グアニジン/50mMリン酸緩衝液とした後、微量の1.0M NaOHでpHを6.86に合わせ、さらに最終濃度0.30〜0.33μMとなるように各変異型タンパク質を添加し、用意した。蛍光強度の測定は、自動滴定装置付FP-6500型分光蛍光光度計(日本分光)を用いて、測定温度を20℃、励起波長を295nmに蛍光波長を350 nmに固定して行った。変性過程の観測では、A液2.5mLを分光蛍光光度計の攪拌装置付恒温セルに入れたのち、120秒のインターバルで0.1mLのB液の注入/排出を25回繰り返し、その際の蛍光強度を経過時的に観測した。また、再生過程の観測では、B液2.5mLを分光蛍光光度計の攪拌装置付恒温セルに入れたのち、120秒のインターバルで0.1mLのA液の注入/排出を25回繰り返し、その際の蛍光強度を経過時的に観測した。
いずれの変異型タンパク質においても、変性過程と再生過程の蛍光強度データが一致したことから、用いた測定条件で十分に平衡状態に達していることが確かめられた。測定したデータは、二状態相転移モデルの理論式(有坂文雄(2004)バイオサイエンスのための蛋白質科学入門、裳華房)を用いて解析し、変性の自由エネルギー変化ΔGD H2Oと変性中点の塩酸グアニジン濃度c0.5を決定した。その結果、変異型タンパク質(M-PG10、M-PG11)の変性剤に対する化学的安定性が、野生型のアミノ酸配列を有するコントロールタンパク質(M-PG01)に比べて向上していることが明らかになった(図13、表5)。
実施例15
本実施例においては、変異型タンパク質の構造安定性を調べるために、タンパク質分解酵素キモトリプシンの消化に対する抵抗性を評価した。
変異型タンパク質は消化反応緩衝液(40mM Tris-HCl(pH8.0), 20mM CaCl2, 2mM NaOAc)に最終濃度75μMで調製し、次いで最終濃度7.5uMのキモトリプシンを添加した。25℃で0, 20, 40, 60, 120, 240分反応を行い、10μlずつサンプリングを行った。100mM PMSFを1μl加え反応を止め、Tricine-SDS-PAGEもしくはTricine-native-PAGE(16%T, 2.6%C, 100V, 100min)を行いCBB (G-250) 染色によりバンドを検出した。ゲル撮影装置(アトー,Printgraph)にて泳動像を撮影し、画像データについてソフトウエアImage J1.4.3.67を用いて解析を行った。まず画像のバックグラウンドを削除し(Rolling ball 50)、各レーンのバンドを認識させ、画像密度をプロットした。0分の結果を100%とし、反応時間におけるバンドの残存度を消化作用に対する抵抗性として数値化した。得られた残存度は時間に対して指数関数的に減少し、残存度の対数と時間が直線性を示すことから、キモトリプシンによる消化反応を擬一次反応と仮定することが妥当であることが示された。これより残存度の対数と時間の回帰分析を行い、各変異型タンパク質の分解半減期t0.5を求めた。
その結果、変異型タンパク質(M-PG10、M-PG11)は、野生型のアミノ酸配列を有するコントロールタンパク質(M-PG01)に比べ、タンパク質分解酵素に対する抵抗性が増加していることが明らかになった(図14、表5)。
プロセスA〜Cのフローチャートを示す図である。 プロセスD〜Hのプローチャートを示す図である。 各タンパク質における各アミノ酸残基間のコンタクト原子数を示す図である。 プロテインG・B1ドメインの局所コンタクト指数を示すグラフである。 プロテインG・B1ドメインの非局所コンタクト指数を示すグラフである。 プロテインG・B1ドメインの変異適正指数を示すグラフである。 プロテインG・B1ドメインの部分セグメント(43−51)の主鎖2面角を示す図である。 プロテインG・B1ドメインの部分セグメント(43−51)のPSSMを示す図である。 プロテインG・B1ドメインの各アミノ酸残基に対する置換アミノ酸の交換の好ましさ;pk値を示すグラフである。 プロテインG・B1ドメインの各アミノ酸残基の露出表面積比;Ri値を示すグラフである。 プロテインG変異型タンパク質の免疫グロブリンFc領域に対する結合性を試験した結果を示すグラフである。 プロテインG変異型タンパク質の熱安定性を試験した結果を示すグラフである。 プロテインG変異型タンパク質の変性剤に対する化学的安定性を試験した結果を示すグラフである。 プロテインG変異型タンパク質のタンパク質分解酵素に対する安定性を試験した結果を示すグラフである。

Claims (16)

  1. タンパク質の立体構造座標データを用いて、該タンパク質のアミノ酸配列上近傍のアミノ酸残基間の相互作用によって立体構造が安定化されている部分セグメントを探索し、該部分セグメントを変異導入領域として選定することを特徴とする、タンパク質の変位導入領域の選定方法。
  2. 変異導入領域が、以下の数式(1)、(2)及び(3)に基づき算出された局所コンタクト指数(Iloc)が、正の値を示すアミノ酸残基の連続する領域から選出されることを特徴とする、請求項1に記載のタンパク質の変異導入領域の選定方法。
    上記数式(1)中、ni,jはタンパク質中のアミノ酸残基iと同アミノ酸残基jの間のコンタクト原子数(i≠j)、Nはタンパク質分子の鎖長を表し、Cp,qはタンパク質分子内の水素原子を除く重原子pと重原子qの間のコンタクト数を表す。Cp,qは2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数を表し、dは0.3〜1.2 nmである。
    上記数式(2)中、Dloc kはタンパク質のk番目のアミノ酸残基の局所コンタクト数密度を表し、wはk番目のアミノ酸残基についての配列上近傍の範囲を規定するウィンドウ幅を表し、wLはk番目のアミノ酸残基の左側のウィンドウ幅、wRはk番目のアミノ酸残基の右側ウィンドウ幅をそれぞれ表す。wL、及びwRはそれぞれ1〜15の整数である。
    上記数式(3)中、Iloc kはタンパク質のk番目のアミノ酸残基の局所コンタクト指数を表し、μD loc及びσD locは、それぞれ以下の式で表され、μD locはタンパク質の全アミノ酸残基の局所コンタクト数密度(Dloc)の平均値、σD locはタンパク質の全アミノ酸残基の局所コンタクト数密度(Dloc)の標準偏差を表す。
  3. タンパク質の立体構造座標データを用いて、該タンパク質のアミノ酸配列上遠方のアミノ酸残基との相互作用が弱いアミノ酸残基を探索し、探索されたアミノ酸残基の中から変異対象部位のアミノ酸残基を選定することを特徴とする、タンパク質中の変異対象部位の選定方法。
  4. 変異対象部位のアミノ酸残基が、以下の数式(4)及び(5)に基づき算出される非局所コンタクト指数(Inl)が少なくとも0.1以上であるアミノ酸残基から選定されることを特徴とする、請求項3に記載のタンパク質中の変異対象部位の選定方法。
    上記数式(4)中、Nnl i はi番目のアミノ酸残基の非局所コンタクト原子数、Nはタンパク質分子の鎖長を表し、C’p’,qはアミノ酸残基iの側鎖の重原子p’とアミノ酸残基jの重原子qとの間のコンタクト数を表し、wLとwRは上記数式(2)で示したのと同様である。C'p,qは2つの重原子の中心間の距離が閾値d以内なら1、そうでなければ0となる二値変数を表し、dは上記数式(1)で示したのと同様である。
    上記数式(5)中、Inl i はi番目のアミノ酸残基の非局所コンタクト指数、Nnl i は上記数式(4)で示したのと同様であり、aは任意の定数を表す。
  5. 変異対象部位のアミノ酸残基が、以下の数式(6)で算出される変異適性指数(IM)が少なくとも0.1以上であるアミノ酸残基から選出されることを特徴とする、請求項3に記載のタンパク質中の変異対象部位の選定方法。
    上記数式(6)中、IM i はi番目のアミノ酸残基の変異適性指数を示し、Iloc iはタンパク質のi番目のアミノ酸残基の局所コンタクト指数を表しInl i はi番目のアミノ酸残基の非局所コンタクト指数を表す。
  6. タンパク質の変異対象部位のアミノ酸残基を置換する他のアミノ酸残基を選定する方法であって、該タンパク質の立体構造座標データを用いて、変異対象部位を含む部分セグメントの主鎖のコンフォメーションを特定し、該特定されたコンフォメーションを安定に形成するアミノ酸配列を決定し、該決定されたアミノ酸配列における上記変異対象部位と対応する位置の各アミノ酸残基を上記変異対象部位のアミノ酸残基を置換する他のアミノ酸残基として選定することを特徴とする、上記置換する他のアミノ酸残基の選定方法。
  7. タンパク質の変異対象部位を含む部分セグメントの主鎖のコンフォメーションと同様あるいは類似するコンフォメーションを探索し、探索されたコンフォメーションを形成するアミノ酸配列における上記変異対象部位と対応する位置の各アミノ酸残基の中から、出現頻度の高いアミノ酸残基を上記変異対象部位のアミノ酸残基として選定することを特徴とする、請求項6に記載の置換する他のアミノ酸残基の選定方法。
  8. タンパク質の変異対象部位のアミノ酸残基が、請求項1または2に記載の変異導入領域中のアミノ酸残基から選定されるか、あるいは請求項3〜5に記載のいずれかの方法により選定されたものであることを特徴とする、請求項6または7に記載の置換する他のアミノ酸残基の選定方法。
  9. タンパク質の変異対象部位を含む部分セグメントの主鎖2面角をタンパク質局所構造データベースProSegの検索ウィンドウに入力し、得られた位置特異的スコア行列(PSSM)のスコアに基づき、以下の数式(7)から算出される交換の好ましさ(p)を算出し、交換の好ましさ(p)が1.0以上であるアミノ酸残基を置換する他のアミノ酸残基として選定することを特徴とする、請求項6〜8に記載の置換する他のアミノ酸残基の選定方法。
    上記数式(7)中、pkは変位対象部位kのアミノ酸残基の交換の好ましさを表し、sPSSM k(original)は変異対象部位kの置換前のアミノ酸残基のスコア、sPSSM k(candidate)は変異対象部位kを置換する他のアミノ酸残基のスコアを表す。
  10. 以下の式(8)で算出される変異対象部位のアミノ酸残基の露出表面積比Rが、0.3以上になることを条件として、変異対象部位のアミノ酸残基の側鎖サイズより大きくなる側鎖サイズのアミノ酸残基を、置換する他のアミノ酸残基として選択することを特徴とする、請求項6〜9のいずれかに記載の置換する他のアミノ酸残基の選定方法。
    式8中、Riは変異対象部位iのアミノ酸残基の露出表面積比を表し、ASAFOLD,SIDE(i)はi番目のアミノ酸残基の側鎖の天然状態における露出表面積、ASAUNFOLD,SIDE(i)は変異対象部位iのアミノ酸残基の側鎖の変性状態における露出表面積をそれぞれ表す。
  11. タンパク質の変異対象部位のアミノ酸残基を、請求項1または2に記載の変異導入領域中のアミノ酸残基から選定するか、あるいは請求項3〜5に記載のいずれかの方法により選定し、該選定された変異対象部位のアミノ酸残基を、請求項6〜10のいずれかに記載の方法により選定された、他のアミノ酸残基により置換することを特徴とする、変異型タンパク質の製造方法。
  12. 請求項11に記載の方法により得られた変異型タンパク質。
  13. 以下の(a)〜(e)の変異を1以上有する変異型プロテインGのB1ドメインであることを特徴とする請求項12に記載の変異型タンパク質。
    (a)Asp36Glu
    (b)Asn37Leu
    (c)Asp47Pro
    (d)Ala48Lys
    (e)Ala48Glu
  14. 請求項12または13の記載の変異型タンパク質をコードする核酸。
  15. 請求項14の核酸を含有する組換えベクター。
  16. 請求項14の核酸または請求項15の組換えベクターを含む形質転換体。
JP2007272442A 2007-10-19 2007-10-19 安定な変異型タンパク質の製造方法 Expired - Fee Related JP5382675B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007272442A JP5382675B2 (ja) 2007-10-19 2007-10-19 安定な変異型タンパク質の製造方法
PCT/JP2008/068861 WO2009051226A1 (ja) 2007-10-19 2008-10-17 安定な変異型タンパク質の製造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007272442A JP5382675B2 (ja) 2007-10-19 2007-10-19 安定な変異型タンパク質の製造方法

Publications (2)

Publication Number Publication Date
JP2009095322A true JP2009095322A (ja) 2009-05-07
JP5382675B2 JP5382675B2 (ja) 2014-01-08

Family

ID=40567487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007272442A Expired - Fee Related JP5382675B2 (ja) 2007-10-19 2007-10-19 安定な変異型タンパク質の製造方法

Country Status (2)

Country Link
JP (1) JP5382675B2 (ja)
WO (1) WO2009051226A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013018880A1 (ja) 2011-08-04 2013-02-07 独立行政法人産業技術総合研究所 プロテインgの細胞膜外ドメイン変異体のタンデム型多量体から成る新規な改変型タンパク質
WO2014021240A1 (ja) 2012-08-03 2014-02-06 独立行政法人産業技術総合研究所 プロテインgの細胞膜外ドメイン変異体のタンデム型多量体から成るタンパク質を含む捕捉剤
WO2015050153A1 (ja) 2013-10-04 2015-04-09 独立行政法人産業技術総合研究所 免疫グロブリンG(IgG)のFc部分を有するタンパク質に対するアフィニティを有する複数のドメイン間をリンカーで結合させて成るタンパク質

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5312901A (en) * 1986-02-14 1994-05-17 Pharmacia Lkb Biotechnology Ab Cloned streptococcal genes encoding protein G and their use to construct recombinant microorganisms to produce protein G
WO1997026930A1 (fr) * 1996-01-25 1997-07-31 Kaneka Corporation Adsorbant pour immunoglobulines et complexes de celles-ci, procede et dispositif d'adsorption
JP2001184381A (ja) * 1999-12-24 2001-07-06 Kanegafuchi Chem Ind Co Ltd 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体
JP2004272867A (ja) * 2003-03-10 2004-09-30 Pro Device:Kk 蛋白質の二次構造安定化デザインソフトウエア
JP2005293296A (ja) * 2004-03-31 2005-10-20 Shionogi & Co Ltd 糖−タンパク質相互作用の評価方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5312901A (en) * 1986-02-14 1994-05-17 Pharmacia Lkb Biotechnology Ab Cloned streptococcal genes encoding protein G and their use to construct recombinant microorganisms to produce protein G
WO1997026930A1 (fr) * 1996-01-25 1997-07-31 Kaneka Corporation Adsorbant pour immunoglobulines et complexes de celles-ci, procede et dispositif d'adsorption
JP2001184381A (ja) * 1999-12-24 2001-07-06 Kanegafuchi Chem Ind Co Ltd 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体
JP2004272867A (ja) * 2003-03-10 2004-09-30 Pro Device:Kk 蛋白質の二次構造安定化デザインソフトウエア
JP2005293296A (ja) * 2004-03-31 2005-10-20 Shionogi & Co Ltd 糖−タンパク質相互作用の評価方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN7012002176; HONDA S. ET AL.: '10 residue folded peptide designed by segment statistics.' STRUCTURE vol. 12, no. 8, 2004, pages 1507 - 1518 *
JPN7012002177; HONDA S. ET AL.: 'Structural diversity of protein segments follows a power-law distribution.' BIOPHYS. J. vol. 91, 2006, pages 1213 - 1223 *
JPN7012002178; FAHNESTOCK S.R. ET AL.: 'Gene for an immunoglobulin-binding protein from a group G streptococcus.' J. BACTERIOL. vol. 167, no. 3, 1986, pages 870 - 880 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013018880A1 (ja) 2011-08-04 2013-02-07 独立行政法人産業技術総合研究所 プロテインgの細胞膜外ドメイン変異体のタンデム型多量体から成る新規な改変型タンパク質
JPWO2013018880A1 (ja) * 2011-08-04 2015-03-05 独立行政法人産業技術総合研究所 プロテインgの細胞膜外ドメイン変異体のタンデム型多量体から成る新規な改変型タンパク質
WO2014021240A1 (ja) 2012-08-03 2014-02-06 独立行政法人産業技術総合研究所 プロテインgの細胞膜外ドメイン変異体のタンデム型多量体から成るタンパク質を含む捕捉剤
WO2015050153A1 (ja) 2013-10-04 2015-04-09 独立行政法人産業技術総合研究所 免疫グロブリンG(IgG)のFc部分を有するタンパク質に対するアフィニティを有する複数のドメイン間をリンカーで結合させて成るタンパク質

Also Published As

Publication number Publication date
WO2009051226A1 (ja) 2009-04-23
JP5382675B2 (ja) 2014-01-08

Similar Documents

Publication Publication Date Title
Bhardwaj et al. Accurate de novo design of hyperstable constrained peptides
Rouget et al. Size and sequence and the volume change of protein folding
Joachimiak et al. Computational design of a new hydrogen bond network and at least a 300-fold specificity switch at a protein− protein interface
Silva et al. Crystal structure of the thermostable archaeal intron-encoded endonuclease I-DmoI
Buck et al. Computational methods to predict therapeutic protein aggregation
Daughdrill et al. Dynamic behavior of an intrinsically unstructured linker domain is conserved in the face of negligible amino acid sequence conservation
Petukhov et al. Position dependence of non-polar amino acid intrinsic helical propensities
Wiederstein et al. Protein sequence randomization: efficient estimation of protein stability using knowledge-based potentials
Ohage et al. β‐Turn propensities as paradigms for the analysis of structural motifs to engineer protein stability
Ezzeldin et al. Modeling of the major gas vesicle protein, GvpA: from protein sequence to vesicle wall structure
Swanson et al. Structural basis for monoubiquitin recognition by the Ede1 UBA domain
Jasnovidova et al. Structure and dynamics of the RNAPII CTDsome with Rtt103
Romero-Romero et al. The stability landscape of de novo TIM barrels explored by a modular design approach
Danciulescu et al. Structural stability of wild type and mutated α-keratin fragments: Molecular dynamics and free energy calculations
JP5382675B2 (ja) 安定な変異型タンパク質の製造方法
JP5278940B2 (ja) 安定な抗体結合性タンパク質
Nagibina et al. Intrinsic disorder-based design of stable globular proteins
Doyle et al. De novo design of knotted tandem repeat proteins
Hytönen et al. Avidin related protein 2 shows unique structural and functional features among the avidin protein family
Smith et al. Structural insights into the evolution of a non-biological protein: importance of surface residues in protein fold optimization
Voordijk et al. Molecular dynamics simulations highlight mobile regions in proteins: a novel suggestion for converting a murine VH domain into a more tractable species
Hooda Physicochemical, Functional and structural characterization of wheat germin using in silico methods
Wunderlich et al. Optimization of the Gβ1 domain by computational design and by in vitro evolution: structural and energetic basis of stabilization
Pukáncsik et al. Secondary structure prediction of protein constructs using random incremental truncation and vacuum-ultraviolet CD spectroscopy
Zou et al. Local interactions that contribute minimal frustration determine foldability

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120612

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130312

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130612

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130725

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130925

R150 Certificate of patent or registration of utility model

Ref document number: 5382675

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees