以下に添付図面を参照して、特性予測プログラム、特性予測装置、および特性予測方法の好適な実施の形態を詳細に説明する。まず、この特性予測の骨子について説明する。本実施の形態の特性予測では、アミノ酸残基の抗原決定性、柔軟性、疎水性/親水性および極性などの各種特性に関する予測をおこなう。
抗原決定性とは、既存予測手法による抗原決定基のなりやすさをあらわす特性である。たとえば、EMINI法は、タンパク質の表面存在確率に注目して作成された抗原決定性予測手法である。また、Hoop−Woods法は、親水性より内外予測に注目して作成された抗原決定性予測手法である。
柔軟性とは、アミノ酸残基の硬軟をあらわす特性である。抗体は、抗原となるタンパク質のαへリックスやβストランドといった硬い構造を持った部分よりもターンやコイルといった軟らかな構造を持った攻撃しやすい部分に結合しやすいという傾向がある。したがって、アミノ酸残基が軟らかいほど抗原決定基に選ばれやすいということになる。
疎水性/親水性とは、アミノ酸残基と水分子との親和力の高さをあらわす特性である。抗体は、抗原となるタンパク質においてより親水性が高い部分に結合しやすいという傾向がある。したがって、アミノ酸残基の親水性が高いほど抗原決定基に選ばれやすいということになる。
極性とは、アミノ酸残基の荷電性に着目した特性であり、電荷アミノ酸残基、極性アミノ酸残基、非極性アミノ酸残基の3種類に分類することができる。電荷アミノ酸残基とは、正電荷または負電荷を有するR基を持つアミノ酸残基である。極性アミノ酸残基とは、極性だが電荷のないアミノ酸である。非極性アミノ酸残基とは、疎水性のR基を持つアミノ酸残基である。抗体は、抗原となるタンパク質において帯電しているアミノ酸残基ほど結合しやすいという傾向がある。したがって、電荷アミノ酸残基、極性アミノ酸残基、非極性アミノ酸残基の順に、抗原決定基に選ばれやすいということになる。
これら各種特性において、従来では、ターゲットとなる目的アミノ酸残基(以下、「ターゲット残基」という)を中心とした配置位置が連続する所定数の一連のアミノ酸残基に着目して特性予測をおこなっていた。
たとえば、アミノ酸残基が100個配列されたアミノ酸配列において、配列位置が50番目のアミノ酸残基をターゲット残基としてその特性を予測する場合、所定数を7個とすると、前後3個ずつ、すなわち47番目〜53番目のアミノ酸残基が選ばれることとなる。そして、これらのアミノ酸残基の特性指標値を読み出し、特性予測手法の公式に与えることで、ターゲット残基(50番目のアミノ酸残基)の特性予測値が算出される。
一方で、アミノ酸配列のN末端またはその近傍(以下、「N末端部位」と称す。)やC末端またはその近傍(以下、「C末端部位」と称す。)にターゲット残基が配置されている場合、ターゲット残基を中心とした所定数のアミノ酸残基を特定できない場合がある。
たとえば、上記のアミノ酸配列の例で説明すると、所定数が7個である場合、前後3個ずつのアミノ酸残基が必要となるが、配列位置が2番目となるN末端部位のアミノ酸残基をターゲット残基とする場合、ターゲット残基を中心とする7個のアミノ酸残基を選ぶことができず、特性予測手法の計算式に与えられない。これにより、C末端部位では計算不能に陥ることになる。N末端近傍についても同様である。
本実施の形態では、N末端部位およびC末端部位にターゲット残基が配置されている場合でも、N末端部位およびC末端部位での配置を調整することで、N末端部位およびC末端部位を含む全配列位置において同一の特性予測手法で特性予測をおこなう技術である。以下、特性ごとのN末端部位およびC末端部位の調整内容について説明する。
図1は、抗原決定性予測をおこなう場合のN末端部位およびC末端部位の調整内容を示す説明図である。図1(図2でも同様)中、(A),(B)はN末端部位を示しており、(C)〜(E)はC末端部位を示している。また、(A)〜(E)において、丸い図形はアミノ酸残基を示しており、内部のアルファベットによりその種類を特定している。また、内部にハッチングが施されているアミノ酸残基はターゲット残基である。また、アミノ酸残基の直上の数字は配列位置j(0≦j≦m、mはC末端のアミノ酸残基の配列番号)を示す数字である。なお、配列位置jのアミノ酸残基をAjと称す。たとえば、(A)において、配列位置j=1のアミノ酸残基“W”はアミノ酸残基A1となる。
EMINI法やHoop−Woods法などの抗原決定性予測手法では、ターゲット残基を中心として配列位置が連続する6個のアミノ酸残基が選ばれる。6個なので、厳密には6個のうちN末端側から3番目(4番目でもよい)のアミノ酸残基が中心、すなわち、ターゲット残基となる。
(A)では、N末端部位(A0〜A4)中、ターゲット残基はA1であるため、先行するアミノ酸残基が1個不足する。このため、アミノ酸残基A1をアミノ酸残基A-1として割り当てることで、6個のアミノ酸残基A-1〜A4を選ぶことができる。
(B)では、N末端部位(A0〜A3)中、ターゲット残基はA0であるため、先行するアミノ酸残基が2個不足する。このため、アミノ酸残基A1をアミノ酸残基A-1として割り当て、アミノ酸残基A0をアミノ酸残基A-2として割り当てることで、6個のアミノ酸残基A-2〜A3を選ぶことができる。
(C)では、C末端部位(Am-4〜Am)中、ターゲット残基はAm-2であるため、後続のアミノ酸残基が1個不足する。このため、アミノ酸残基Am-2をアミノ酸残基Am+1として割り当てることで、6個のアミノ酸残基Am-4〜Am+1を選ぶことができる。
(D)では、C末端部位(Am-3〜Am)中、ターゲット残基はAm-1であるため、後続のアミノ酸残基が2個不足する。このため、アミノ酸残基Am-1をアミノ酸残基Am+1として割り当て、アミノ酸残基Amをアミノ酸残基Am+2として割り当てることで、6個のアミノ酸残基Am-3〜Am+2を選ぶことができる。
(E)では、C末端部位(Am-2〜Am)中、ターゲット残基はAmであるため、後続のアミノ酸残基が3個不足する。このため、アミノ酸残基Amをアミノ酸残基Am+3として割り当て、アミノ酸残基Am-1をアミノ酸残基Am+2として割り当て、アミノ酸残基Am-2をアミノ酸残基Am+1として割り当てることで、6個のアミノ酸残基Am-2〜Am+3を選ぶことができる。
このように、抗原決定性予測においては、N末端では、末端基の前にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、どのアミノ酸残基でもよいが、N末端部位と似た性質にするのが望ましいため、上記(A),(B)で示したように、末端基の前にはターゲット残基と同一のアミノ酸残基を割り当てることが好ましい。また、それでも抗原決定性予測手法の計算式に不足する場合には、上記(B)で示したように、N末端部位の中から選ぶこととしてもよい。この場合には、配列位置がよりターゲット残基に近いアミノ酸残基を選ぶほうが上記観点から好ましい。
同様に、C末端では、末端基の後にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、どのアミノ酸残基でもよいが、C末端部位と似た性質にするのが望ましいため、上記(C)〜(E)で示したように、末端基の後にはターゲット残基と同一のアミノ酸残基を割り当てることが好ましい。また、それでも抗原決定性予測手法の計算式に不足する場合には、上記(D),(E)で示したように、C末端部位の中から選ぶこととしてもよい。この場合には、配列位置がよりターゲット残基に近いアミノ酸残基を選ぶほうが上記観点から好ましい。
図2は、柔軟性予測、疎水性/親水性予測、または極性予測をおこなう場合のN末端部位およびC末端部位の調整内容を示す説明図である。図2中、(A)〜(C)はN末端部位を示しており、(D)〜(F)はC末端部位を示している。
柔軟性予測、疎水性/親水性予測、または極性予測などの予測手法では、ターゲット残基を中心として配列位置が連続する7個のアミノ酸残基が選ばれる。7個なので、N末端側から4番目のアミノ酸残基が中心、すなわち、ターゲット残基となる。
(A)では、N末端部位(A0〜A5)中、ターゲット残基はA2であるため、先行するアミノ酸残基が1個不足する。このため、アミノ酸残基A5をアミノ酸残基A-1として割り当てることで、7個のアミノ酸残基A-1〜A5を選ぶことができる。
(B)では、N末端部位(A0〜A4)中、ターゲット残基はA1であるため、先行するアミノ酸残基が2個不足する。このため、アミノ酸残基A3をアミノ酸残基A-1として割り当て、アミノ酸残基A4をアミノ酸残基A-2として割り当てることで、7個のアミノ酸残基A-2〜A4を選ぶことができる。
(C)では、N末端部位(A0〜A3)中、ターゲット残基はA0であるため、先行するアミノ酸残基が3個不足する。このため、アミノ酸残基A1をアミノ酸残基A-1として割り当て、アミノ酸残基A2をアミノ酸残基A-2として割り当て、アミノ酸残基A3をアミノ酸残基A-3として割り当てることで、7個のアミノ酸残基A-3〜A3を選ぶことができる。
(D)では、C末端部位(Am-5〜Am)中、ターゲット残基はAm-2であるため、後続のアミノ酸残基が1個不足する。このため、アミノ酸残基Am-5をアミノ酸残基Am+1として割り当てることで、7個のアミノ酸残基Am-5〜Am+1を選ぶことができる。
(E)では、C末端部位(Am-4〜Am)中、ターゲット残基はAm-1であるため、後続のアミノ酸残基が2個不足する。このため、アミノ酸残基Am-3をアミノ酸残基Am+1として割り当て、アミノ酸残基Am-4をアミノ酸残基Am+2として割り当てることで、7個のアミノ酸残基Am-4〜Am+2を選ぶことができる。
(F)では、C末端部位(Am-3〜Am)中、ターゲット残基はAmであるため、後続のアミノ酸残基が3個不足する。このため、アミノ酸残基Am-1をアミノ酸残基Am+1として割り当て、アミノ酸残基Am-2をアミノ酸残基Am+2として割り当て、アミノ酸残基Am-3をアミノ酸残基Am+3として割り当てることで、7個のアミノ酸残基Am-3〜Am+3を選ぶことができる。
このように、柔軟性予測、疎水性/親水性予測、または極性予測においては、N末端では、末端基の前にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、N末端部位内のアミノ酸残基であればどのアミノ酸残基でもよいが、ターゲット残基の影響を受けにくい残基を追加するのが望ましいため、上記(A)〜(C)で示したように、末端基の前にはターゲット残基から離れたアミノ酸残基を割り当てることが好ましい。また、それでも柔軟性予測、疎水性/親水性予測、または極性予測の計算式に不足する場合には、上記(B),(C)で示したように、N末端部位の中から選ぶこととしてもよい。この場合には、ターゲット残基は選ばないほうが上記観点から好ましい。
同様に、C末端では、末端基の後にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、C末端部位内のアミノ酸残基であればどのアミノ酸残基でもよいが、ターゲット残基の影響を受けにくい残基を追加するのが望ましいため、上記(D)〜(F)で示したように、末端基の後にはターゲット残基から離れたアミノ酸残基を割り当てることが好ましい。また、それでも柔軟性予測、疎水性/親水性予測、または極性予測の計算式に不足する場合には、上記(E),(F)で示したように、C末端部位の中から選ぶこととしてもよい。この場合には、ターゲット残基は選ばないほうが上記観点から好ましい。
(特性予測装置のハードウェア構成)
つぎに、特性予測装置のハードウェア構成について説明する。図3は、特性予測装置のハードウェア構成を示す説明図である。図3において、特性予測装置300は、コンピュータ本体310と、入力装置320と、出力装置330と、から構成されており、不図示のルータやモデムを介してLAN,WANやインターネットなどのネットワーク340に接続可能である。
コンピュータ本体310は、CPU,記憶部,インターフェースを有する。CPUは、特性予測装置300の全体の制御を司る。記憶部は、ROM,RAM,HD,光ディスク311,フラッシュメモリから構成される。記憶部はCPUのワークエリアとして使用される。
また、記憶部には各種プログラムが格納されており、CPUからの命令に応じてロードされる。HDおよび光ディスク311はディスクドライブによりデータのリード/ライトが制御される。また、光ディスク311およびフラッシュメモリはコンピュータ本体310に対し着脱自在である。インターフェースは、入力装置320からの入力、出力装置330への出力、ネットワーク340に対する送受信の制御をおこなう。
また、入力装置320としては、キーボード321、マウス322、スキャナ323などがある。キーボード321は、文字、数字、各種指示などの入力のためのキーを備え、データの入力をおこなう。また、タッチパネル式であってもよい。マウス322は、カーソルの移動や範囲選択、あるいはウィンドウの移動やサイズの変更などをおこなう。スキャナ323は、画像を光学的に読み取る。読み取られた画像は画像データとして取り込まれ、コンピュータ本体310内のメモリに格納される。なお、スキャナ323にOCR機能を持たせてもよい。
また、出力装置330としては、ディスプレイ331、スピーカ332、プリンタ333などがある。ディスプレイ331は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。また、スピーカ332は、効果音や読み上げ音などの音声を出力する。また、プリンタ333は、画像データや文書データを印刷する。
(特性予測装置の機能的構成)
つぎに、特性予測装置の機能的構成について説明する。図4は、この発明の実施の形態にかかる特性予測装置の機能的構成を示すブロック図である。図4において、特性予測装置300は、取得部401と、判断部402と、追加部403と、予測値算出部404と、変換部405と、規格化部406と、複合予測値算出部407と、決定部408と、出力部409と、から構成されている。
上述した各機能401〜409は、記憶部に格納された当該機能に関するプログラムをCPUに実行させることにより、当該機能を実現することができる。また、各機能401〜409からの出力データは記憶部に保持される。また、図4中矢印で示した接続先の機能は、接続元の機能からの出力データをメモリから読み込んで、当該機能に関するプログラムをCPUに実行させるものとする。
まず、取得部401は、タンパク質に関するデータを取得する機能を有する。具体的には、たとえば、任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する。ここで、一次構造配列データについて説明する。
図5は、アミノ酸配列の一次構造配列データの一例を示す説明図である。一次構造配列データAS1は、アミノ酸配列の一次構造をあらわした文字列データであり、20種類のアミノ酸残基の一次構造に関する記号(S,Y,I,Jなど)を配列位置j(j=0〜m)順にm+1個配列したデータである。アミノ酸残基Ajの記号に対応する名称については、図6などに示されているとおりである。
一次構造配列データAS1の取得方法としては、ユーザ操作により一次構造配列データAS1を特性予測装置300に与えてもよく、また、外部サーバから一次構造配列データAS1を受信することとしてもよい。
また、図2において、判断部402は、取得部401によって取得された一次構造配列データAS1の中から選ばれたターゲット残基が、所定の特性予測手法で予測不能な一次構造配列データAS1の両末端部位のうち、いずれの末端部位に含まれているかを判断する機能を有する。
ここで、所定の特性予測手法とは、タンパク質の特性を予測する計算手法であり、EMINI法やHoop−Woods法などの抗原決定性予測手法、Karplus−Schulz法などの柔軟性予測手法、疎水性/親水性予測手法、極性予測手法などがある。いずれの手法も、配列位置jが連続する所定数の一連のアミノ酸残基を用いる。たとえば、EMINI法やHoop−Woods法などの抗原決定性予測手法では6個、Karplus−Schulz法などの柔軟性予測手法、疎水性/親水性予測手法、極性予測手法では7個という固定数である。
この判断部402は、具体的には、図1および図2で示したアミノ酸残基の追加をおこなう必要があるか否かを判断する。もし、ターゲット残基がいずれの末端部位にも含まれていない場合、ターゲット残基はアミノ酸配列中、両末端部位間の中間部に配置されていることとなり、通常どおり、所定の特性予測手法によって予測値を算出することができる。一方、いずれかの末端部位に含まれている場合、図1および図2で示したアミノ酸残基の追加をおこなう必要がある。
また、図4において、追加部403は、判断部402によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、判断部402によって判断された末端部位を、所定数と同数のアミノ酸残基列にする機能を有する。具体的には、図1および図2に示したように、各特性予測手法の所定数となるように、末端基に追加する。
また、予測値算出部404は、追加部403によって得られたアミノ酸残基列を用いて、各特性予測手法により、ターゲット残基の特性予測値を算出する機能を有する。ここで、アミノ酸残基列とは、追加後の一連のアミノ酸残基であり、たとえば、図1に示した(A)の6個のアミノ酸残基A-1〜A4、(B)の6個のアミノ酸残基A-2〜A3、(C)の6個のアミノ酸残基Am-4〜Am+1、(D)の6個のアミノ酸残基Am-3〜Am+2、(E)の6個のアミノ酸残基Am-2〜Am+3、図2に示した(A)の7個のアミノ酸残基A-1〜A5、(B)の7個のアミノ酸残基A-2〜A4、(C)の7個のアミノ酸残基A-3〜A3、(D)の7個のアミノ酸残基Am-5〜Am+1、(E)の7個のアミノ酸残基Am-4〜Am+2、(F)の7個のアミノ酸残基Am-3〜Am+3が該当する。
特性予測値の算出手法はその特性予測手法ごとに異なるため、以下、特性予測手法ごとに説明する。まず、抗原決定性予測では、アミノ酸残基をあらわす一次構造データからその抗原決定性指標値を特定する必要がある。
図6は、一次構造データと抗原決定性指標値との変換テーブルを示す説明図である。この変換テーブル600は、EMINI法を適用する場合の変換テーブルである。抗原決定性指標値は、0.0〜1.0の間の値をとる。予測値算出部404は、この変換テーブル600を参照して、アミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値を読み出す。読み出された抗原決定性指標値は、下記式(1)に代入される。
上記式(1)はEMINI法による抗原決定性予測値の算出式であり、各抗原決定性指標値の相乗平均をとる。Sajは、ターゲット残基であるアミノ酸残基Ajの抗原決定性予測値であり、σaj-3+iは、アミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値である。このアミノ酸残基列は、追加部403による追加後のアミノ酸残基列でもよく、追加部403による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ajがいずれの配置位置jであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。
また、変換テーブル600を参照すると、たとえば、図1の(A)の6個のアミノ酸残基A-1〜A4では、A-1が“W”、A0が“Q”、A1が“W”、A2が“R”、A3が“D”、A4が“G”であるため、A-1の抗原決定性指標値σa-1は「0.84」、A0の抗原決定性指標値σa0は「0.36」、A1の抗原決定性指標値σa1は「0.84」、A2の抗原決定性指標値σa2は「0.84」、A3の抗原決定性指標値σa3は「0.51」、A4の抗原決定性指標値σa4は「0.40」となる。これらの抗原決定性指標値σa-1〜σa4を式(1)に与えることで、ターゲット残基Ajの抗原決定性予測値Sajを算出することができる。
また、Hoop−Woods法を用いる場合は、上記式(1)のかわりに下記式(2)を用いる。
上記式(2)はHoop−Woods法による抗原決定性予測値の算出式であり、各抗原決定性指標値の相加平均をとる。なお、Hoop−Woods法を用いる場合は、図6に示した変換テーブルにかえて、図7の変換テーブル700を用いる。図7は、Hoop−Woods法を適用する場合の一次構造データと抗原決定性指標値との変換テーブルを示す説明図である。
また、予測値算出部404は、特性予測のうちKarplus−Schulz法などの柔軟性予測手法をおこなう場合、図8の変換テーブルを用いる。図8は、柔軟性予測に関する変換テーブルを示す説明図である。図8の変換テーブル800では、アミノ酸残基Ajごとに、その硬軟と3種類の柔軟性指標値B0〜B2が対応付けられている。
柔軟性予測では、アミノ酸残基列を構成するアミノ酸残基ごとに、各アミノ酸残基とその前後に配置されている隣接アミノ酸残基の硬軟を調べる。この前後の隣接アミノ酸残基の硬軟の組み合わせにより、変換テーブル800から読み出される柔軟性指標値B0〜B2が特定される。柔軟性指標値B0〜B2のうち、B0が最も硬くB2が最も軟らかい。B1は、その中間である。
図9は、隣接アミノ酸残基の硬軟の組み合わせを示す説明図である。図9において、(A)は、アミノ酸残基Akの前後に配置される隣接アミノ酸残基Ak-1,Ak+1がともに“硬”である配列であり、(B)および(C)は、隣接アミノ酸残基Ak-1,Ak+1のうち一方が“硬”で他方が“軟”である配列であり、(D)は、隣接アミノ酸残基Ak-1,Ak+1がともに“軟”である配列である。
(A)の配列では、アミノ酸残基Akの柔軟性指標値はB0となる。(B)および(C)の配列では、アミノ酸残基Akの柔軟性指標値はB1となる。(D)の配列では、アミノ酸残基Akの柔軟性指標値はB2となる。このように、隣接アミノ酸残基Ak-1,Ak+1の硬軟によりアミノ酸残基Akの柔軟性指標値が変動する。これにより、ターゲット残基の柔軟性指標値をより現実的に算出することができる。この柔軟性予測では、下記式(3)により、ターゲット残基の柔軟性指標値を算出する。
上記式(3)はKarplus−Schulz法による柔軟性予測値の算出式であり、各柔軟性指標値の相加平均をとる。Sbjは、ターゲット残基であるアミノ酸残基Ajの柔軟性予測値であり、σbj-3〜σbj+3は、アミノ酸残基列を構成する各アミノ酸残基Aj-3〜Aj+3の柔軟性指標値である。
柔軟性指標値σbj-3〜σbj+3はアミノ酸残基ごとに図8の変換テーブル800に示したB0〜B2から選ばれた値となる。また、このアミノ酸残基列は、追加部403による追加後のアミノ酸残基列でもよく、追加部403による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ajがいずれの配置位置jであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。
また、予測値算出部404は、特性予測のうちKyte−Doolittle法などの疎水性予測手法をおこなう場合、図10の変換テーブルを用いる。図10は、疎水性予測に関する変換テーブルを示す説明図である。図10に示した変換テーブル1000では、アミノ酸残基Ajごとに疎水性指標値が割り当てられている。図10では、疎水性指標値の数値範囲は、−4.5〜4.5の数値をとる。数値の高さが疎水性をあらわしている。
予測値算出部404では、この変換テーブル1000を参照して、アミノ酸残基列を構成する各アミノ酸残基の疎水性指標値を読み出す。読み出された抗原決定性指標値は、下記式(4)に代入される。
上記式(4)はKyte−Doolittle法による疎水性予測値の算出式であり、各疎水性指標値の相加平均をとる。Scjは、ターゲット残基であるアミノ酸残基Ajの疎水性予測値であり、σcj-4+iは、アミノ酸残基列を構成する各アミノ酸残基の疎水性指標値である。
このアミノ酸残基列は、追加部403による追加後のアミノ酸残基列でもよく、追加部403による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ajがいずれの配置位置jであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。なお、ここで求められた特性予測値は、親水性予測値ではなく、疎水性予測値Scjである。疎水性予測値Scjから親水性予測値の変換は、後述する変換部405により実行される。
また、予測値算出部404は、特性予測のうち極性予測手法をおこなう場合、図11の変換テーブルを用いる。図11は、極性予測に関する変換テーブルを示す説明図である。図11に示した変換テーブル1100では、アミノ酸残基ごとに極性指標値が割り当てられている。
図11では、極性指標値が「0.0」である場合、そのアミノ酸残基は非極性アミノ酸残基であることを示している。また、極性指標値が「0.5」である場合、そのアミノ酸残基は極性アミノ酸残基であることを示している。さらに、極性指標値が「1.0」である場合、そのアミノ酸残基は荷電アミノ酸残基であることを示している。
予測値算出部404は、この変換テーブル1100を参照して、アミノ酸残基列を構成する各アミノ酸残基の極性指標値を読み出す。読み出された極性指標値は、下記式(5)に代入される。
上記式(5)は極性予測値の算出式であり、各極性指標値の相加平均をとる。Sdjは、ターゲット残基であるアミノ酸残基Ajの疎水性予測値であり、σdj-4+iは、アミノ酸残基列を構成する各アミノ酸残基の極性指標値である。このアミノ酸残基列は、追加部403による追加後のアミノ酸残基列でもよく、追加部403による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ajがいずれの配置位置jであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。なお、算出された各予測値Saj,Sbj,Sdjは処理結果410として保持される。一方、疎水性予測値Scjは変換部405に送られる。
また、図4において、変換部405は、予測値算出部404によって算出された疎水性予測値Scjを親水性予測値に変換する機能を有する。具体的には、たとえば、疎水性予測値Scjを規格化し、そのインバースをとることにより変換する。たとえば、アミノ酸残基Ajの疎水性予測値Scjについては、規格化パラメータFcは、下記式(6)によってあらわすことができる。なお、Sc(max)は疎水性予測値Scjの最大値であり、Sc(min)は疎水性予測値Scjの最小値である。
Fc=1.0/{Sc(max)−Sc(min)}・・・・・・・・・・・・・(6)
そして、規格化された疎水性予測値をPcjとすると、疎水性予測値Pcjは、下記式(7)によってあらわすことができる。この式(7)により疎水性予測値Scjを、数値範囲が0≦Pcj≦1となる疎水性予測値Pcjに規格化することができる。
Pcj={Scj−Sc(min)}×Fc・・・・・・・・・・・・・・・・・(7)
そして、変換部405では、インバース処理により、規格化された疎水性予測値Pcjを親水性予測値Hjに変換する。疎水性予測値Pcjは、数値範囲が0≦Pcj≦1として規格化されているため、下記式(8)により、規格化された親水性予測値Hjに変換する。この親水性予測値Hjは処理結果410として保持される。
Hj=1−Pcj・・・・・・・・・・・・・・・・・・・・・・・・・・・・・(8)
また、規格化部406は、処理結果410である各予測値Saj,Sbj,Sdjを規格化する機能を有する。親水性予測値Hjは規格化された疎水性予測値Pcjのインバース処理結果であるため、すでに規格化済みである。この規格化部406は、後述する複合予測値算出部407による複合予測値を算出する場合に、各予測値Saj,Sbj,Sdjを同一の尺度に統一するためにおこなう処理である。
たとえば、抗原決定性予測値Sajについては、規格化パラメータFaは、下記式(9)によってあらわすことができる。なお、Sa(max)は抗原決定性予測値Sajの最大値であり、Sa(min)は抗原決定性予測値Sajの最小値である。
Fa=1.0/{Sa(max)−Sa(min)}・・・・・・・・・・・・・(9)
そして、規格化された抗原決定性予測値をPajとすると、抗原決定性予測値Pajは、下記式(10)によってあらわすことができる。この式(10)により抗原決定性予測値Sajを、数値範囲が0≦Paj≦1となる抗原決定性予測値Pajに規格化することができる。
Paj={Saj−Sa(min)}×Fa・・・・・・・・・・・・・・・・(10)
同様に、たとえば、柔軟性予測値Sbjについては、規格化パラメータFbは、下記式(11)によってあらわすことができる。なお、Sb(max)は柔軟性予測値Sbjの最大値であり、Sb(min)は柔軟性予測値Sbjの最小値である。
Fb=1.0/{Sb(max)−Sb(min)}・・・・・・・・・・・・(11)
そして、規格化された柔軟性予測値をPbjとすると、柔軟性予測値Pbjは、下記式(12)によってあらわすことができる。この式(12)により柔軟性予測値Sbjを、数値範囲が0≦Pbj≦1となる柔軟性予測値をPbjに規格化することができる。
Pbj={Sbj−Sb(min)}×Fb・・・・・・・・・・・・・・・・(12)
また、たとえば、極性予測値Sdjについては、規格化パラメータFdは、下記式(13)によってあらわすことができる。なお、Sd(max)は極性予測値Sdjの最大値であり、Sd(min)は極性予測値Sdjの最小値である。
Fd=1.0/{Sd(max)−Sd(min)}・・・・・・・・・・・・(13)
そして、規格化された極性予測値をPdjとすると、極性予測値Pdjは、下記式(14)によってあらわすことができる。この式(14)により極性予測値Sdjを、数値範囲が0≦Pdj≦1となる極性予測値Pdjに規格化することができる。
Pdj={Sdj−Sd(min)}×Fd・・・・・・・・・・・・・・・・(14)
また、複合予測値算出部407は、同一配列番号jのアミノ酸残基Ajについての複数種類の規格化された予測値Paj、Pbj、Hj、Pdjから複合予測値を算出する。具体的には、たとえば、抗原決定性予測と柔軟性予測とにより抗原決定基予測をおこなう場合、同一配列番号jのアミノ酸残基Ajについて、抗原決定性予測値Pajと柔軟性予測値Pbjとを乗算することにより、抗原決定性予測値Pajと柔軟性予測値Pbjとの複合予測値を算出する。
このように、複数種類の規格化された予測値Paj、Pbj、Hj、Pdjの中から選ばれた予測値の組み合わせを乗算することにより複合予測値を算出することができる。たとえば、上記のほかに、
・抗原決定性予測値Pajと親水性予測値Hjとの複合予測値、
・抗原決定性予測値Pajと極性予測値Pdjとの複合予測値、
・抗原決定性予測値Pajと柔軟性予測値Pbjと親水性予測値Hjとの複合予測値、
・抗原決定性予測値Pajと柔軟性予測値Pbjと極性予測値Pdjとの複合予測値、
・抗原決定性予測値Pajと柔軟性予測値Pbjと親水性予測値Hjと極性予測値Pdjとの複合予測値、
・柔軟性予測値Pbjと親水性予測値Hjとの複合予測値、
・柔軟性予測値Pbjと極性予測値Pdjとの複合予測値、
・柔軟性予測値Pbjと親水性予測値Hjと極性予測値Pdjとの複合予測値、
・親水性予測値Hjと極性予測値Pdjとの複合予測値
を算出することができる。
また、複合予測値の算出の際、各特性に応じた寄与率を与えることとしてもよい。たとえば、抗原決定性予測値Pajの重み値をwaとし、柔軟性予測値Pbjの重み値をwbとし、親水性予測値Hjの重み値をwcとし、極性予測値Pdjの重み値をwdとした場合、ある特性予測値に対する寄与率CRxは、下記式(15)によってあらわすことができる。
CRx=〔wx/(wa+wb+wc+wd)〕×100・・・・・・・・・(15)
ただし、xはx=a,b,c,dのいずれかをとる。aは抗原決定性、bは柔軟性、cは親水性、dは極性をあらわす。なお、複合予測で適用されない特性がある場合は、上記式(15)から除かれる。たとえば、抗原決定性、柔軟性および親水性の複合予測値を算出する場合には、寄与率CRxは下記式(16)のとおりである。
CRx=〔wx/(wa+wb+wc)〕×100・・・・・・・・・・・・(16)
ただし、xはx=a,b,cのいずれかをとる。
また、寄与率CRxを用いた場合の抗原決定性予測値Pajと柔軟性予測値Pbjと親水性予測値Hjと極性予測値Pdjとの複合予測値Pabcjは、下記式(17)によりあらわすことができる。
Pabcdj=CRa×Paj×CRb×Pbj×CRc×Hj×CRd×Pdj
・・・・・・(17)
また、決定部408は、各予測値に基づいて、アミノ酸残基Ajを抗原決定基に決定する。具体的には、たとえば、抗原決定性予測値Paj(またはSaj)についてしきい値を設定しておき、抗原決定性予測値Paj(またはSaj)がしきい値以上であれば、アミノ酸残基Ajを抗原決定基に決定し、しきい値未満であれば、抗原決定基に決定しない。柔軟性予測値Pbj(またはSbj)、親水性予測値Hj、極性予測値Pdj(またはSdj)についても同様である。
また、複合予測値算出部407によって算出された複合予測値についても同様である。具体的には、たとえば、アミノ酸残基Ajの複合予測値がしきい値以上であれば、アミノ酸残基Ajを抗原決定基に決定し、しきい値未満であれば、抗原決定基に決定しない。
また、決定部408は、任意の予測値と、当該予測値と他の予測値との複合予測値との差分により、抗原決定基を決定することとしてもよい。この場合、他の予測値の影響により抗原決定基に決定されることとなる。
たとえば、抗原決定性予測値Pajと柔軟性予測値Pbjとの複合予測値をPabjとすると、差分となるPabj−Pbjがしきい値以上であれば、アミノ酸残基Ajを抗原決定基に決定し、しきい値未満であれば、抗原決定基に決定しない。これにより、配列番号jのアミノ酸残基Ajは、抗原決定性予測値Pajの影響により抗原決定基に決定されたことがわかる。他の複合予測値についても同様である。
また、出力部409は、処理結果410を出力する。出力形式は、表示画面による表示、プリンタによる印刷出力、外部装置への送信、内部の記憶領域への格納のいずれでもよい。また、表示画面による表示は各アミノ酸残基Ajの予測値の一覧でもよく横軸をアミノ酸残基と配列位置j、縦軸を各種予測値とするグラフ表示でもよい。
また、出力されるデータは、規格化前の各予測値Saj,Sbj,Scj,Sdjでもよく、規格化後の予測値Paj,Pbj,Hj,Pdjでもよく、複合予測値でもよい。また、決定部408によって決定された抗原決定基となるアミノ酸残基も強調表示することとしてもよい。
ここで、グラフ表示例を以下に示す。図12〜図17は、出力部409による出力結果を示すグラフである。図12は抗原決定性予測の波形Waを示すグラフ、図13は柔軟性予測の波形Wbを示すグラフ、図14は親水性予測の波形Wcを示すグラフ、図15は疎水性予測の波形Wkを示すグラフ、図16は極性予測の波形Wdを示すグラフ、図17は複合予測結果の波形Wを示すグラフである。
各グラフにおいて、横軸はアミノ酸残基の配列位置jを示しており、上部に表示されている一次構造配列データAS1に対応する。縦軸は規格化された予測値を示している。図12〜図14および図16では本実施の形態が適用されているため、N末端部位において予測値が波形として形成されている。一方、図15では本実施の形態が適用されていないため、特徴的なN末端部位の予測値が得られず、波形が形成されていないことがわかる。
(特性予測処理手順)
つぎに、特性予測処理手順について説明する。図18は、抗原決定性予測手順を示すフローチャートである。まず、取得部401により、一次構造配列データAS1が取得されるのを待ち受け(ステップS1801:No)、取得された場合(ステップS1801:Yes)、配列番号j=0とする(ステップS1802)。そして、判断部402により、ターゲット残基AjがC末端部位またはN末端部位であるか否かを判断する(ステップS1803)。
C末端部位またはN末端部位でない場合(ステップS1803:No)、ターゲット残基Ajは中間部に位置するため、ステップS1805に移行する。一方、C末端部位またはN末端部位である場合(ステップS1803:Yes)、追加部403により、アミノ酸残基を該当する末端に追加する(ステップS1804)。
そして、ステップS1805において、予測値算出部404により、ターゲット残基Ajを含むアミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値を変換テーブル600(または700)から読み出し(ステップS1805)、変換テーブル600(または700)に応じた所定の抗原決定性予測手法でターゲット残基Ajの抗原決定性予測値Sajを算出する(ステップS1806)。
このあと配列位置jをインクリメントし(ステップS1807)、j>mであるか否かを判断する(ステップS1808)。j>mでない場合(ステップS1808:No)、ステップS1803に戻る。一方、j>mである場合(ステップS1808:Yes)、出力部409により出力処理をおこなう(ステップS1809)。グラフ表示をおこなう場合には図12に示したようなグラフが表示画面に表示されることとなる。
このように、抗原決定性予測処理では、N末端からC末端に至るまでのすべてのアミノ酸残基について抗原決定性予測値を算出することができ、最も知りたい部位であるN末端部位やC末端部位についての抗原決定性を予測することができる。また、N末端部位やC末端部位とその中間部とでは共通の計算手法により抗原決定性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、N末端からC末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。
図19は、柔軟性予測手順を示すフローチャートである。まず、取得部401により、一次構造配列データAS1が取得されるのを待ち受け(ステップS1901:No)、取得された場合(ステップS1901:Yes)、配列番号j=0とする(ステップS1902)。そして、判断部402により、ターゲット残基AjがC末端部位またはN末端部位であるか否かを判断する(ステップS1903)。
C末端部位またはN末端部位でない場合(ステップS1903:No)、ターゲット残基Ajは中間部に位置するため、ステップS1905に移行する。一方、C末端部位またはN末端部位である場合(ステップS1903:Yes)、追加部403により、アミノ酸残基を該当する末端に追加する(ステップS1904)。
そして、ステップS1905において、予測値算出部404により、ターゲット残基Ajを含むアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値を変換テーブル800から読み出し(ステップS1905)、所定の柔軟性予測手法でターゲット残基Ajの柔軟性予測値Sbjを算出する(ステップS1906)。
このあと配列位置jをインクリメントし(ステップS1907)、j>mであるか否かを判断する(ステップS1908)。j>mでない場合(ステップS1908:No)、ステップS1903に戻る。一方、j>mである場合(ステップS1908:Yes)、出力部409により出力処理をおこなう(ステップS1909)。グラフ表示をおこなう場合には図13に示したようなグラフが表示画面に表示されることとなる。
このように、柔軟性予測処理では、N末端からC末端に至るまでのすべてのアミノ酸残基について柔軟性予測値を算出することができ、最も知りたい部位であるN末端部位やC末端部位についての柔軟性を予測することができる。また、N末端部位やC末端部位とその中間部とでは共通の計算手法により柔軟性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、N末端からC末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。
図20は、疎水性/親水性予測手順を示すフローチャートである。まず、取得部401により、一次構造配列データAS1が取得されるのを待ち受け(ステップS2001:No)、取得された場合(ステップS2001:Yes)、配列番号j=0とする(ステップS2002)。そして、判断部402により、ターゲット残基AjがC末端部位またはN末端部位であるか否かを判断する(ステップS2003)。
C末端部位またはN末端部位でない場合(ステップS2003:No)、ターゲット残基Ajは中間部に位置するため、ステップS2005に移行する。一方、C末端部位またはN末端部位である場合(ステップS2003:Yes)、追加部403により、アミノ酸残基を該当する末端に追加する(ステップS2004)。
そして、ステップS2005において、予測値算出部404により、ターゲット残基Ajを含むアミノ酸残基列を構成する各アミノ酸残基の疎水性指標値を変換テーブル1000から読み出し(ステップS2005)、所定の疎水性予測手法でターゲット残基Ajの疎水性予測値Scjを算出する(ステップS2006)。
このあと、規格化部406により、ターゲット残基Ajの疎水性予測値Scjを規格化し(ステップS2007)、変換部405により、規格化された疎水性指標値を親水性予測値Hjに変換する(ステップS2008)。そして、配列位置jをインクリメントし(ステップS2009)、j>mであるか否かを判断する(ステップS2010)。j>mでない場合(ステップS2010:No)、ステップS2003に戻る。一方、j>mである場合(ステップS2010:Yes)、出力部409により出力処理をおこなう(ステップS2011)。グラフ表示をおこなう場合には図14に示したようなグラフが表示画面に表示されることとなる。
このように、疎水性/親水性予測処理では、N末端からC末端に至るまでのすべてのアミノ酸残基について親水性予測値を算出することができ、最も知りたい部位であるN末端部位やC末端部位についての親水性を予測することができる。また、N末端部位やC末端部位とその中間部とでは共通の計算手法により親水性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、N末端からC末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。
図21は、極性予測手順を示すフローチャートである。まず、取得部401により、一次構造配列データAS1が取得されるのを待ち受け(ステップS2101:No)、取得された場合(ステップS2101:Yes)、配列番号j=0とする(ステップS2102)。そして、判断部402により、ターゲット残基AjがC末端部位またはN末端部位であるか否かを判断する(ステップS2103)。
C末端部位またはN末端部位でない場合(ステップS2103:No)、ターゲット残基Ajは中間部に位置するため、ステップS2105に移行する。一方、C末端部位またはN末端部位である場合(ステップS2103:Yes)、追加部403により、アミノ酸残基を該当する末端に追加する(ステップS2104)。
そして、ステップS2105において、予測値算出部404により、ターゲット残基Ajを含むアミノ酸残基列を構成する各アミノ酸残基の極性指標値を変換テーブル1100から読み出し(ステップS2105)、所定の極性予測手法でターゲット残基Ajの極性予測値Sdjを算出する(ステップS2106)。
このあと配列位置jをインクリメントし(ステップS2107)、j>mであるか否かを判断する(ステップS2108)。j>mでない場合(ステップS2108:No)、ステップS2103に戻る。一方、j>mである場合(ステップS2108:Yes)、出力部409により出力処理をおこなう(ステップS2109)。グラフ表示をおこなう場合には図16に示したようなグラフが表示画面に表示されることとなる。
このように、極性予測処理では、N末端からC末端に至るまでのすべてのアミノ酸残基について極性予測値を算出することができ、最も知りたい部位であるN末端部位やC末端部位についての極性を予測することができる。また、N末端部位やC末端部位とその中間部とでは共通の計算手法により極性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、N末端からC末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。
図22は、複合予測手順を示すフローチャートである。まず、取得部401により、一次構造配列データAS1が取得されるのを待ち受け(ステップS2201:No)、取得された場合(ステップS2201:Yes)、抗原決定性予測処理(ステップS2202)、柔軟性予測処理(ステップS2203)、疎水性/親水性予測処理(ステップS2204)、極性予測処理(ステップS2205)を実行する。
ここで、抗原決定性予測処理(ステップS2202)とは、抗原決定性予測処理手順のステップS1802〜S1808までの処理であり、柔軟性予測処理(ステップS2203)とは、柔軟性予測処理手順のステップS1902〜S1908までの処理であり、疎水性/親水性予測処理(ステップS2204)とは、疎水性/親水性予測処理手順のステップS2002〜S2010までの処理であり、極性予測処理(ステップS2205)とは、極性予測処理手順のステップS2102〜S2108までの処理である。
ここでは、抗原決定性予測処理(ステップS2202)、柔軟性予測処理(ステップS2203)、疎水性/親水性予測処理(ステップS2204)、極性予測処理(ステップS2205)の順に処理することとしたが、どのような順番で処理してもよく、また並列処理としてもよい。また、ここでは、抗原決定性予測処理(ステップS2202)、柔軟性予測処理(ステップS2203)、疎水性/親水性予測処理(ステップS2204)、極性予測処理(ステップS2205)をすべて実行しているが、少なくとも2種類の特性予測処理があれば複合予測値の算出が可能である。したがって、複合予測値をもとめるのに必要な特性予測処理のみを実行すればよい。
このあと、配列位置j=0とし(ステップS2206)、規格化部406により、アミノ酸残基Ajの各特性予測値を規格化する(ステップS2207)。なお、親水性予測値Hjはすでに規格化されているためその必要はない。そして、複合予測値算出部407により、アミノ酸残基Ajの複合予測値を算出する(ステップS2208)。
そして、配列位置jをインクリメントし(ステップS2209)、j>mであるか否かを判断する(ステップS2210)。j>mでない場合(ステップS2210:No)、ステップS2207に戻る。一方、j>mである場合(ステップS2210:Yes)、決定部408により、一次構造配列データAS1内のアミノ酸残基の中から抗原決定基を決定する(ステップS2211)。最後に、出力部409により出力処理をおこなう(ステップS2212)。グラフ表示をおこなう場合には図17に示したようなグラフが表示画面に表示されることとなる。
このように、複合予測処理では、N末端からC末端に至るまでのすべてのアミノ酸残基について複合予測値を算出することができ、最も知りたい部位であるN末端部位やC末端部位についての複合を予測することができる。また、N末端部位やC末端部位とその中間部とでは共通の計算手法により複合予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、N末端からC末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。
以上説明したように、上述した実施の形態によれば、最も知りたい部位であるアミノ酸配列の末端部位の特性予測をおこなうことができる。また、その末端部位の特性予測をその中間部の予測処理と共通の手法により実現することにより、N末端からC末端に至るまでのすべてのアミノ酸残基を網羅する特性予測を簡単かつ高精度に実現することができる。これにより、抗体の作成時間短縮および費用低減を図ることができる。
なお、この実施の形態で説明した特性予測方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
(付記1)コンピュータを、
任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得手段、
前記取得手段によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断手段、
前記判断手段によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断手段によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加手段、
前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出手段、
前記算出手段によって算出された算出結果を出力する出力手段、
として機能させることを特徴とする特性予測プログラム。
(付記2)前記所定の特性予測手法は、抗原決定性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値と前記抗原決定性予測手法とに基づいて、前記目的アミノ酸残基の抗原決定性予測値を算出することを特徴とする付記1に記載の特性予測プログラム。
(付記3)前記追加手段は、前記目的アミノ酸残基と同一のアミノ酸残基を追加することを特徴とする付記2に記載の特性予測プログラム。
(付記4)前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基を追加することを特徴とする付記3に記載の特性予測プログラム。
(付記5)前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基のうち前記目的アミノ酸残基と配列位置が近いアミノ酸残基を追加することを特徴とする付記4に記載の特性予測プログラム。
(付記6)前記所定の特性予測手法は、柔軟性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記柔軟性予測手法とに基づいて、前記目的アミノ酸残基の柔軟性予測値を算出することを特徴とする付記1に記載の特性予測プログラム。
(付記7)前記所定の特性予測手法が、疎水性/親水性予測手法である場合、前記コンピュータを、前記算出手段によって算出された算出結果を変換する変換手段として機能させ、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記所定の疎水性予測手法とに基づいて、前記目的アミノ酸残基の疎水性予測値を算出し、
前記変換手段は、前記目的アミノ酸残基の疎水性予測値を前記目的アミノ酸残基の親水性予測値に変換し、
前記出力手段は、前記変換手段によって変換された変換結果を出力することを特徴とする付記1に記載の特性予測プログラム。
(付記8)前記所定の特性予測手法は、極性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の極性指標値と前記極性予測手法とに基づいて、前記目的アミノ酸残基の極性予測値を算出することを特徴とする付記1に記載の特性予測プログラム。
(付記9)前記追加手段は、前記目的アミノ酸残基とは異なるアミノ酸残基を追加することを特徴とする付記6〜8のいずれか一つに記載の特性予測プログラム。
(付記10)前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基を追加することを特徴とする付記9に記載の特性予測プログラム。
(付記11)前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基のうち前記目的アミノ酸残基から配列位置が遠いアミノ酸残基を追加することを特徴とする付記10に記載の特性予測プログラム。
(付記12)任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得手段と、
前記取得手段によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断手段と、
前記判断手段によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断手段によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加手段と、
前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出手段と、
前記算出手段によって算出された算出結果を出力する出力手段と、
を備えることを特徴とする特性予測装置。
(付記13)任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得工程と、
前記取得工程によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断工程と、
前記判断工程によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断工程によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加工程と、
前記追加工程によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出工程と、
前記算出工程によって算出された算出結果を出力する出力工程と、
を含んだことを特徴とする特性予測方法。