JP5007640B2

JP5007640B2 - 特性予測プログラム、特性予測装置、および特性予測方法

Info

Publication number: JP5007640B2
Application number: JP2007251791A
Authority: JP
Inventors: 広太酒井
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2007-09-27
Filing date: 2007-09-27
Publication date: 2012-08-22
Anticipated expiration: 2027-09-27
Also published as: JP2009085608A

Description

この発明は、抗体が認識するタンパク質の特性を予測する特性予測プログラム、特性予測装置、および特性予測方法に関する。

病原菌などの抗原に対しその抗体を作成するためには、通常、抗原の一部の部分アミノ酸をウサギなどの小動物に注射して、抗体を作らせる。しかし、ランダムに部分アミノ酸を注射しても、小動物は抗体を作成しないことが多い。

抗体を作らせることができる部分配列は抗原決定基と呼ばれ、抗原であるタンパク質中、抗体が認識する部分構造であり、この抗原決定基を正確に見つけることが重要である。抗原決定基が簡単に特定されると、ランダムに取り出してきた部分アミノ酸配列よりも格段に、抗体を作りやすい部分アミノ酸配列を見つけることができ、抗体作成が容易となる。

このように、抗体作成を容易にするため、タンパク質を表すアミノ酸残基の一次配列から、抗原決定基を予測することができる抗原決定基予測システムが提案されている（たとえば、下記特許文献１および下記特許文献２を参照。）。

特開平９−１７１０１７号公報特開平１０−１９７５２９号公報

タンパク質の末端はそのタンパク質の各種特徴を示すのに大きな役割をもっており、抗体作成を容易にするためには、タンパク質の特性予測の高精度化を図る必要がある。しかしながら、上述した従来技術は、配置位置が連続する固定数の一連のペプチド（アミノ酸残基）を用いてターゲットとなるペプチドの特性を予測する手法である。このため、Ｎ末端やその近傍、Ｃ末端やその近傍に位置するペプチドをターゲットとした場合、固定数の一連のペプチドが得られず、予測不能に陥ってしまい、最も知りたい部位の特性がまったく予測できないという問題がある。

一方、Ｎ末端やその近傍、Ｃ末端やその近傍について、それ以外の中間部の予測手法とは異なる計算式により特性予測をおこなうと、予測手法の相違により予測精度にばらつきが生じてしまうという問題がある。

この発明は、上述した従来技術による問題点を解消するため、最も知りたい部位であるアミノ酸配列の末端部位の特性予測をおこなうことができるとともに、その末端部位の特性予測をその中間部の予測処理と共通の手法により実現することにより、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基を網羅する特性予測を簡単かつ高精度に実現することができる特性予測プログラム、特性予測装置、および特性予測方法を提供することを目的とする。

上述した課題を解決し、目的を達成するため、特性予測プログラム、特性予測装置、および特性予測方法は、任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得し、取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断し、判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、判断された末端部位を、前記所定数と同数のアミノ酸残基列にし、そのアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出し、その算出結果を出力することを特徴とする。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、最も知りたい部位であるアミノ酸配列の末端部位の特性予測をおこなうことができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、前記所定の特性予測手法は、抗原決定性予測手法であり、アミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値と前記抗原決定性予測手法とに基づいて、前記目的アミノ酸残基の抗原決定性予測値を算出することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、最も知りたい部位であるアミノ酸配列の末端部位の抗原決定性予測をおこなうことができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、前記目的アミノ酸残基と同一のアミノ酸残基を追加することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、末端部位に含まれている目的アミノ酸残基の特徴が加味された抗原決定性予測を実行することができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、判断された末端部位に含まれるアミノ酸残基を追加することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、末端部位に含まれている目的アミノ酸残基以外の他のアミノ酸残基の特徴が加味された抗原決定性予測を実行することができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、判断された末端部位に含まれるアミノ酸残基のうち前記目的アミノ酸残基と配列位置が近いアミノ酸残基を追加することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、末端部位の中で末端基近傍のアミノ酸残基の特徴が加味された抗原決定性予測を実行することができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、前記所定の特性予測手法は、柔軟性予測手法であり、アミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記柔軟性予測手法とに基づいて、前記目的アミノ酸残基の柔軟性予測値を算出することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、最も知りたい部位であるアミノ酸配列の末端部位の柔軟性予測をおこなうことができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、前記所定の特性予測手法が、疎水性／親水性予測手法である場合、アミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記所定の疎水性予測手法とに基づいて、前記目的アミノ酸残基の疎水性予測値を算出し、前記目的アミノ酸残基の疎水性予測値を前記目的アミノ酸残基の親水性予測値に変換し、その変換結果を出力することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、最も知りたい部位であるアミノ酸配列の末端部位の親水性予測を、疎水性予測手法を元におこなうことができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、前記所定の特性予測手法は、極性予測手法であり、アミノ酸残基列を構成する各アミノ酸残基の極性指標値と前記極性予測手法とに基づいて、前記目的アミノ酸残基の極性予測値を算出することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、最も知りたい部位であるアミノ酸配列の末端部位の極性予測をおこなうことができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、前記目的アミノ酸残基とは異なるアミノ酸残基を追加することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、末端部位に含まれている目的アミノ酸残基を除くアミノ酸残基の特徴を加味することで、目的アミノ酸残基の影響を受けにくい部位にすることができる。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、末端部位の中で末端基近傍のアミノ酸残基の特徴を加味することで、目的アミノ酸残基の影響を受けにくい部位にすることができる。

また、上記特性予測プログラム、特性予測装置、および特性予測方法において、判断された末端部位に含まれるアミノ酸残基のうち前記目的アミノ酸残基から配列位置が遠いアミノ酸残基を追加することとしてもよい。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、配列位置が目的アミノ酸残基から離れたアミノ酸残基の特徴を加味することで、目的アミノ酸残基の影響を受けにくい部位にすることができる。

この特性予測プログラム、特性予測装置、および特性予測方法によれば、最も知りたい部位であるアミノ酸配列の末端部位の特性予測をおこなうことができるとともに、その末端部位の特性予測をその中間部の予測処理と共通の手法により実現することにより、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基を網羅する特性予測を簡単かつ高精度に実現することができるという効果を奏する。

以下に添付図面を参照して、特性予測プログラム、特性予測装置、および特性予測方法の好適な実施の形態を詳細に説明する。まず、この特性予測の骨子について説明する。本実施の形態の特性予測では、アミノ酸残基の抗原決定性、柔軟性、疎水性／親水性および極性などの各種特性に関する予測をおこなう。

抗原決定性とは、既存予測手法による抗原決定基のなりやすさをあらわす特性である。たとえば、ＥＭＩＮＩ法は、タンパク質の表面存在確率に注目して作成された抗原決定性予測手法である。また、Ｈｏｏｐ−Ｗｏｏｄｓ法は、親水性より内外予測に注目して作成された抗原決定性予測手法である。

柔軟性とは、アミノ酸残基の硬軟をあらわす特性である。抗体は、抗原となるタンパク質のαへリックスやβストランドといった硬い構造を持った部分よりもターンやコイルといった軟らかな構造を持った攻撃しやすい部分に結合しやすいという傾向がある。したがって、アミノ酸残基が軟らかいほど抗原決定基に選ばれやすいということになる。

疎水性／親水性とは、アミノ酸残基と水分子との親和力の高さをあらわす特性である。抗体は、抗原となるタンパク質においてより親水性が高い部分に結合しやすいという傾向がある。したがって、アミノ酸残基の親水性が高いほど抗原決定基に選ばれやすいということになる。

極性とは、アミノ酸残基の荷電性に着目した特性であり、電荷アミノ酸残基、極性アミノ酸残基、非極性アミノ酸残基の３種類に分類することができる。電荷アミノ酸残基とは、正電荷または負電荷を有するＲ基を持つアミノ酸残基である。極性アミノ酸残基とは、極性だが電荷のないアミノ酸である。非極性アミノ酸残基とは、疎水性のＲ基を持つアミノ酸残基である。抗体は、抗原となるタンパク質において帯電しているアミノ酸残基ほど結合しやすいという傾向がある。したがって、電荷アミノ酸残基、極性アミノ酸残基、非極性アミノ酸残基の順に、抗原決定基に選ばれやすいということになる。

これら各種特性において、従来では、ターゲットとなる目的アミノ酸残基（以下、「ターゲット残基」という）を中心とした配置位置が連続する所定数の一連のアミノ酸残基に着目して特性予測をおこなっていた。

たとえば、アミノ酸残基が１００個配列されたアミノ酸配列において、配列位置が５０番目のアミノ酸残基をターゲット残基としてその特性を予測する場合、所定数を７個とすると、前後３個ずつ、すなわち４７番目〜５３番目のアミノ酸残基が選ばれることとなる。そして、これらのアミノ酸残基の特性指標値を読み出し、特性予測手法の公式に与えることで、ターゲット残基（５０番目のアミノ酸残基）の特性予測値が算出される。

一方で、アミノ酸配列のＮ末端またはその近傍（以下、「Ｎ末端部位」と称す。）やＣ末端またはその近傍（以下、「Ｃ末端部位」と称す。）にターゲット残基が配置されている場合、ターゲット残基を中心とした所定数のアミノ酸残基を特定できない場合がある。

たとえば、上記のアミノ酸配列の例で説明すると、所定数が７個である場合、前後３個ずつのアミノ酸残基が必要となるが、配列位置が２番目となるＮ末端部位のアミノ酸残基をターゲット残基とする場合、ターゲット残基を中心とする７個のアミノ酸残基を選ぶことができず、特性予測手法の計算式に与えられない。これにより、Ｃ末端部位では計算不能に陥ることになる。Ｎ末端近傍についても同様である。

本実施の形態では、Ｎ末端部位およびＣ末端部位にターゲット残基が配置されている場合でも、Ｎ末端部位およびＣ末端部位での配置を調整することで、Ｎ末端部位およびＣ末端部位を含む全配列位置において同一の特性予測手法で特性予測をおこなう技術である。以下、特性ごとのＮ末端部位およびＣ末端部位の調整内容について説明する。

図１は、抗原決定性予測をおこなう場合のＮ末端部位およびＣ末端部位の調整内容を示す説明図である。図１（図２でも同様）中、（Ａ），（Ｂ）はＮ末端部位を示しており、（Ｃ）〜（Ｅ）はＣ末端部位を示している。また、（Ａ）〜（Ｅ）において、丸い図形はアミノ酸残基を示しており、内部のアルファベットによりその種類を特定している。また、内部にハッチングが施されているアミノ酸残基はターゲット残基である。また、アミノ酸残基の直上の数字は配列位置ｊ（０≦ｊ≦ｍ、ｍはＣ末端のアミノ酸残基の配列番号）を示す数字である。なお、配列位置ｊのアミノ酸残基をＡ_jと称す。たとえば、（Ａ）において、配列位置ｊ＝１のアミノ酸残基“Ｗ”はアミノ酸残基Ａ₁となる。

ＥＭＩＮＩ法やＨｏｏｐ−Ｗｏｏｄｓ法などの抗原決定性予測手法では、ターゲット残基を中心として配列位置が連続する６個のアミノ酸残基が選ばれる。６個なので、厳密には６個のうちＮ末端側から３番目（４番目でもよい）のアミノ酸残基が中心、すなわち、ターゲット残基となる。

（Ａ）では、Ｎ末端部位（Ａ₀〜Ａ₄）中、ターゲット残基はＡ₁であるため、先行するアミノ酸残基が１個不足する。このため、アミノ酸残基Ａ₁をアミノ酸残基Ａ_-1として割り当てることで、６個のアミノ酸残基Ａ_-1〜Ａ₄を選ぶことができる。

（Ｂ）では、Ｎ末端部位（Ａ₀〜Ａ₃）中、ターゲット残基はＡ₀であるため、先行するアミノ酸残基が２個不足する。このため、アミノ酸残基Ａ₁をアミノ酸残基Ａ_-1として割り当て、アミノ酸残基Ａ₀をアミノ酸残基Ａ_-2として割り当てることで、６個のアミノ酸残基Ａ_-2〜Ａ₃を選ぶことができる。

（Ｃ）では、Ｃ末端部位（Ａ_m-4〜Ａ_m）中、ターゲット残基はＡ_m-2であるため、後続のアミノ酸残基が１個不足する。このため、アミノ酸残基Ａ_m-2をアミノ酸残基Ａ_m+1として割り当てることで、６個のアミノ酸残基Ａ_m-4〜Ａ_m+1を選ぶことができる。

（Ｄ）では、Ｃ末端部位（Ａ_m-3〜Ａ_m）中、ターゲット残基はＡ_m-1であるため、後続のアミノ酸残基が２個不足する。このため、アミノ酸残基Ａ_m-1をアミノ酸残基Ａ_m+1として割り当て、アミノ酸残基Ａ_mをアミノ酸残基Ａ_m+2として割り当てることで、６個のアミノ酸残基Ａ_m-3〜Ａ_m+2を選ぶことができる。

（Ｅ）では、Ｃ末端部位（Ａ_m-2〜Ａ_m）中、ターゲット残基はＡ_mであるため、後続のアミノ酸残基が３個不足する。このため、アミノ酸残基Ａ_mをアミノ酸残基Ａ_m+3として割り当て、アミノ酸残基Ａ_m-1をアミノ酸残基Ａ_m+2として割り当て、アミノ酸残基Ａ_m-2をアミノ酸残基Ａ_m+1として割り当てることで、６個のアミノ酸残基Ａ_m-2〜Ａ_m+3を選ぶことができる。

このように、抗原決定性予測においては、Ｎ末端では、末端基の前にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、どのアミノ酸残基でもよいが、Ｎ末端部位と似た性質にするのが望ましいため、上記（Ａ），（Ｂ）で示したように、末端基の前にはターゲット残基と同一のアミノ酸残基を割り当てることが好ましい。また、それでも抗原決定性予測手法の計算式に不足する場合には、上記（Ｂ）で示したように、Ｎ末端部位の中から選ぶこととしてもよい。この場合には、配列位置がよりターゲット残基に近いアミノ酸残基を選ぶほうが上記観点から好ましい。

同様に、Ｃ末端では、末端基の後にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、どのアミノ酸残基でもよいが、Ｃ末端部位と似た性質にするのが望ましいため、上記（Ｃ）〜（Ｅ）で示したように、末端基の後にはターゲット残基と同一のアミノ酸残基を割り当てることが好ましい。また、それでも抗原決定性予測手法の計算式に不足する場合には、上記（Ｄ），（Ｅ）で示したように、Ｃ末端部位の中から選ぶこととしてもよい。この場合には、配列位置がよりターゲット残基に近いアミノ酸残基を選ぶほうが上記観点から好ましい。

図２は、柔軟性予測、疎水性／親水性予測、または極性予測をおこなう場合のＮ末端部位およびＣ末端部位の調整内容を示す説明図である。図２中、（Ａ）〜（Ｃ）はＮ末端部位を示しており、（Ｄ）〜（Ｆ）はＣ末端部位を示している。

柔軟性予測、疎水性／親水性予測、または極性予測などの予測手法では、ターゲット残基を中心として配列位置が連続する７個のアミノ酸残基が選ばれる。７個なので、Ｎ末端側から４番目のアミノ酸残基が中心、すなわち、ターゲット残基となる。

（Ａ）では、Ｎ末端部位（Ａ₀〜Ａ₅）中、ターゲット残基はＡ₂であるため、先行するアミノ酸残基が１個不足する。このため、アミノ酸残基Ａ₅をアミノ酸残基Ａ_-1として割り当てることで、７個のアミノ酸残基Ａ_-1〜Ａ₅を選ぶことができる。

（Ｂ）では、Ｎ末端部位（Ａ₀〜Ａ₄）中、ターゲット残基はＡ₁であるため、先行するアミノ酸残基が２個不足する。このため、アミノ酸残基Ａ₃をアミノ酸残基Ａ_-1として割り当て、アミノ酸残基Ａ₄をアミノ酸残基Ａ_-2として割り当てることで、７個のアミノ酸残基Ａ_-2〜Ａ₄を選ぶことができる。

（Ｃ）では、Ｎ末端部位（Ａ₀〜Ａ₃）中、ターゲット残基はＡ₀であるため、先行するアミノ酸残基が３個不足する。このため、アミノ酸残基Ａ₁をアミノ酸残基Ａ_-1として割り当て、アミノ酸残基Ａ₂をアミノ酸残基Ａ_-2として割り当て、アミノ酸残基Ａ₃をアミノ酸残基Ａ_-3として割り当てることで、７個のアミノ酸残基Ａ_-3〜Ａ₃を選ぶことができる。

（Ｄ）では、Ｃ末端部位（Ａ_m-5〜Ａ_m）中、ターゲット残基はＡ_m-2であるため、後続のアミノ酸残基が１個不足する。このため、アミノ酸残基Ａ_m-5をアミノ酸残基Ａ_m+1として割り当てることで、７個のアミノ酸残基Ａ_m-5〜Ａ_m+1を選ぶことができる。

（Ｅ）では、Ｃ末端部位（Ａ_m-4〜Ａ_m）中、ターゲット残基はＡ_m-1であるため、後続のアミノ酸残基が２個不足する。このため、アミノ酸残基Ａ_m-3をアミノ酸残基Ａ_m+1として割り当て、アミノ酸残基Ａ_m-4をアミノ酸残基Ａ_m+2として割り当てることで、７個のアミノ酸残基Ａ_m-4〜Ａ_m+2を選ぶことができる。

（Ｆ）では、Ｃ末端部位（Ａ_m-3〜Ａ_m）中、ターゲット残基はＡ_mであるため、後続のアミノ酸残基が３個不足する。このため、アミノ酸残基Ａ_m-1をアミノ酸残基Ａ_m+1として割り当て、アミノ酸残基Ａ_m-2をアミノ酸残基Ａ_m+2として割り当て、アミノ酸残基Ａ_m-3をアミノ酸残基Ａ_m+3として割り当てることで、７個のアミノ酸残基Ａ_m-3〜Ａ_m+3を選ぶことができる。

このように、柔軟性予測、疎水性／親水性予測、または極性予測においては、Ｎ末端では、末端基の前にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、Ｎ末端部位内のアミノ酸残基であればどのアミノ酸残基でもよいが、ターゲット残基の影響を受けにくい残基を追加するのが望ましいため、上記（Ａ）〜（Ｃ）で示したように、末端基の前にはターゲット残基から離れたアミノ酸残基を割り当てることが好ましい。また、それでも柔軟性予測、疎水性／親水性予測、または極性予測の計算式に不足する場合には、上記（Ｂ），（Ｃ）で示したように、Ｎ末端部位の中から選ぶこととしてもよい。この場合には、ターゲット残基は選ばないほうが上記観点から好ましい。

同様に、Ｃ末端では、末端基の後にアミノ酸残基が追加されることとなる。追加されるアミノ酸残基は、Ｃ末端部位内のアミノ酸残基であればどのアミノ酸残基でもよいが、ターゲット残基の影響を受けにくい残基を追加するのが望ましいため、上記（Ｄ）〜（Ｆ）で示したように、末端基の後にはターゲット残基から離れたアミノ酸残基を割り当てることが好ましい。また、それでも柔軟性予測、疎水性／親水性予測、または極性予測の計算式に不足する場合には、上記（Ｅ），（Ｆ）で示したように、Ｃ末端部位の中から選ぶこととしてもよい。この場合には、ターゲット残基は選ばないほうが上記観点から好ましい。

（特性予測装置のハードウェア構成）
つぎに、特性予測装置のハードウェア構成について説明する。図３は、特性予測装置のハードウェア構成を示す説明図である。図３において、特性予測装置３００は、コンピュータ本体３１０と、入力装置３２０と、出力装置３３０と、から構成されており、不図示のルータやモデムを介してＬＡＮ，ＷＡＮやインターネットなどのネットワーク３４０に接続可能である。

コンピュータ本体３１０は、ＣＰＵ，記憶部，インターフェースを有する。ＣＰＵは、特性予測装置３００の全体の制御を司る。記憶部は、ＲＯＭ，ＲＡＭ，ＨＤ，光ディスク３１１，フラッシュメモリから構成される。記憶部はＣＰＵのワークエリアとして使用される。

また、記憶部には各種プログラムが格納されており、ＣＰＵからの命令に応じてロードされる。ＨＤおよび光ディスク３１１はディスクドライブによりデータのリード／ライトが制御される。また、光ディスク３１１およびフラッシュメモリはコンピュータ本体３１０に対し着脱自在である。インターフェースは、入力装置３２０からの入力、出力装置３３０への出力、ネットワーク３４０に対する送受信の制御をおこなう。

また、入力装置３２０としては、キーボード３２１、マウス３２２、スキャナ３２３などがある。キーボード３２１は、文字、数字、各種指示などの入力のためのキーを備え、データの入力をおこなう。また、タッチパネル式であってもよい。マウス３２２は、カーソルの移動や範囲選択、あるいはウィンドウの移動やサイズの変更などをおこなう。スキャナ３２３は、画像を光学的に読み取る。読み取られた画像は画像データとして取り込まれ、コンピュータ本体３１０内のメモリに格納される。なお、スキャナ３２３にＯＣＲ機能を持たせてもよい。

また、出力装置３３０としては、ディスプレイ３３１、スピーカ３３２、プリンタ３３３などがある。ディスプレイ３３１は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。また、スピーカ３３２は、効果音や読み上げ音などの音声を出力する。また、プリンタ３３３は、画像データや文書データを印刷する。

（特性予測装置の機能的構成）
つぎに、特性予測装置の機能的構成について説明する。図４は、この発明の実施の形態にかかる特性予測装置の機能的構成を示すブロック図である。図４において、特性予測装置３００は、取得部４０１と、判断部４０２と、追加部４０３と、予測値算出部４０４と、変換部４０５と、規格化部４０６と、複合予測値算出部４０７と、決定部４０８と、出力部４０９と、から構成されている。

上述した各機能４０１〜４０９は、記憶部に格納された当該機能に関するプログラムをＣＰＵに実行させることにより、当該機能を実現することができる。また、各機能４０１〜４０９からの出力データは記憶部に保持される。また、図４中矢印で示した接続先の機能は、接続元の機能からの出力データをメモリから読み込んで、当該機能に関するプログラムをＣＰＵに実行させるものとする。

まず、取得部４０１は、タンパク質に関するデータを取得する機能を有する。具体的には、たとえば、任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する。ここで、一次構造配列データについて説明する。

図５は、アミノ酸配列の一次構造配列データの一例を示す説明図である。一次構造配列データＡＳ１は、アミノ酸配列の一次構造をあらわした文字列データであり、２０種類のアミノ酸残基の一次構造に関する記号（Ｓ，Ｙ，Ｉ，Ｊなど）を配列位置ｊ（ｊ＝０〜ｍ）順にｍ＋１個配列したデータである。アミノ酸残基Ａ_jの記号に対応する名称については、図６などに示されているとおりである。

一次構造配列データＡＳ１の取得方法としては、ユーザ操作により一次構造配列データＡＳ１を特性予測装置３００に与えてもよく、また、外部サーバから一次構造配列データＡＳ１を受信することとしてもよい。

また、図２において、判断部４０２は、取得部４０１によって取得された一次構造配列データＡＳ１の中から選ばれたターゲット残基が、所定の特性予測手法で予測不能な一次構造配列データＡＳ１の両末端部位のうち、いずれの末端部位に含まれているかを判断する機能を有する。

ここで、所定の特性予測手法とは、タンパク質の特性を予測する計算手法であり、ＥＭＩＮＩ法やＨｏｏｐ−Ｗｏｏｄｓ法などの抗原決定性予測手法、Ｋａｒｐｌｕｓ−Ｓｃｈｕｌｚ法などの柔軟性予測手法、疎水性／親水性予測手法、極性予測手法などがある。いずれの手法も、配列位置ｊが連続する所定数の一連のアミノ酸残基を用いる。たとえば、ＥＭＩＮＩ法やＨｏｏｐ−Ｗｏｏｄｓ法などの抗原決定性予測手法では６個、Ｋａｒｐｌｕｓ−Ｓｃｈｕｌｚ法などの柔軟性予測手法、疎水性／親水性予測手法、極性予測手法では７個という固定数である。

この判断部４０２は、具体的には、図１および図２で示したアミノ酸残基の追加をおこなう必要があるか否かを判断する。もし、ターゲット残基がいずれの末端部位にも含まれていない場合、ターゲット残基はアミノ酸配列中、両末端部位間の中間部に配置されていることとなり、通常どおり、所定の特性予測手法によって予測値を算出することができる。一方、いずれかの末端部位に含まれている場合、図１および図２で示したアミノ酸残基の追加をおこなう必要がある。

また、図４において、追加部４０３は、判断部４０２によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、判断部４０２によって判断された末端部位を、所定数と同数のアミノ酸残基列にする機能を有する。具体的には、図１および図２に示したように、各特性予測手法の所定数となるように、末端基に追加する。

また、予測値算出部４０４は、追加部４０３によって得られたアミノ酸残基列を用いて、各特性予測手法により、ターゲット残基の特性予測値を算出する機能を有する。ここで、アミノ酸残基列とは、追加後の一連のアミノ酸残基であり、たとえば、図１に示した（Ａ）の６個のアミノ酸残基Ａ_-1〜Ａ₄、（Ｂ）の６個のアミノ酸残基Ａ_-2〜Ａ₃、（Ｃ）の６個のアミノ酸残基Ａ_m-4〜Ａ_m+1、（Ｄ）の６個のアミノ酸残基Ａ_m-3〜Ａ_m+2、（Ｅ）の６個のアミノ酸残基Ａ_m-2〜Ａ_m+3、図２に示した（Ａ）の７個のアミノ酸残基Ａ_-1〜Ａ₅、（Ｂ）の７個のアミノ酸残基Ａ_-2〜Ａ₄、（Ｃ）の７個のアミノ酸残基Ａ_-3〜Ａ₃、（Ｄ）の７個のアミノ酸残基Ａ_m-5〜Ａ_m+1、（Ｅ）の７個のアミノ酸残基Ａ_m-4〜Ａ_m+2、（Ｆ）の７個のアミノ酸残基Ａ_m-3〜Ａ_m+3が該当する。

特性予測値の算出手法はその特性予測手法ごとに異なるため、以下、特性予測手法ごとに説明する。まず、抗原決定性予測では、アミノ酸残基をあらわす一次構造データからその抗原決定性指標値を特定する必要がある。

図６は、一次構造データと抗原決定性指標値との変換テーブルを示す説明図である。この変換テーブル６００は、ＥＭＩＮＩ法を適用する場合の変換テーブルである。抗原決定性指標値は、０．０〜１．０の間の値をとる。予測値算出部４０４は、この変換テーブル６００を参照して、アミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値を読み出す。読み出された抗原決定性指標値は、下記式（１）に代入される。

上記式（１）はＥＭＩＮＩ法による抗原決定性予測値の算出式であり、各抗原決定性指標値の相乗平均をとる。Ｓａ_jは、ターゲット残基であるアミノ酸残基Ａ_jの抗原決定性予測値であり、σａ_j-3+iは、アミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値である。このアミノ酸残基列は、追加部４０３による追加後のアミノ酸残基列でもよく、追加部４０３による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ａ_jがいずれの配置位置ｊであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。

また、変換テーブル６００を参照すると、たとえば、図１の（Ａ）の６個のアミノ酸残基Ａ_-1〜Ａ₄では、Ａ_-1が“Ｗ”、Ａ₀が“Ｑ”、Ａ₁が“Ｗ”、Ａ₂が“Ｒ”、Ａ₃が“Ｄ”、Ａ₄が“Ｇ”であるため、Ａ_-1の抗原決定性指標値σａ_-1は「０．８４」、Ａ₀の抗原決定性指標値σａ₀は「０．３６」、Ａ₁の抗原決定性指標値σａ₁は「０．８４」、Ａ₂の抗原決定性指標値σａ₂は「０．８４」、Ａ₃の抗原決定性指標値σａ₃は「０．５１」、Ａ₄の抗原決定性指標値σａ₄は「０．４０」となる。これらの抗原決定性指標値σａ_-1〜σａ₄を式（１）に与えることで、ターゲット残基Ａ_jの抗原決定性予測値Ｓａ_jを算出することができる。

また、Ｈｏｏｐ−Ｗｏｏｄｓ法を用いる場合は、上記式（１）のかわりに下記式（２）を用いる。

上記式（２）はＨｏｏｐ−Ｗｏｏｄｓ法による抗原決定性予測値の算出式であり、各抗原決定性指標値の相加平均をとる。なお、Ｈｏｏｐ−Ｗｏｏｄｓ法を用いる場合は、図６に示した変換テーブルにかえて、図７の変換テーブル７００を用いる。図７は、Ｈｏｏｐ−Ｗｏｏｄｓ法を適用する場合の一次構造データと抗原決定性指標値との変換テーブルを示す説明図である。

また、予測値算出部４０４は、特性予測のうちＫａｒｐｌｕｓ−Ｓｃｈｕｌｚ法などの柔軟性予測手法をおこなう場合、図８の変換テーブルを用いる。図８は、柔軟性予測に関する変換テーブルを示す説明図である。図８の変換テーブル８００では、アミノ酸残基Ａ_jごとに、その硬軟と３種類の柔軟性指標値Ｂ₀〜Ｂ₂が対応付けられている。

柔軟性予測では、アミノ酸残基列を構成するアミノ酸残基ごとに、各アミノ酸残基とその前後に配置されている隣接アミノ酸残基の硬軟を調べる。この前後の隣接アミノ酸残基の硬軟の組み合わせにより、変換テーブル８００から読み出される柔軟性指標値Ｂ₀〜Ｂ₂が特定される。柔軟性指標値Ｂ₀〜Ｂ₂のうち、Ｂ₀が最も硬くＢ₂が最も軟らかい。Ｂ₁は、その中間である。

図９は、隣接アミノ酸残基の硬軟の組み合わせを示す説明図である。図９において、（Ａ）は、アミノ酸残基Ａ_kの前後に配置される隣接アミノ酸残基Ａ_k-1，Ａ_k+1がともに“硬”である配列であり、（Ｂ）および（Ｃ）は、隣接アミノ酸残基Ａ_k-1，Ａ_k+1のうち一方が“硬”で他方が“軟”である配列であり、（Ｄ）は、隣接アミノ酸残基Ａ_k-1，Ａ_k+1がともに“軟”である配列である。

（Ａ）の配列では、アミノ酸残基Ａ_kの柔軟性指標値はＢ₀となる。（Ｂ）および（Ｃ）の配列では、アミノ酸残基Ａ_kの柔軟性指標値はＢ₁となる。（Ｄ）の配列では、アミノ酸残基Ａ_kの柔軟性指標値はＢ₂となる。このように、隣接アミノ酸残基Ａ_k-1，Ａ_k+1の硬軟によりアミノ酸残基Ａ_kの柔軟性指標値が変動する。これにより、ターゲット残基の柔軟性指標値をより現実的に算出することができる。この柔軟性予測では、下記式（３）により、ターゲット残基の柔軟性指標値を算出する。

上記式（３）はＫａｒｐｌｕｓ−Ｓｃｈｕｌｚ法による柔軟性予測値の算出式であり、各柔軟性指標値の相加平均をとる。Ｓｂ_jは、ターゲット残基であるアミノ酸残基Ａ_jの柔軟性予測値であり、σｂ_j-3〜σｂ_j+3は、アミノ酸残基列を構成する各アミノ酸残基Ａ_j-3〜Ａ_j+3の柔軟性指標値である。

柔軟性指標値σｂ_j-3〜σｂ_j+3はアミノ酸残基ごとに図８の変換テーブル８００に示したＢ₀〜Ｂ₂から選ばれた値となる。また、このアミノ酸残基列は、追加部４０３による追加後のアミノ酸残基列でもよく、追加部４０３による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ａ_jがいずれの配置位置ｊであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。

また、予測値算出部４０４は、特性予測のうちＫｙｔｅ−Ｄｏｏｌｉｔｔｌｅ法などの疎水性予測手法をおこなう場合、図１０の変換テーブルを用いる。図１０は、疎水性予測に関する変換テーブルを示す説明図である。図１０に示した変換テーブル１０００では、アミノ酸残基Ａ_jごとに疎水性指標値が割り当てられている。図１０では、疎水性指標値の数値範囲は、−４．５〜４．５の数値をとる。数値の高さが疎水性をあらわしている。

予測値算出部４０４では、この変換テーブル１０００を参照して、アミノ酸残基列を構成する各アミノ酸残基の疎水性指標値を読み出す。読み出された抗原決定性指標値は、下記式（４）に代入される。

上記式（４）はＫｙｔｅ−Ｄｏｏｌｉｔｔｌｅ法による疎水性予測値の算出式であり、各疎水性指標値の相加平均をとる。Ｓｃ_jは、ターゲット残基であるアミノ酸残基Ａ_jの疎水性予測値であり、σｃ_j-4+iは、アミノ酸残基列を構成する各アミノ酸残基の疎水性指標値である。

このアミノ酸残基列は、追加部４０３による追加後のアミノ酸残基列でもよく、追加部４０３による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ａ_jがいずれの配置位置ｊであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。なお、ここで求められた特性予測値は、親水性予測値ではなく、疎水性予測値Ｓｃ_jである。疎水性予測値Ｓｃ_jから親水性予測値の変換は、後述する変換部４０５により実行される。

また、予測値算出部４０４は、特性予測のうち極性予測手法をおこなう場合、図１１の変換テーブルを用いる。図１１は、極性予測に関する変換テーブルを示す説明図である。図１１に示した変換テーブル１１００では、アミノ酸残基ごとに極性指標値が割り当てられている。

図１１では、極性指標値が「０．０」である場合、そのアミノ酸残基は非極性アミノ酸残基であることを示している。また、極性指標値が「０．５」である場合、そのアミノ酸残基は極性アミノ酸残基であることを示している。さらに、極性指標値が「１．０」である場合、そのアミノ酸残基は荷電アミノ酸残基であることを示している。

予測値算出部４０４は、この変換テーブル１１００を参照して、アミノ酸残基列を構成する各アミノ酸残基の極性指標値を読み出す。読み出された極性指標値は、下記式（５）に代入される。

上記式（５）は極性予測値の算出式であり、各極性指標値の相加平均をとる。Ｓｄ_jは、ターゲット残基であるアミノ酸残基Ａ_jの疎水性予測値であり、σｄ_j-4+iは、アミノ酸残基列を構成する各アミノ酸残基の極性指標値である。このアミノ酸残基列は、追加部４０３による追加後のアミノ酸残基列でもよく、追加部４０３による追加の必要がない中間部のアミノ酸残基列でもよい。したがって、ターゲット残基Ａ_jがいずれの配置位置ｊであっても共通の計算式を適用することができ、計算手法の相違による精度ばらつきが生じない。なお、算出された各予測値Ｓａ_j，Ｓｂ_j，Ｓｄ_jは処理結果４１０として保持される。一方、疎水性予測値Ｓｃ_jは変換部４０５に送られる。

また、図４において、変換部４０５は、予測値算出部４０４によって算出された疎水性予測値Ｓｃ_jを親水性予測値に変換する機能を有する。具体的には、たとえば、疎水性予測値Ｓｃ_jを規格化し、そのインバースをとることにより変換する。たとえば、アミノ酸残基Ａ_jの疎水性予測値Ｓｃ_jについては、規格化パラメータＦｃは、下記式（６）によってあらわすことができる。なお、Ｓｃ（ｍａｘ）は疎水性予測値Ｓｃ_jの最大値であり、Ｓｃ（ｍｉｎ）は疎水性予測値Ｓｃ_jの最小値である。

Ｆｃ＝１．０／｛Ｓｃ（ｍａｘ）−Ｓｃ（ｍｉｎ）｝・・・・・・・・・・・・・（６）

そして、規格化された疎水性予測値をＰｃ_jとすると、疎水性予測値Ｐｃ_jは、下記式（７）によってあらわすことができる。この式（７）により疎水性予測値Ｓｃ_jを、数値範囲が０≦Ｐｃ_j≦１となる疎水性予測値Ｐｃ_jに規格化することができる。

Ｐｃ_j＝｛Ｓｃ_j−Ｓｃ（ｍｉｎ）｝×Ｆｃ・・・・・・・・・・・・・・・・・（７）

そして、変換部４０５では、インバース処理により、規格化された疎水性予測値Ｐｃ_jを親水性予測値Ｈ_jに変換する。疎水性予測値Ｐｃ_jは、数値範囲が０≦Ｐｃ_j≦１として規格化されているため、下記式（８）により、規格化された親水性予測値Ｈ_jに変換する。この親水性予測値Ｈ_jは処理結果４１０として保持される。

Ｈ_j＝１−Ｐｃ_j・・・・・・・・・・・・・・・・・・・・・・・・・・・・・（８）

また、規格化部４０６は、処理結果４１０である各予測値Ｓａ_j，Ｓｂ_j，Ｓｄ_jを規格化する機能を有する。親水性予測値Ｈ_jは規格化された疎水性予測値Ｐｃ_jのインバース処理結果であるため、すでに規格化済みである。この規格化部４０６は、後述する複合予測値算出部４０７による複合予測値を算出する場合に、各予測値Ｓａ_j，Ｓｂ_j，Ｓｄ_jを同一の尺度に統一するためにおこなう処理である。

たとえば、抗原決定性予測値Ｓａ_jについては、規格化パラメータＦａは、下記式（９）によってあらわすことができる。なお、Ｓａ（ｍａｘ）は抗原決定性予測値Ｓａ_jの最大値であり、Ｓａ（ｍｉｎ）は抗原決定性予測値Ｓａ_jの最小値である。

Ｆａ＝１．０／｛Ｓａ（ｍａｘ）−Ｓａ（ｍｉｎ）｝・・・・・・・・・・・・・（９）

そして、規格化された抗原決定性予測値をＰａ_jとすると、抗原決定性予測値Ｐａ_jは、下記式（１０）によってあらわすことができる。この式（１０）により抗原決定性予測値Ｓａ_jを、数値範囲が０≦Ｐａ_j≦１となる抗原決定性予測値Ｐａ_jに規格化することができる。

Ｐａ_j＝｛Ｓａ_j−Ｓａ（ｍｉｎ）｝×Ｆａ・・・・・・・・・・・・・・・・（１０）

同様に、たとえば、柔軟性予測値Ｓｂ_jについては、規格化パラメータＦｂは、下記式（１１）によってあらわすことができる。なお、Ｓｂ（ｍａｘ）は柔軟性予測値Ｓｂ_jの最大値であり、Ｓｂ（ｍｉｎ）は柔軟性予測値Ｓｂ_jの最小値である。

Ｆｂ＝１．０／｛Ｓｂ（ｍａｘ）−Ｓｂ（ｍｉｎ）｝・・・・・・・・・・・・（１１）

そして、規格化された柔軟性予測値をＰｂ_jとすると、柔軟性予測値Ｐｂ_jは、下記式（１２）によってあらわすことができる。この式（１２）により柔軟性予測値Ｓｂ_jを、数値範囲が０≦Ｐｂ_j≦１となる柔軟性予測値をＰｂ_jに規格化することができる。

Ｐｂ_j＝｛Ｓｂ_j−Ｓｂ（ｍｉｎ）｝×Ｆｂ・・・・・・・・・・・・・・・・（１２）

また、たとえば、極性予測値Ｓｄ_jについては、規格化パラメータＦｄは、下記式（１３）によってあらわすことができる。なお、Ｓｄ（ｍａｘ）は極性予測値Ｓｄ_jの最大値であり、Ｓｄ（ｍｉｎ）は極性予測値Ｓｄ_jの最小値である。

Ｆｄ＝１．０／｛Ｓｄ（ｍａｘ）−Ｓｄ（ｍｉｎ）｝・・・・・・・・・・・・（１３）

そして、規格化された極性予測値をＰｄ_jとすると、極性予測値Ｐｄ_jは、下記式（１４）によってあらわすことができる。この式（１４）により極性予測値Ｓｄ_jを、数値範囲が０≦Ｐｄ_j≦１となる極性予測値Ｐｄ_jに規格化することができる。

Ｐｄ_j＝｛Ｓｄ_j−Ｓｄ（ｍｉｎ）｝×Ｆｄ・・・・・・・・・・・・・・・・（１４）

また、複合予測値算出部４０７は、同一配列番号ｊのアミノ酸残基Ａ_jについての複数種類の規格化された予測値Ｐａ_j、Ｐｂ_j、Ｈ_j、Ｐｄ_jから複合予測値を算出する。具体的には、たとえば、抗原決定性予測と柔軟性予測とにより抗原決定基予測をおこなう場合、同一配列番号ｊのアミノ酸残基Ａ_jについて、抗原決定性予測値Ｐａ_jと柔軟性予測値Ｐｂ_jとを乗算することにより、抗原決定性予測値Ｐａ_jと柔軟性予測値Ｐｂ_jとの複合予測値を算出する。

このように、複数種類の規格化された予測値Ｐａ_j、Ｐｂ_j、Ｈ_j、Ｐｄ_jの中から選ばれた予測値の組み合わせを乗算することにより複合予測値を算出することができる。たとえば、上記のほかに、
・抗原決定性予測値Ｐａ_jと親水性予測値Ｈ_jとの複合予測値、
・抗原決定性予測値Ｐａ_jと極性予測値Ｐｄ_jとの複合予測値、
・抗原決定性予測値Ｐａ_jと柔軟性予測値Ｐｂ_jと親水性予測値Ｈ_jとの複合予測値、
・抗原決定性予測値Ｐａ_jと柔軟性予測値Ｐｂ_jと極性予測値Ｐｄ_jとの複合予測値、
・抗原決定性予測値Ｐａ_jと柔軟性予測値Ｐｂ_jと親水性予測値Ｈ_jと極性予測値Ｐｄ_jとの複合予測値、
・柔軟性予測値Ｐｂ_jと親水性予測値Ｈ_jとの複合予測値、
・柔軟性予測値Ｐｂ_jと極性予測値Ｐｄ_jとの複合予測値、
・柔軟性予測値Ｐｂ_jと親水性予測値Ｈ_jと極性予測値Ｐｄ_jとの複合予測値、
・親水性予測値Ｈ_jと極性予測値Ｐｄ_jとの複合予測値
を算出することができる。

また、複合予測値の算出の際、各特性に応じた寄与率を与えることとしてもよい。たとえば、抗原決定性予測値Ｐａ_jの重み値をｗａとし、柔軟性予測値Ｐｂ_jの重み値をｗｂとし、親水性予測値Ｈ_jの重み値をｗｃとし、極性予測値Ｐｄ_jの重み値をｗｄとした場合、ある特性予測値に対する寄与率ＣＲｘは、下記式（１５）によってあらわすことができる。

ＣＲｘ＝〔ｗｘ／（ｗａ＋ｗｂ＋ｗｃ＋ｗｄ）〕×１００・・・・・・・・・（１５）
ただし、ｘはｘ＝ａ，ｂ，ｃ，ｄのいずれかをとる。ａは抗原決定性、ｂは柔軟性、ｃは親水性、ｄは極性をあらわす。なお、複合予測で適用されない特性がある場合は、上記式（１５）から除かれる。たとえば、抗原決定性、柔軟性および親水性の複合予測値を算出する場合には、寄与率ＣＲｘは下記式（１６）のとおりである。

ＣＲｘ＝〔ｗｘ／（ｗａ＋ｗｂ＋ｗｃ）〕×１００・・・・・・・・・・・・（１６）
ただし、ｘはｘ＝ａ，ｂ，ｃのいずれかをとる。

また、寄与率ＣＲｘを用いた場合の抗原決定性予測値Ｐａ_jと柔軟性予測値Ｐｂ_jと親水性予測値Ｈ_jと極性予測値Ｐｄ_jとの複合予測値Ｐａｂｃ_jは、下記式（１７）によりあらわすことができる。

Ｐａｂｃｄ_j＝ＣＲａ×Ｐａ_j×ＣＲｂ×Ｐｂ_j×ＣＲｃ×Ｈ_j×ＣＲｄ×Ｐｄ_j
・・・・・・（１７）

また、決定部４０８は、各予測値に基づいて、アミノ酸残基Ａ_jを抗原決定基に決定する。具体的には、たとえば、抗原決定性予測値Ｐａ_j（またはＳａ_j）についてしきい値を設定しておき、抗原決定性予測値Ｐａ_j（またはＳａ_j）がしきい値以上であれば、アミノ酸残基Ａ_jを抗原決定基に決定し、しきい値未満であれば、抗原決定基に決定しない。柔軟性予測値Ｐｂ_j（またはＳｂ_j）、親水性予測値Ｈ_j、極性予測値Ｐｄ_j（またはＳｄ_j）についても同様である。

また、複合予測値算出部４０７によって算出された複合予測値についても同様である。具体的には、たとえば、アミノ酸残基Ａ_jの複合予測値がしきい値以上であれば、アミノ酸残基Ａ_jを抗原決定基に決定し、しきい値未満であれば、抗原決定基に決定しない。

また、決定部４０８は、任意の予測値と、当該予測値と他の予測値との複合予測値との差分により、抗原決定基を決定することとしてもよい。この場合、他の予測値の影響により抗原決定基に決定されることとなる。

たとえば、抗原決定性予測値Ｐａ_jと柔軟性予測値Ｐｂ_jとの複合予測値をＰａｂ_jとすると、差分となるＰａｂ_j−Ｐｂ_jがしきい値以上であれば、アミノ酸残基Ａ_jを抗原決定基に決定し、しきい値未満であれば、抗原決定基に決定しない。これにより、配列番号ｊのアミノ酸残基Ａ_jは、抗原決定性予測値Ｐａ_jの影響により抗原決定基に決定されたことがわかる。他の複合予測値についても同様である。

また、出力部４０９は、処理結果４１０を出力する。出力形式は、表示画面による表示、プリンタによる印刷出力、外部装置への送信、内部の記憶領域への格納のいずれでもよい。また、表示画面による表示は各アミノ酸残基Ａ_jの予測値の一覧でもよく横軸をアミノ酸残基と配列位置ｊ、縦軸を各種予測値とするグラフ表示でもよい。

また、出力されるデータは、規格化前の各予測値Ｓａ_j，Ｓｂ_j，Ｓｃ_j，Ｓｄ_jでもよく、規格化後の予測値Ｐａ_j，Ｐｂ_j，Ｈ_j，Ｐｄ_jでもよく、複合予測値でもよい。また、決定部４０８によって決定された抗原決定基となるアミノ酸残基も強調表示することとしてもよい。

ここで、グラフ表示例を以下に示す。図１２〜図１７は、出力部４０９による出力結果を示すグラフである。図１２は抗原決定性予測の波形Ｗａを示すグラフ、図１３は柔軟性予測の波形Ｗｂを示すグラフ、図１４は親水性予測の波形Ｗｃを示すグラフ、図１５は疎水性予測の波形Ｗｋを示すグラフ、図１６は極性予測の波形Ｗｄを示すグラフ、図１７は複合予測結果の波形Ｗを示すグラフである。

各グラフにおいて、横軸はアミノ酸残基の配列位置ｊを示しており、上部に表示されている一次構造配列データＡＳ１に対応する。縦軸は規格化された予測値を示している。図１２〜図１４および図１６では本実施の形態が適用されているため、Ｎ末端部位において予測値が波形として形成されている。一方、図１５では本実施の形態が適用されていないため、特徴的なＮ末端部位の予測値が得られず、波形が形成されていないことがわかる。

（特性予測処理手順）
つぎに、特性予測処理手順について説明する。図１８は、抗原決定性予測手順を示すフローチャートである。まず、取得部４０１により、一次構造配列データＡＳ１が取得されるのを待ち受け（ステップＳ１８０１：Ｎｏ）、取得された場合（ステップＳ１８０１：Ｙｅｓ）、配列番号ｊ＝０とする（ステップＳ１８０２）。そして、判断部４０２により、ターゲット残基Ａ_jがＣ末端部位またはＮ末端部位であるか否かを判断する（ステップＳ１８０３）。

Ｃ末端部位またはＮ末端部位でない場合（ステップＳ１８０３：Ｎｏ）、ターゲット残基Ａ_jは中間部に位置するため、ステップＳ１８０５に移行する。一方、Ｃ末端部位またはＮ末端部位である場合（ステップＳ１８０３：Ｙｅｓ）、追加部４０３により、アミノ酸残基を該当する末端に追加する（ステップＳ１８０４）。

そして、ステップＳ１８０５において、予測値算出部４０４により、ターゲット残基Ａ_jを含むアミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値を変換テーブル６００（または７００）から読み出し（ステップＳ１８０５）、変換テーブル６００（または７００）に応じた所定の抗原決定性予測手法でターゲット残基Ａ_jの抗原決定性予測値Ｓａ_jを算出する（ステップＳ１８０６）。

このあと配列位置ｊをインクリメントし（ステップＳ１８０７）、ｊ＞ｍであるか否かを判断する（ステップＳ１８０８）。ｊ＞ｍでない場合（ステップＳ１８０８：Ｎｏ）、ステップＳ１８０３に戻る。一方、ｊ＞ｍである場合（ステップＳ１８０８：Ｙｅｓ）、出力部４０９により出力処理をおこなう（ステップＳ１８０９）。グラフ表示をおこなう場合には図１２に示したようなグラフが表示画面に表示されることとなる。

このように、抗原決定性予測処理では、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基について抗原決定性予測値を算出することができ、最も知りたい部位であるＮ末端部位やＣ末端部位についての抗原決定性を予測することができる。また、Ｎ末端部位やＣ末端部位とその中間部とでは共通の計算手法により抗原決定性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。

図１９は、柔軟性予測手順を示すフローチャートである。まず、取得部４０１により、一次構造配列データＡＳ１が取得されるのを待ち受け（ステップＳ１９０１：Ｎｏ）、取得された場合（ステップＳ１９０１：Ｙｅｓ）、配列番号ｊ＝０とする（ステップＳ１９０２）。そして、判断部４０２により、ターゲット残基Ａ_jがＣ末端部位またはＮ末端部位であるか否かを判断する（ステップＳ１９０３）。

Ｃ末端部位またはＮ末端部位でない場合（ステップＳ１９０３：Ｎｏ）、ターゲット残基Ａ_jは中間部に位置するため、ステップＳ１９０５に移行する。一方、Ｃ末端部位またはＮ末端部位である場合（ステップＳ１９０３：Ｙｅｓ）、追加部４０３により、アミノ酸残基を該当する末端に追加する（ステップＳ１９０４）。

そして、ステップＳ１９０５において、予測値算出部４０４により、ターゲット残基Ａ_jを含むアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値を変換テーブル８００から読み出し（ステップＳ１９０５）、所定の柔軟性予測手法でターゲット残基Ａ_jの柔軟性予測値Ｓｂ_jを算出する（ステップＳ１９０６）。

このあと配列位置ｊをインクリメントし（ステップＳ１９０７）、ｊ＞ｍであるか否かを判断する（ステップＳ１９０８）。ｊ＞ｍでない場合（ステップＳ１９０８：Ｎｏ）、ステップＳ１９０３に戻る。一方、ｊ＞ｍである場合（ステップＳ１９０８：Ｙｅｓ）、出力部４０９により出力処理をおこなう（ステップＳ１９０９）。グラフ表示をおこなう場合には図１３に示したようなグラフが表示画面に表示されることとなる。

このように、柔軟性予測処理では、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基について柔軟性予測値を算出することができ、最も知りたい部位であるＮ末端部位やＣ末端部位についての柔軟性を予測することができる。また、Ｎ末端部位やＣ末端部位とその中間部とでは共通の計算手法により柔軟性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。

図２０は、疎水性／親水性予測手順を示すフローチャートである。まず、取得部４０１により、一次構造配列データＡＳ１が取得されるのを待ち受け（ステップＳ２００１：Ｎｏ）、取得された場合（ステップＳ２００１：Ｙｅｓ）、配列番号ｊ＝０とする（ステップＳ２００２）。そして、判断部４０２により、ターゲット残基Ａ_jがＣ末端部位またはＮ末端部位であるか否かを判断する（ステップＳ２００３）。

Ｃ末端部位またはＮ末端部位でない場合（ステップＳ２００３：Ｎｏ）、ターゲット残基Ａ_jは中間部に位置するため、ステップＳ２００５に移行する。一方、Ｃ末端部位またはＮ末端部位である場合（ステップＳ２００３：Ｙｅｓ）、追加部４０３により、アミノ酸残基を該当する末端に追加する（ステップＳ２００４）。

そして、ステップＳ２００５において、予測値算出部４０４により、ターゲット残基Ａ_jを含むアミノ酸残基列を構成する各アミノ酸残基の疎水性指標値を変換テーブル１０００から読み出し（ステップＳ２００５）、所定の疎水性予測手法でターゲット残基Ａ_jの疎水性予測値Ｓｃ_jを算出する（ステップＳ２００６）。

このあと、規格化部４０６により、ターゲット残基Ａ_jの疎水性予測値Ｓｃ_jを規格化し（ステップＳ２００７）、変換部４０５により、規格化された疎水性指標値を親水性予測値Ｈ_jに変換する（ステップＳ２００８）。そして、配列位置ｊをインクリメントし（ステップＳ２００９）、ｊ＞ｍであるか否かを判断する（ステップＳ２０１０）。ｊ＞ｍでない場合（ステップＳ２０１０：Ｎｏ）、ステップＳ２００３に戻る。一方、ｊ＞ｍである場合（ステップＳ２０１０：Ｙｅｓ）、出力部４０９により出力処理をおこなう（ステップＳ２０１１）。グラフ表示をおこなう場合には図１４に示したようなグラフが表示画面に表示されることとなる。

このように、疎水性／親水性予測処理では、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基について親水性予測値を算出することができ、最も知りたい部位であるＮ末端部位やＣ末端部位についての親水性を予測することができる。また、Ｎ末端部位やＣ末端部位とその中間部とでは共通の計算手法により親水性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。

図２１は、極性予測手順を示すフローチャートである。まず、取得部４０１により、一次構造配列データＡＳ１が取得されるのを待ち受け（ステップＳ２１０１：Ｎｏ）、取得された場合（ステップＳ２１０１：Ｙｅｓ）、配列番号ｊ＝０とする（ステップＳ２１０２）。そして、判断部４０２により、ターゲット残基Ａ_jがＣ末端部位またはＮ末端部位であるか否かを判断する（ステップＳ２１０３）。

Ｃ末端部位またはＮ末端部位でない場合（ステップＳ２１０３：Ｎｏ）、ターゲット残基Ａ_jは中間部に位置するため、ステップＳ２１０５に移行する。一方、Ｃ末端部位またはＮ末端部位である場合（ステップＳ２１０３：Ｙｅｓ）、追加部４０３により、アミノ酸残基を該当する末端に追加する（ステップＳ２１０４）。

そして、ステップＳ２１０５において、予測値算出部４０４により、ターゲット残基Ａ_jを含むアミノ酸残基列を構成する各アミノ酸残基の極性指標値を変換テーブル１１００から読み出し（ステップＳ２１０５）、所定の極性予測手法でターゲット残基Ａ_jの極性予測値Ｓｄ_jを算出する（ステップＳ２１０６）。

このあと配列位置ｊをインクリメントし（ステップＳ２１０７）、ｊ＞ｍであるか否かを判断する（ステップＳ２１０８）。ｊ＞ｍでない場合（ステップＳ２１０８：Ｎｏ）、ステップＳ２１０３に戻る。一方、ｊ＞ｍである場合（ステップＳ２１０８：Ｙｅｓ）、出力部４０９により出力処理をおこなう（ステップＳ２１０９）。グラフ表示をおこなう場合には図１６に示したようなグラフが表示画面に表示されることとなる。

このように、極性予測処理では、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基について極性予測値を算出することができ、最も知りたい部位であるＮ末端部位やＣ末端部位についての極性を予測することができる。また、Ｎ末端部位やＣ末端部位とその中間部とでは共通の計算手法により極性予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。

図２２は、複合予測手順を示すフローチャートである。まず、取得部４０１により、一次構造配列データＡＳ１が取得されるのを待ち受け（ステップＳ２２０１：Ｎｏ）、取得された場合（ステップＳ２２０１：Ｙｅｓ）、抗原決定性予測処理（ステップＳ２２０２）、柔軟性予測処理（ステップＳ２２０３）、疎水性／親水性予測処理（ステップＳ２２０４）、極性予測処理（ステップＳ２２０５）を実行する。

ここで、抗原決定性予測処理（ステップＳ２２０２）とは、抗原決定性予測処理手順のステップＳ１８０２〜Ｓ１８０８までの処理であり、柔軟性予測処理（ステップＳ２２０３）とは、柔軟性予測処理手順のステップＳ１９０２〜Ｓ１９０８までの処理であり、疎水性／親水性予測処理（ステップＳ２２０４）とは、疎水性／親水性予測処理手順のステップＳ２００２〜Ｓ２０１０までの処理であり、極性予測処理（ステップＳ２２０５）とは、極性予測処理手順のステップＳ２１０２〜Ｓ２１０８までの処理である。

ここでは、抗原決定性予測処理（ステップＳ２２０２）、柔軟性予測処理（ステップＳ２２０３）、疎水性／親水性予測処理（ステップＳ２２０４）、極性予測処理（ステップＳ２２０５）の順に処理することとしたが、どのような順番で処理してもよく、また並列処理としてもよい。また、ここでは、抗原決定性予測処理（ステップＳ２２０２）、柔軟性予測処理（ステップＳ２２０３）、疎水性／親水性予測処理（ステップＳ２２０４）、極性予測処理（ステップＳ２２０５）をすべて実行しているが、少なくとも２種類の特性予測処理があれば複合予測値の算出が可能である。したがって、複合予測値をもとめるのに必要な特性予測処理のみを実行すればよい。

このあと、配列位置ｊ＝０とし（ステップＳ２２０６）、規格化部４０６により、アミノ酸残基Ａ_jの各特性予測値を規格化する（ステップＳ２２０７）。なお、親水性予測値Ｈ_jはすでに規格化されているためその必要はない。そして、複合予測値算出部４０７により、アミノ酸残基Ａ_jの複合予測値を算出する（ステップＳ２２０８）。

そして、配列位置ｊをインクリメントし（ステップＳ２２０９）、ｊ＞ｍであるか否かを判断する（ステップＳ２２１０）。ｊ＞ｍでない場合（ステップＳ２２１０：Ｎｏ）、ステップＳ２２０７に戻る。一方、ｊ＞ｍである場合（ステップＳ２２１０：Ｙｅｓ）、決定部４０８により、一次構造配列データＡＳ１内のアミノ酸残基の中から抗原決定基を決定する（ステップＳ２２１１）。最後に、出力部４０９により出力処理をおこなう（ステップＳ２２１２）。グラフ表示をおこなう場合には図１７に示したようなグラフが表示画面に表示されることとなる。

このように、複合予測処理では、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基について複合予測値を算出することができ、最も知りたい部位であるＮ末端部位やＣ末端部位についての複合を予測することができる。また、Ｎ末端部位やＣ末端部位とその中間部とでは共通の計算手法により複合予測値を算出することができるため、計算手法によるばらつきが発生することなく高精度な予測を実現することができる。さらに、複雑なアルゴリズムを構築する必要がなく、既存の予測手法から簡単にカスタマイズするだけで、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基の予測値を網羅することができる。

以上説明したように、上述した実施の形態によれば、最も知りたい部位であるアミノ酸配列の末端部位の特性予測をおこなうことができる。また、その末端部位の特性予測をその中間部の予測処理と共通の手法により実現することにより、Ｎ末端からＣ末端に至るまでのすべてのアミノ酸残基を網羅する特性予測を簡単かつ高精度に実現することができる。これにより、抗体の作成時間短縮および費用低減を図ることができる。

なお、この実施の形態で説明した特性予測方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。

（付記１）コンピュータを、
任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得手段、
前記取得手段によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断手段、
前記判断手段によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断手段によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加手段、
前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出手段、
前記算出手段によって算出された算出結果を出力する出力手段、
として機能させることを特徴とする特性予測プログラム。

（付記２）前記所定の特性予測手法は、抗原決定性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値と前記抗原決定性予測手法とに基づいて、前記目的アミノ酸残基の抗原決定性予測値を算出することを特徴とする付記１に記載の特性予測プログラム。

（付記３）前記追加手段は、前記目的アミノ酸残基と同一のアミノ酸残基を追加することを特徴とする付記２に記載の特性予測プログラム。

（付記４）前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基を追加することを特徴とする付記３に記載の特性予測プログラム。

（付記５）前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基のうち前記目的アミノ酸残基と配列位置が近いアミノ酸残基を追加することを特徴とする付記４に記載の特性予測プログラム。

（付記６）前記所定の特性予測手法は、柔軟性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記柔軟性予測手法とに基づいて、前記目的アミノ酸残基の柔軟性予測値を算出することを特徴とする付記１に記載の特性予測プログラム。

（付記７）前記所定の特性予測手法が、疎水性／親水性予測手法である場合、前記コンピュータを、前記算出手段によって算出された算出結果を変換する変換手段として機能させ、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記所定の疎水性予測手法とに基づいて、前記目的アミノ酸残基の疎水性予測値を算出し、
前記変換手段は、前記目的アミノ酸残基の疎水性予測値を前記目的アミノ酸残基の親水性予測値に変換し、
前記出力手段は、前記変換手段によって変換された変換結果を出力することを特徴とする付記１に記載の特性予測プログラム。

（付記８）前記所定の特性予測手法は、極性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の極性指標値と前記極性予測手法とに基づいて、前記目的アミノ酸残基の極性予測値を算出することを特徴とする付記１に記載の特性予測プログラム。

（付記９）前記追加手段は、前記目的アミノ酸残基とは異なるアミノ酸残基を追加することを特徴とする付記６〜８のいずれか一つに記載の特性予測プログラム。

（付記１０）前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基を追加することを特徴とする付記９に記載の特性予測プログラム。

（付記１１）前記追加手段は、前記判断手段によって判断された末端部位に含まれるアミノ酸残基のうち前記目的アミノ酸残基から配列位置が遠いアミノ酸残基を追加することを特徴とする付記１０に記載の特性予測プログラム。

（付記１２）任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得手段と、
前記取得手段によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断手段と、
前記判断手段によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断手段によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加手段と、
前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出手段と、
前記算出手段によって算出された算出結果を出力する出力手段と、
を備えることを特徴とする特性予測装置。

（付記１３）任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得工程と、
前記取得工程によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断工程と、
前記判断工程によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断工程によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加工程と、
前記追加工程によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出工程と、
前記算出工程によって算出された算出結果を出力する出力工程と、
を含んだことを特徴とする特性予測方法。

以上のように、本発明にかかる特性予測プログラム、特性予測装置、および特性予測方法は、薬理学、生化学、タンパク質の立体構造を利用、研究する分野全般に有用である。

抗原決定性予測をおこなう場合のＮ末端部位およびＣ末端部位の調整内容を示す説明図である。柔軟性予測、疎水性／親水性予測、または極性予測をおこなう場合のＮ末端部位およびＣ末端部位の調整内容を示す説明図である。特性予測装置のハードウェア構成を示す説明図である。この発明の実施の形態にかかる特性予測装置の機能的構成を示すブロック図である。アミノ酸配列の一次構造配列データの一例を示す説明図である。一次構造データと抗原決定性指標値との変換テーブルを示す説明図である。Ｈｏｏｐ−Ｗｏｏｄｓ法を適用する場合の一次構造データと抗原決定性指標値との変換テーブルを示す説明図である。柔軟性予測に関する変換テーブルを示す説明図である。隣接アミノ酸残基の硬軟の組み合わせを示す説明図である。疎水性予測に関する変換テーブルを示す説明図である。極性予測に関する変換テーブルを示す説明図である。抗原決定性予測の波形Ｗａを示すグラフである。柔軟性予測の波形Ｗｂを示すグラフである。親水性予測の波形Ｗｃを示すグラフである。疎水性予測の波形Ｗｋを示すグラフである。極性予測の波形Ｗｄを示すグラフである。複合予測結果の波形Ｗを示すグラフである。抗原決定性予測手順を示すフローチャートである。柔軟性予測手順を示すフローチャートである。疎水性／親水性予測手順を示すフローチャートである。極性予測手順を示すフローチャートである。複合予測手順を示すフローチャートである。

符号の説明

３００特性予測装置
４０１取得部
４０２判断部
４０３追加部
４０４予測値算出部
４０５変換部
４０６規格化部
４０７複合予測値算出部
４０８決定部
４０９出力部
６００，７００，８００，１０００，１１００変換テーブル
ＡＳ１一次構造配列データ
Ａ_j アミノ酸残基
ＣＲｘ寄与率
Ｆａ，Ｆｂ，Ｆｃ，Ｆｄ規格化パラメータ
Ｈ_j 親水性予測値（規格化済み）
ｊ配列番号
Ｐａ_j 抗原決定性予測値（規格化済み）
Ｐｂ_j 柔軟性予測値（規格化済み）
Ｐｃ_j 疎水性予測値（規格化済み）
Ｐｄ_j 極性予測値（規格化済み）
Ｓａ_j 抗原決定性予測値
Ｓｂ_j 柔軟性予測値
Ｓｃ_j 疎水性予測値
Ｓｄ_j 極性予測値

Claims

コンピュータを、
任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得手段、
前記取得手段によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断手段、
前記判断手段によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断手段によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加手段、
前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出手段、
前記算出手段によって算出された算出結果を出力する出力手段、
として機能させることを特徴とする特性予測プログラム。
前記所定の特性予測手法は、抗原決定性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の抗原決定性指標値と前記抗原決定性予測手法とに基づいて、前記目的アミノ酸残基の抗原決定性予測値を算出することを特徴とする請求項１に記載の特性予測プログラム。
前記追加手段は、前記目的アミノ酸残基と同一のアミノ酸残基を追加することを特徴とする請求項２に記載の特性予測プログラム。
前記所定の特性予測手法は、柔軟性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記柔軟性予測手法とに基づいて、前記目的アミノ酸残基の柔軟性予測値を算出することを特徴とする請求項１に記載の特性予測プログラム。
前記所定の特性予測手法が、疎水性／親水性予測手法である場合、前記コンピュータを、前記算出手段によって算出された算出結果を変換する変換手段として機能させ、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の柔軟性指標値と前記所定の疎水性予測手法とに基づいて、前記目的アミノ酸残基の疎水性予測値を算出し、
前記変換手段は、前記目的アミノ酸残基の疎水性予測値を前記目的アミノ酸残基の親水性予測値に変換し、
前記出力手段は、前記変換手段によって変換された変換結果を出力することを特徴とする請求項１に記載の特性予測プログラム。
前記所定の特性予測手法は、極性予測手法であり、
前記算出手段は、前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の極性指標値と前記極性予測手法とに基づいて、前記目的アミノ酸残基の極性予測値を算出することを特徴とする請求項１に記載の特性予測プログラム。
任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得手段と、
前記取得手段によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断手段と、
前記判断手段によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断手段によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加手段と、
前記追加手段によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出手段と、
前記算出手段によって算出された算出結果を出力する出力手段と、
を備えることを特徴とする特性予測装置。
任意のタンパク質をあらわすアミノ酸配列の一次構造配列データを取得する取得工程と、
前記取得工程によって取得された一次構造配列データの中から選ばれた目的アミノ酸残基が、配列位置が連続する所定数の一連のアミノ酸残基を用いた所定の特性予測手法で予測不能な前記一次構造配列データの両末端部位のうち、いずれの末端部位に含まれているかを判断する判断工程と、
前記判断工程によって判断された末端部位の末端基に任意のアミノ酸残基を追加することにより、前記判断工程によって判断された末端部位を、前記所定数と同数のアミノ酸残基列にする追加工程と、
前記追加工程によって得られたアミノ酸残基列を構成する各アミノ酸残基の特性指標値と前記所定の特性予測手法とに基づいて、前記目的アミノ酸残基の特性予測値を算出する算出工程と、
前記算出工程によって算出された算出結果を出力する出力工程と、
を含んだことを特徴とする特性予測方法。