JPWO2014167744A1

JPWO2014167744A1 - タンパク質解析装置、タンパク質解析方法、および、プログラム

Info

Publication number: JPWO2014167744A1
Application number: JP2015511071A
Authority: JP
Inventors: 卓磨葛西; 木川　隆則; 隆則木川
Original assignee: RIKEN Institute of Physical and Chemical Research
Current assignee: RIKEN Institute of Physical and Chemical Research
Priority date: 2013-04-10
Filing date: 2013-10-10
Publication date: 2017-02-16
Anticipated expiration: 2033-10-10
Also published as: JP6191927B2; WO2014167744A1

Abstract

本発明は、タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの同位体標識率であるかを規定する標識パターンで構成されたタンパク質である標識体のＮＭＲ測定により得られるシグナル情報を取得し、標識パターンに基づいて、シグナル情報に基づくシグナルがどのアミノ酸に由来するかを判別する。

Description

本発明は、タンパク質解析装置、タンパク質解析方法、および、プログラムに関する。

従来から、タンパク質の核磁気共鳴法（ＮＭＲ）による解析においては、主鎖帰属を行う種々の技術が開示されている。

特許文献１および２に記載のタンパク質解析方法においては、残基ごとに同位体標識率を変えられる化学合成系の特徴を活かして、同じアミノ酸で違う残基のシグナルを判別する技術が開示されている。

また、非特許文献１に記載のデュアル選択標識法においては、アミド窒素およびカルボニル炭素の化学シフトを用いて帰属を行う技術が開示されている。例えば、当該デュアル選択標識法においては、あるアミノ酸Ａについてアミド窒素を^１５Ｎ標識し、あるアミノ酸Ｂについてカルボニル炭素を^１３Ｃ標識し、^１３Ｃ−^１５Ｎの単結合のカップリングを利用するＮＭＲ測定を行うことにより、ＢＡという並び順のアミノ酸の組み合わせのみを観測することによって帰属を行う技術が開示されている。ここで、ＢＡというアミノ酸の組み合わせが対象タンパク質中にひとつしかない場合にはただちに、すなわち、連鎖帰属法によらずに帰属できる。

また、非特許文献２に記載のデュアル選択標識法においては、アミド窒素およびアミド水素の化学シフトを用いて帰属を行う技術が開示されている。

また、非特許文献３に記載の組み合わせ選択標識法においては、１種類のユニバーサル標識体、および、４種類の選択標識体のあわせて５種類の標識体のみを用いて帰属を行う技術が開示されている。ここで、当該組み合わせ選択標識法においては、^１５Ｎ標識率を５０％もしくは１００％、ならびに、^１３Ｃ標識率を０％もしくは１００％とした４標識体を組み合わせることによって、２の４乗つまり１６種類のアミノ酸を区別している。例えば、当該組み合わせ選択標識法においては、ＨＳＱＣスペクトルは対応するアミノ酸（「ｉ位」とする）の^１５Ｎ標識率に比例したシグナル強度となるので、ユニバーサル標識体と比較して４種の標識体のシグナル強度が弱いか同程度であるかを調べることで、ｉ位のアミノ酸を判別できる。また、当該組み合わせ選択標識法においては、ＨＮ（ＣＯ）スペクトルはｉ位の^１５Ｎ標識率と１残基Ｎ末端側のアミノ酸（「ｉ−１位」とする）の^１３Ｃ標識率双方に比例するが、^１５Ｎの標識率は５０％もしくは１００％、^１３Ｃの標識率は０％もしくは１００％であるので、シグナルがあるかどうかを調べることでｉ−１位のアミノ酸を判別できる。すなわち、当該組み合わせ選択標識法においては、ＨＮＣＯスペクトルの強度はｉ位の^１５Ｎ標識率とｉ−１位の^１３Ｃ標識率の双方に比例するから、^１５Ｎ、^１３Ｃ標識率が共に１００％である場合のＨＮＣＯ強度を仮に１とすると、^１３Ｃ標識率が０％である場合には強度０となり、^１３Ｃ標識率が１００％である場合には^１５Ｎ標識率により強度０．５または１となる。

特開２００７−２５４２９５号公報特開２００７−２５５９１０号公報

Ｍ．ＫａｉｎｏｓｈｏａｎｄＴ．Ｔｓｕｊｉ，ＡｓｓｉｇｎｍｅｎｔｏｆｔｈｅＴｈｒｅｅＭｅｔｈｉｏｎｙｌＣａｒｂｏｎｙｌＣａｒｂｏｎＲｅｓｏｎａｎｃｅｓｉｎＳｔｒｅｐｔｏｍｙｃｅｓＳｕｂｔｉｌｉｓｉｎＩｎｈｉｂｉｔｏｒｂｙａＣａｒｂｏｎ−１３ａｎｄＮｉｔｒｏｇｅｎ−１５ＤｏｕｂｌｅＬａｂｅｌｉｎｇＴｅｃｈｎｉｑｕｅ．ＡＮｅｗＳｔｒａｔｅｇｙｆｏｒＳｔｒｕｃｔｕｒａｌＳｔｕｄｉｅｓｏｆＰｒｏｔｅｉｎｓｉｎＳｏｌｕｔｉｏｎ"，Ｂｉｏｃｈｅｍｉｓｔｒｙ，２４，６２７３−６２７９（１９８２）．ＹａｂｕｋｉＴ，ＫｉｇａｗａＴ，ＤｏｈｍａｅＮ，ＴａｋｉｏＫ，ＴｅｒａｄａＴ，ＩｔｏＹ，ＬａｕｅＥＤ，ＣｏｏｐｅｒＪＡ，ＫａｉｎｏｓｈｏＭａｎｄＹｏｋｏｙａｍａＳ，Ｄｕａｌａｍｉｎｏａｃｉｄ−ｓｅｌｅｃｔｉｖｅａｎｄｓｉｔｅ−ｄｉｒｅｃｔｅｄｓｔａｂｌｅ−ｉｓｏｔｏｐｅｌａｂｅｌｉｎｇｏｆｔｈｅｈｕｍａｎｃ−Ｈａ−Ｒａｓｐｒｏｔｅｉｎｂｙｃｅｌｌ−ｆｒｅｅｓｙｎｔｈｅｓｉｓ，ＪＢｉｏｍｏｌＮＭＲ．１９９８Ａｐｒ；１１（３）：２９５−３０６．ＰａｒｋｅｒＭＪ，Ａｕｌｔｏｎ−ＪｏｎｅｓＭ，ＨｏｕｎｓｌｏｗＡＭａｎｄＣｒａｖｅｎＣＪ，ＡｃｏｍｂｉｎａｔｏｒｉａｌｓｅｌｅｃｔｉｖｅｌａｂｅｌｉｎｇｍｅｔｈｏｄｆｏｒｔｈｅａｓｓｉｇｎｍｅｎｔｏｆｂａｃｋｂｏｎｅａｍｉｄｅＮＭＲｒｅｓｏｎａｎｃｅｓ，ＪＡｍＣｈｅｍＳｏｃ．２００４Ａｐｒ２８；１２６（１６）：５０２０−１．

しかしながら、特許文献１および２に記載の従来のタンパク質解析方法においては、均一に標識した標識体を基準にして、グリシン４残基を４段階に標識してその４残基を区別しようとしているが、精度に関して、一度に区別できる残基の数を大幅に増やすことが難しいという問題点を有していた。また、当該タンパク質解析方法においては、仮に、１９種のアミノ酸を判別しようとすると、５．６％刻みで１９段階の標識率を設定せねばならず、実用的には困難であるという問題点を有していた。また、当該タンパク質解析方法においては、化学合成で安定同位体標識をするのは非常にコストがかかるという問題点を有していた。すなわち、当該タンパク質解析方法において、安価なグリシンだからこそ実施可能であるが、一般的に種々のアミノ酸に適用することは、実用上難しいという問題点を有していた。

また、非特許文献１および２に記載の従来のデュアル選択標識法においては、すべての主鎖シグナルについて情報を得るためには、対象タンパク質にあらわれるすべてのアミノ酸の組み合わせの数だけの標識体を用いなければならず、原理的には最大で３８０種類となってしまうという問題点を有していた。

また、非特許文献３に記載の従来の組み合わせ選択標識法においては、単に標識の有無や強弱といった定性的な情報のみに基づいているため、１９種類または２０種類のアミノ酸を区別するにはユニバーサル標識体を含めて６種類もの多くの標識体が必要となるという問題点を有していた。特に、当該組み合わせ選択標識法においては、対象タンパク質が高分子量である、低収量である、低溶解度である、または、会合しているなどの理由によりシグナル強度が低い場合、アミノ酸判別に十分なシグナル強度を得るためにＮＭＲ測定時間を長くせざるを得ず、標識体数が多くなるほどこの影響が大きくなるため、高難度のタンパク質に適用するのは現実的ではないという問題点を有していた。

本発明は、上記問題点に鑑みてなされたもので、少ない標識体数でアミノ酸判別を行なうことにより時間、コスト、および、手間を大幅に削減することができるタンパク質解析装置、タンパク質解析方法、および、プログラムを提供することを目的とする。

このような目的を達成するため、本発明のタンパク質解析装置は、記憶部と制御部とを少なくとも備えたタンパク質解析装置であって、上記記憶部は、タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの上記同位体標識率であるかを規定する標識パターンを記憶する標識パターン記憶手段と、上記標識パターンで構成された上記タンパク質である標識体のＮＭＲ測定により得られるシグナル情報を記憶するシグナル記憶手段と、を備え、上記制御部は、上記標識パターン記憶手段に記憶された上記標識パターンに基づいて、上記シグナル情報に基づく上記標識体のシグナルがどの上記アミノ酸に由来するかを判別する判別手段、を備えたことを特徴とする。

また、本発明のタンパク質解析装置は、上記記憶部は、上記タンパク質のアミノ酸配列に関する配列情報を記憶するタンパク質配列情報記憶手段、を更に備え、上記制御部は、上記タンパク質配列情報記憶手段に記憶された上記配列情報に基づいて、上記判別手段によりどの上記アミノ酸に由来するか判別された上記シグナルの帰属を決定する帰属手段、を更に備えたことを特徴とする。

また、本発明のタンパク質解析装置は、上記記載のタンパク質解析装置において、上記制御部は、上記標識体毎の上記同位体標識率の差の絶対値の和であるハミング距離に基づいて、上記標識パターンを生成し、上記標識パターン記憶手段に格納する標識パターン生成手段、を更に備えたことを特徴とする。

また、本発明のタンパク質解析装置は、上記記載のタンパク質解析装置において、上記ハミング距離は、以下の数式（１）を用いて算出することを特徴とする。

（ここで、ｄ（ｉ，ｊ）はアミノ酸ｉと，他のアミノ酸ｊと、の間のハミング距離、ｎは標識体の数、ｐ_ｉ ^ｋは標識体ｋにおけるアミノ酸ｉの同位体標識率、および、ｐ_ｊ ^ｋは標識体ｋにおけるアミノ酸ｊの同位体標識率である。）。

また、本発明のタンパク質解析装置は、上記記載のタンパク質解析装置において、上記制御部は、上記タンパク質を構成するアスパラギン酸とアスパラギンと、および／または、グルタミン酸とグルタミンとの間で起こるスクランブルに基づいて、上記標識パターンを生成し、上記標識パターン記憶手段に格納する標識パターン生成手段、を更に備えたことを特徴とする。

また、本発明のタンパク質解析装置は、上記記載のタンパク質解析装置において、上記元素は、窒素、および、炭素であることを特徴とする。

また、本発明のタンパク質解析装置は、上記記載のタンパク質解析装置において、上記制御部は、上記標識体間で濃度差がある場合、上記標識体を構成するアミノ酸のシグナル強度比に基づいて、上記シグナル情報を補正する補正手段、を更に備えたことを特徴とする。

また、本発明のタンパク質解析装置は、上記記載のタンパク質解析装置において、上記ＮＭＲ測定は、ＮＭＲ相関スペクトルの測定であることを特徴とする。

また、本発明のタンパク質解析方法は、記憶部と制御部とを少なくとも備えたタンパク質解析装置において実行されるタンパク質解析方法であって、上記記憶部は、タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの上記同位体標識率であるかを規定する標識パターンを記憶する標識パターン記憶手段と、上記標識パターンで構成された上記タンパク質である標識体のＮＭＲ測定により得られるシグナル情報を記憶するシグナル記憶手段と、を備え、上記制御部において実行される、上記標識パターン記憶手段に記憶された上記標識パターンに基づいて、上記シグナル情報に基づく上記標識体のシグナルがどの上記アミノ酸に由来するかを判別する判別ステップ、を含むことを特徴とする。

また、本発明のプログラムは、記憶部と制御部とを少なくとも備えたタンパク質解析装置に実行させるためのプログラムであって、上記記憶部は、タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの上記同位体標識率であるかを規定する標識パターンを記憶する標識パターン記憶手段と、上記標識パターンで構成された上記タンパク質である標識体のＮＭＲ測定により得られるシグナル情報を記憶するシグナル記憶手段と、を備え、上記制御部において、上記標識パターン記憶手段に記憶された上記標識パターンに基づいて、上記シグナル情報に基づく上記標識体のシグナルがどの上記アミノ酸に由来するかを判別する判別ステップ、を実行させることを特徴とする。

この発明によれば、標識パターンに基づいて、シグナル情報に基づく標識体のシグナルがどのアミノ酸に由来するかを判別するので、定量的な安定同位体標識率の情報を利用することで、選択標識体１種類あたりの情報量を増やし、少ない数の選択標識体でアミノ酸の判別が可能となるという効果を奏する。また、この発明によれば、アミノ酸ごとに標識率を変えられる、無細胞タンパク質合成系を含む生合成系の特徴を活かして、アミノ酸を判別することができるという効果を奏する。

また、この発明によれば、配列情報に基づいて、どのアミノ酸に由来するか判別されたシグナルの帰属を決定するので、定量的な安定同位体標識率の情報を利用して、どのシグナルがどのアミノ酸残基に由来するか決定することができるという効果を奏する。

また、この発明によれば、標識体毎の同位体標識率の差の絶対値の和であるハミング距離に基づいて、標識パターンを生成し、格納するので、最小ハミング距離が大きくなるように設定することで、アミノ酸の違いを明確に判別できるため、客観的基準に基づいて標識パターンの優劣を判断でき、任意のアミノ酸数を任意の標識体数で判別しようとする場合の、ノイズ等の攪乱要因に最も強い標識パターンを設計することができ、ひいては対象タンパク質が高分子量である、低収量である、低溶解度である、または、会合しているなどの理由によりシグナル強度が低い場合にも現実的な測定時間で解析できるという効果を奏する。

また、この発明によれば、ハミング距離は、以下の数式（１）を用いて算出するので、

（ここで、ｄ（ｉ，ｊ）はアミノ酸ｉと，他のアミノ酸ｊと、の間のハミング距離、ｎは標識体の数、ｐ_ｉ ^ｋは標識体ｋにおけるアミノ酸ｉの同位体標識率、および、ｐ_ｊ ^ｋは標識体ｋにおけるアミノ酸ｊの同位体標識率である。）
客観的基準に基づいて標識パターンの優劣を判断でき、任意のアミノ酸数を任意の標識体数で判別しようとする場合の、ノイズ等の攪乱要因に最も強い標識パターンを設計することができ、ひいては対象タンパク質が高分子量である、低収量である、低溶解度である、または、会合しているなどの理由によりシグナル強度が低い場合にも現実的な測定時間で解析できるという効果を奏する。

また、この発明によれば、タンパク質を構成するアスパラギン酸とアスパラギンと、および／または、グルタミン酸とグルタミンとの間で起こるスクランブルに基づいて、標識パターンを生成し、格納するので、ＮＭＲ測定時の誤差を軽減できるという効果を奏する。

また、この発明によれば、元素は、窒素、および、炭素であるので、さまざまなシステムに汎用的に、低コストで導入することができるという効果を奏する。

また、この発明によれば、標識体間で濃度差がある場合、標識体を構成するアミノ酸のシグナル強度比に基づいて、シグナル情報を補正するので、例えば、当該アミノ酸としてグリシンを使用した場合、^１５Ｎの化学シフトが低磁場側であり、他のアミノ酸と見分けやすいグリシンの特徴から、調製誤差の補正を精度良く行えるという効果を奏する。

また、この発明によれば、ＮＭＲ測定は、ＮＭＲ相関スペクトルの測定であるので、ｉ位およびｉ−１位双方のアミノ酸を効率的に判別できるという効果を奏する。

図１は、本実施の形態の基本原理を示すフローチャートである。図２は、本実施の形態におけるタンパク質解析装置の構成の一例を示すブロック図である。図３は、本実施の形態におけるタンパク質解析装置の処理の一例を示すフローチャートである。図４は、本実施の形態における標識パターンの一例を示す図である。図５は、本実施の形態における標識パターンの一例を示す図である。図６は、本実施の形態における標識パターンの一例を示す図である。図７は、本実施の形態における標識パターンの一例を示す図である。図８は、本実施の形態におけるアミノ酸溶液の組成の一例を示す図である。図９は、本実施の形態におけるアミノ酸溶液の組成の一例を示す図である。図１０は、本実施の形態におけるアミノ酸溶液の組成の一例を示す図である。図１１は、本実施の形態におけるシステイン水溶液の組成の一例を示す図である。図１２は、本実施の形態におけるシステイン水溶液の組成の一例を示す図である。図１３は、本実施の形態におけるシステイン水溶液の組成の一例を示す図である。図１４は、本実施の形態における透析外液の組成の一例を示す図である。図１５は、本実施の形態における透析内液の組成の一例を示す図である。図１６は、本実施の形態における標識体間のタンパク質濃度の一例を示す図である。図１７は、本実施の形態におけるアミノ酸判別処理の一例を示す図である。図１８は、本実施の形態における判別精度の一例を示す図である。図１９は、本実施の形態における重複シグナルを分離して判別した一例を示す図である。

以下に、本発明にかかるタンパク質解析装置、タンパク質解析方法、および、プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。

［本発明の実施の形態の概要］
以下、本発明の実施の形態の概要について図１を参照して説明し、その後、本実施の形態の構成および処理等について詳細に説明する。

まず、図１を参照して、本発明の実施の形態の概要の一例について説明する。図１は、本実施の形態の基本原理を示すフローチャートである。本実施の形態は、概略的に、以下の基本的特徴を有する。

すなわち、本実施の形態のタンパク質解析装置の制御部は、図１に示すように、タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの同位体標識率であるかを規定する標識パターンで構成されたタンパク質である標識体のＮＭＲ測定により得られるシグナル情報を取得する（ステップＳＡ−１）。

そして、タンパク質解析装置の制御部は、標識パターンに基づいて、シグナル情報に基づくシグナルがどのアミノ酸に由来するかを判別する（ステップＳＡ−２）。

以上で、本実施の形態の概要の説明を終える。

［タンパク質解析装置１００の構成］
次に、本実施の形態におけるタンパク質解析装置１００の構成の詳細について、図２を参照して以下に説明する。図２は、本実施の形態におけるタンパク質解析装置１００の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。ここで、本実施の形態におけるタンパク質解析装置１００においては、各構成が一筐体内に全て備えられ、単独で処理を行うもの（スタンドアローン型）を、タンパク質解析装置１００として説明するが、当該実施例に限らず、各構成が分離した筐体内に備えられ、ネットワーク３００等を介して接続されて１つの概念としての装置を構成するもの（例えば、クラウドコンピューティング等）であってもよい。

図２において、外部システム２００は、ネットワーク３００を介して、タンパク質解析装置１００と相互に接続され、タンパク質の配列情報等に関する外部データベース、ならびに／または、ユーザインターフェース等を実行するウェブサイトを提供する機能等を有していてもよい。

ここで、外部システム２００は、ＷＥＢサーバやＡＳＰサーバ等として構成していてもよい。また、外部システム２００のハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成していてもよい。また、外部システム２００の各機能は、外部システム２００のハードウェア構成中のＣＰＵ、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現されてもよい。

また、ネットワーク３００は、タンパク質解析装置１００と外部システム２００とを相互に接続する機能を有し、例えば、インターネット等である。

また、タンパク質解析装置１００は、概略的に、制御部１０２と通信制御インターフェース部１０４と記憶部１０６と入出力制御インターフェース部１０８とを備える。ここで、タンパク質解析装置１００は、更に、表示部１１２を少なくとも含む出力部、および、入力部１１４を備えていてもよい。また、出力部は、更に、音声出力部、および、印刷出力部等を含んでいてもよい。ここで、制御部１０２は、タンパク質解析装置１００の全体を統括的に制御するＣＰＵ等である。また、通信制御インターフェース部１０４は、通信回線等に接続されるルータ等の通信装置（図示せず）に接続されるインターフェースであり、入出力制御インターフェース部１０８は、出力部、および、入力部１１４に接続されるインターフェースである。また、記憶部１０６は、各種のデータベースやテーブルなどを格納する装置である。これらタンパク質解析装置１００の各部は任意の通信路を介して通信可能に接続されている。更に、このタンパク質解析装置１００は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク３００に通信可能に接続されている。

記憶部１０６に格納される各種のデータベースやテーブル（タンパク質配列情報データベース１０６ａ、標識パターンデータベース１０６ｂ、および、シグナルデータベース１０６ｃ）は、固定ディスク装置等のストレージ手段である。例えば、記憶部１０６は、各種処理に用いる各種のプログラム、テーブル、ファイル、データベース、および、ウェブページ等を格納する。

これら記憶部１０６の各構成要素のうち、タンパク質配列情報データベース１０６ａは、タンパク質のアミノ酸配列に関する配列情報を記憶するタンパク質配列情報記憶手段である。これら配列情報は、タンパク質配列情報データベース１０６ａに予め記憶されており、タンパク質解析装置１００の制御部１０２は、定期的に、および／または、制御部１０２による処理に応じてネットワーク３００を介して最新のデータを外部システム２００（例えば、ＮＣＢＩ、または、ＵＮＩＰＲＯＴ等）からダウンロードしてタンパク質配列情報データベース１０６ａに記憶された配列情報をアップデートしてもよい。

また、標識パターンデータベース１０６ｂは、タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの同位体標識率であるかを規定する標識パターンを記憶する標識パターン記憶手段である。ここで、元素は、窒素、炭素、フッ素、リン、ケイ素、酸素、および／または、水素等であってもよい。また、ＮＭＲ測定は、ＮＭＲ相関スペクトルの測定であってもよい。ここで、ＮＭＲ相関スペクトルは、二次元^１５Ｎ／^１ＨＮＭＲ相関スペクトル等であってもよい。また、ＮＭＲ相関スペクトルは、ＨＳＱＣスペクトル、ＨＭＱＣスペクトル、ＨＮＣＯスペクトル、ＨＮＣＡスペクトル、ＨＮＣＯＣＡスペクトル、ＨＮＣＡＣＢスペクトル、ＣＢＣＡＮＨスペクトル、ＣＢＣＡＣＯＮＨスペクトル、ＨＮＣＡＣＯスペクトル、ＨＢＨＡＣＯＮＨスペクトル、ＨＢＨＡＮＨスペクトル、ＣＣＯＮＨスペクトル、ＨＣＣＯＮＨスペクトル、ＨＮＣＡＮＨスペクトル、ＨＮＣＯＣＡＮＨスペクトル、ＨＣＡＮＨスペクトル、ＨＣＡＣＯスペクトル、ＨＣＡＮスペクトル、ＨＣＡＣＯＮスペクトル、ＴＲＯＳＹスペクトル、ＣＯＳＹスペクトル、ＴＯＣＳＹスペクトル、ＮＯＥＳＹスペクトル、および／または、ＲＯＥＳＹスペクトル等であってもよい。また、同位体標識率は、安定同位体標識率であってもよい。

また、シグナルデータベース１０６ｃは、標識パターンで構成されたタンパク質である標識体のＮＭＲ測定により得られるシグナル情報を記憶するシグナル記憶手段である。ここで、シグナル情報は、ユーザにより入力部１１４を介して入力されたものであってもよい。例えば、シグナル情報は、ユーザによりＮＭＲ装置を用いて測定され、ユーザにより入力部１１４を介して入力されたものであってもよく、制御部１０２による処理に応じてネットワーク３００を介して外部システム２００からダウンロードしたものであってもよい。また、シグナル情報は、シグナル強度を含んでいてもよい。

また、通信制御インターフェース部１０４は、タンパク質解析装置１００とネットワーク３００（またはルータ等の通信装置）との間における通信制御を行う。すなわち、通信制御インターフェース部１０４は、外部システム２００、および、他の端末等と通信回線を介してデータを通信する機能を有する。

また、入出力制御インターフェース部１０８は、出力部（表示部１１２）、および、入力部１１４の制御を行う。

ここで、表示部１１２としては、アプリケーション等の表示画面を表示する表示手段（例えば、液晶または有機ＥＬ等から構成されるディスプレイ、モニタ、または、タッチパネル等）であってもよい。また、入力部１１４は、例えば、キー入力部、タッチパネル、コントロールパッド（例えば、タッチパッド、および、ゲームパッド等）、マウス、キーボード、スキャナ、または、マイク等であってもよい。また、音声出力部としては、例えば、スピーカ等であってもよい。また、印刷出力部としては、例えば、プリンタ等であってもよい。

また、図２において、制御部１０２は、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）等の制御プログラムや、各種の処理手順等を規定したプログラム、および、所要データを格納するための内部メモリを有する。そして、制御部１０２は、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部１０２は、機能概念的に、標識パターン生成部１０２ａ、シグナル情報取得部１０２ｂ、補正部１０２ｃ、判別部１０２ｄ、帰属部１０２ｅ、および、結果出力部１０２ｆを備える。

このうち、標識パターン生成部１０２ａは、標識パターンを生成し、標識パターンデータベース１０６ｂに格納する標識パターン生成手段である。ここで、標識パターン生成部１０２ａは、標識体毎の同位体標識率の差の絶対値の和であるハミング距離に基づいて、標識パターンを生成し、標識パターンデータベース１０６ｂに格納してもよい。ここで、ハミング距離とは、符号化理論における符号語間の情報学的距離であり、下記の数式（１）のように定義されてもよい。

（ここで、ｄ（ｉ，ｊ）はアミノ酸ｉと，他のアミノ酸ｊと、の間のハミング距離、ｎは標識体の数、ｐ_ｉ ^ｋは標識体ｋにおけるアミノ酸ｉの同位体標識率、および、ｐ_ｊ ^ｋは標識体ｋにおけるアミノ酸ｊの同位体標識率である。）

また、標識パターン生成部１０２ａは、タンパク質を構成するアスパラギン酸とアスパラギンと、および／または、グルタミン酸とグルタミンとの間で起こるスクランブルに基づいて、標識パターンを生成し、標識パターンデータベース１０６ｂに格納してもよい。

また、シグナル情報取得部１０２ｂは、標識体のＮＭＲ測定により得られるシグナル情報を取得するシグナル情報取得手段である。ここで、シグナル情報取得部１０２ｂは、更に、取得された標識体のシグナル情報をシグナルデータベース１０６ｃに格納してもよい。また、ユーザにより入力部１１４を介して入力された標識体のシグナル情報を取得してもよい。また、シグナル情報取得部１０２ｂは、ネットワーク３００を介して外部システム２００からダウンロードした標識体のシグナル情報を取得してもよい。また、シグナル情報は、ＨＳＱＣ強度、ＨＭＱＣ強度、ＨＮＣＯ強度、ＨＮＣＡ強度、ＨＮＣＯＣＡ強度、ＨＮＣＡＣＢ強度、ＣＢＣＡＮＨ強度、ＣＢＣＡＣＯＮＨ強度、ＨＮＣＡＣＯ強度、ＨＢＨＡＣＯＮＨ強度、ＨＢＨＡＮＨ強度、ＣＣＯＮＨ強度、ＨＣＣＯＮＨ強度、ＨＮＣＡＮＨ強度、ＨＮＣＯＣＡＮＨ強度、ＨＣＡＮＨ強度、ＨＣＡＣＯ強度、ＨＣＡＮ強度、ＨＣＡＣＯＮ強度、ＴＲＯＳＹ強度、ＣＯＳＹ強度、ＴＯＣＳＹ強度、ＮＯＥＳＹ強度、および／または、ＲＯＥＳＹ強度等であってもよい。

また、補正部１０２ｃは、標識体間で濃度差がある場合、標識体を構成するアミノ酸のシグナル強度比に基づいて、標識体のシグナル情報を補正する補正手段である。ここで、アミノ酸は、グリシンであってもよい。

また、判別部１０２ｄは、標識パターンデータベース１０６ｂに記憶された標識パターンに基づいて、シグナル情報に基づく標識体のシグナルがどのアミノ酸に由来するかを判別する判別手段である。

また、帰属部１０２ｅは、タンパク質配列情報データベース１０６ａに記憶された配列情報に基づいて、判別部１０２ｄによりどのアミノ酸に由来するか判別されたシグナルの帰属を決定する帰属手段である。ここで、シグナルの帰属の決定とは、シグナルがタンパク質中のどのアミノ残基に由来するか決定する主鎖帰属であってもよい。

また、結果出力部１０２ｆは、帰属部１０２ｅにより決定されたシグナルの帰属に関する解析結果を出力部を介して出力させる結果出力手段である。また、結果出力部１０２ｆは、判別部１０２ｄにより判別された標識体のシグナルがどのアミノ酸に由来するかに関する解析結果を出力部を介して出力させてもよい。ここで、結果出力部１０２ｆは、解析結果を表示部１１２に表示させてもよい。また、結果出力部１０２ｆは、解析結果を印刷出力部を介して出力させてもよい。

以上で、本実施の形態におけるタンパク質解析装置１００の構成の一例の説明を終える。

［タンパク質解析装置１００の処理］
次に、このように構成された本実施の形態におけるタンパク質解析装置１００の処理の詳細について、以下に図３乃至図１９を参照して詳細に説明する。図３は、本実施の形態におけるタンパク質解析装置１００の処理の一例を示すフローチャートである。

図３に示すように、標識パターン生成部１０２ａは、タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの同位体標識率であるかを規定する標識パターンを生成し、標識パターンデータベース１０６ｂに格納する（ステップＳＢ−１）。ここで、標識パターン生成部１０２ａは、標識体毎の同位体標識率の差の絶対値の和であるハミング距離に基づいて、標識パターンを生成し、標識パターンデータベース１０６ｂに格納してもよい。また、標識パターン生成部１０２ａは、タンパク質を構成するアスパラギン酸とアスパラギンと、および／または、グルタミン酸とグルタミンとの間で起こるスクランブルに基づいて、標識パターンを生成し、標識パターンデータベース１０６ｂに格納してもよい。

ここで、図４乃至図７を参照して、本実施の形態における標識パターンの一例について説明する。

まず、図４を参照して、本実施の形態における３進数３桁の符号語を用いた符号化における標識パターンの一例について説明する。図４は、本実施の形態における標識パターンの一例を示す図である。図４に示す標識パターンは、定量的な安定同位体標識率を用いることで、１標識体あたりの情報量を増やし、必要な標識体の数を減らした３進数３桁の符号語を用いた標識パターンである。すなわち、図４に示す標識パターンにおいては、３進数を用いて、１標識体あたりに盛り込むことができる情報量は１トリット（約１．５８ビット）としている。ここで、図４に示す標識パターンにおいては、^１５Ｎの標識率については、３進数の「２」に１００％、「１」に７５％、および、「０」に５０％を対応させる。また、^１３Ｃの標識率については、「２」に１００％、「１」に５０％、および、「０」に０％を対応させる。

ここで、ＮＭＲ測定により得られるシグナル強度は、標識率に比例するが、そもそもアミノ酸残基ごとに強度は異なるため、標識率を求めるには基準が必要である。そこで、図４においては、どのアミノ酸についても、いずれか１つの標識体でかならず「２」、つまり１００％ ^１３Ｃ、かつ、１００％ ^１５Ｎとなるようにしておき、もっとも強いシグナル強度を示した標識体を基準として標識率を求めている。これにより、図４に示す標識パターンにおいては、従来技術のように選択標識体以外にユニバーサル標識体を用意することなく、アミノ酸判別が可能となる。また、図４に示すように、３桁の３進数でいずれかの桁が「２」である標識パターンは、１９種類あることから、わずか３つの選択標識体を用いて１９種のアミノ酸の判別が可能となる。

ここで、図４において、どの符号語（３桁の３進数）にどのアミノ酸を割り当てるかは自由であるが、ここではさらなる利便性のために、以下の（１）乃至（３）を考慮して割り当ててもよい。

（１）まず、定量的な解析のためには、標識体間の濃度差等が問題となる。そこで、サンプル（標識体）間の濃度差の補正を行うことを想定し、どの標識体でもすべて１００％標識であるアミノ酸を用いるのが便利であるため、^１５Ｎの化学シフトが低磁場側であるという特徴をもち、他のアミノ酸と見分けやすいグリシンの符号語を「２２２」としてもよい。

（２）次に、タンパク質合成中のアミノ酸の標識スクランブルは、アミノ酸判別を乱す大きな要因になってしまう可能性がある。そこで、本実施の形態においては、比較的スクランブルの少ない無細胞タンパク質合成系をさらに改良し、スクランブルを抑える方法（例えば、Ｙｏｋｏｙａｍａ，Ｊ．ｅｔａｌ．（２０１１）．ＡｎａｌｙｔｉｃａｌＢｉｏｃｈｅｍｉｓｔｒｙ４１１（２）：２２３−２２９．等）を用いてもよい。ここで、本実施の形態においては、スクランブルを厳密に抑えられない場合でも、上記の方法を使えるように標識パターンを工夫してもよい。

ここで、標識スクランブルでもっとも問題になるのは、アスパラギンとアスパラギン酸との間、または、グルタミンとグルタミン酸との間である。そこで、図４に示す標識パターンにおいては、アスパラギンを「２２０」、および、アスパラギン酸を「２１０」に対応させていることで、いくらアスパラギンとアスパラギン酸との間でスクランブルが起ころうとも、標識体１は「２」、標識体３は「０」に対応した標識率が保たれる。ここで、標識体２は、「２」と「１」との中間、すなわち、^１５Ｎ標識率については１００％と７５％との中間、^１３Ｃ標識率については１００％と５０％との中間になる可能性があるが、そうなったとしても、アスパラギンとアスパラギン酸とのどちらかであること自体は判断が可能となる。例えば、「２００」に対応させたアルギニンとも誤判別せずにすむこととなる。グルタミンとグルタミン酸との間についても同様である。

また、スクランブルは、実際には、アスパラギンからアスパラギン酸への一方的な標識のリーク、グルタミンからグルタミン酸への一方的な標識のリークが多い。例えば、図４において、アスパラギンからアスパラギン酸へのリークを想定して、標識体２のアスパラギン酸の標識率をあらかじめ低めの値にしておき、アスパラギンから標識リークがおこって標識率が上がることを利用して、所望の標識率を達成するようにしてもよい。

ここで、これらリークは、スクランブルを抑える方法（Ｙｏｋｏｙａｍａ，Ｊ．ｅｔａｌ．（２０１１）．ＡｎａｌｙｔｉｃａｌＢｉｏｃｈｅｍｉｓｔｒｙ４１１（２）：２２３−２２９．）を用いて、実用上完全にリークを抑えることは可能である。しかしながら、特に、アスパラギンからアスパラギン酸へのリークを抑えるのに必要な代謝阻害剤である５−ジアゾ−４−オキソ−Ｌ−ノルバリンはその不安定性から市販されておらず利用にしくいという問題点があった。そこで、本実施の形態においては、アスパラギン酸、および、グルタミン酸の双方について、標識リークを想定して標識率をあらかじめ低めにしておいてもよい。

（３）そして、図４に示すように、本実施の形態における標識パターンにおいては、トリプトファンのように安定同位体標識が高価なものはなるべく安定同位体標識体の使用量を少なくするようにしてもよい。

また、図５を参照して、本実施の形態における３進数３桁の符号語を用いた符号化における他の標識パターンの一例について説明する。図５は、本実施の形態における標識パターンの一例を示す図である。図５に示す標識パターンは、図４に示す標識パターンと同様、上記（１）乃至（３）の条件に従った、３進数３桁の符号語を用いた標識パターンであってもよい。

ここで、図５を含む本実施の形態における標識パターンにおいては、標識率を１００％または０％と記載しているが、実際には技術的な理由で、厳密に１００％または０％を達成するのは難しい。しかし、本実施の形態において実用上は問題ない理由について、以下に説明する。

まず、標識率の下限について、^１３Ｃの天然存在比は、約１．１％であり、^１５Ｎの天然存在比は、約０．３６％であり、非標識アミノ酸を用いると標識率の下限はこの値となるが、図５に示すように、０％と５０％との判別には問題のないレベルである。

また、標識率の上限について、^１３Ｃ標識および^１５Ｎ標識されたアミノ酸の、同位体標識率はおおむね９０％乃至９８％程度であるため、１００％を達成するのは難しい。しかしながら、本実施の形態は、^１３Ｃ標識および^１５Ｎ標識されたアミノ酸を用いて観測された強度に対する比のみを用いて帰属を決定する方法であるので、その基準が、１００％ではなく実際には９０％であっても、問題はない。ここで、^１３Ｃ／^１５Ｎ標識アミノ酸の^１５Ｎ標識率と、^１５Ｎ標識アミノ酸の^１５Ｎ標識率と、が大きく異なる場合には、それらを混ぜ合わせたアミノ酸混合物の^１５Ｎ標識率が想定と異なってしまう場合があるが、多くは問題ない。例えば、^１３Ｃ／^１５Ｎ標識アミノ酸の^１５Ｎ標識率が、実際には９８％であり、^１５Ｎ標識アミノ酸の^１５Ｎ標識率が、実際には９０％である場合、５０％ ^１３Ｃ／７５％ ^１５Ｎを達成しようとすると、非標識体、^１５Ｎ標識体、^１３Ｃ／^１５Ｎ標識体を１：１：２で混合することになり、最終的な^１５Ｎ標識率は、７１．５％となる。基準となるのは９８％ ^１５Ｎであるので、本実施の形態（後述する数式（３））で計算される標識率は７３．０％となる。これは当初設定しようとした７５％と大きく変わらず、特に問題とはならない。逆に、^１３Ｃ／^１５Ｎ標識アミノ酸の^１５Ｎ標識率が実際には９０％、^１５Ｎ標識アミノ酸の^１５Ｎ標識率が実際には９８％である場合、５０％ ^１３Ｃ／７５％ ^１５Ｎを達成しようとすると、最終的な^１５Ｎ標識率は６９．５％となる。基準となるのは９０％ ^１５Ｎであるので、本実施の形態（後述する数式（３））で計算される標識率は７７．２％となる。これも当初設定しようとした７５％と大きく変わらず、特に問題とはならない。

また、本実施の形態においては、図５に示すように、定量的な標識により１標識体に１ビットを超える情報を盛り込むことで標識体数を減らしてもよい。また、本実施の形態においては、図５に示すように、少なくとも１つの標識体で１００％標識になるようにしてリファレンスを不要にしている。本実施の形態においては、これら２つの工夫により、３種の標識体で１９種類のアミノ酸の判別を可能にしている。なお、実際には、これら２つの工夫は独立実施可能である。一方、非特許文献３に記載の技術においては、いずれも採用していないため、１６種類のアミノ酸を判別するのに、リファレンスとなるユニバーサル標識体１種、および、選択標識体４種の計５種類の標識体を必要とする。

また、本実施の形態においては、^１５Ｎ標識については主鎖のアミド窒素のみ、または、^１３Ｃ標識については主鎖のカルボニル炭素のみが標識されていればよい。また、本実施の形態においては、その他の窒素または炭素が標識されていてもよい。また、所望の標識率は、非標識アミノ酸、^１５Ｎ標識アミノ酸、^１３Ｃ標識アミノ酸、および／または、^１３Ｃ／^１５Ｎ標識アミノ酸を混合して達成してもよい。ここで、図４および図５（後述する図６および図７）に示すように、いずれの標識体のアミノ酸においても、^１５Ｎ標識率が^１３Ｃ標識率と同じか上回るように設定しておけば、^１３Ｃ標識アミノ酸は不要となる。実際には、^１３Ｃ／^１５Ｎ標識アミノ酸で主鎖のカルボニル炭素のみが標識されているもの、または、^１５Ｎ標識や^１３Ｃ／^１５Ｎ標識アミノ酸で複数の窒素のうち主鎖のアミド窒素のみが標識されているものは入手しにくい。そこで、本実施の形態においては、^１５Ｎ標識アミノ酸、および、^１３Ｃ／^１５Ｎ標識アミノ酸とも、すべての窒素や炭素が標識されているものを用いてもよい。

ここで、図４および図５（後述する図６および図７）に示す標識パターンでは、いずれもｎ＝ｃ／２＋０．５（ただし、ｃおよびｎは、それぞれ^１３Ｃおよび^１５Ｎの標識率）を満たすように標識率を定めているが、この式によらずに標識パターンを定めてもよい。その場合、上述したリファレンスを不要にする条件を満たすためには、いずれのアミノ酸についても、少なくとも１つの標識体で^１５Ｎ標識率が１００％、少なくとも１つの標識体（^１５Ｎのときとは別の標識体でもよい）で^１３Ｃ標識率が１００％となっていればよい。

また、図６を参照して、本実施の形態における４進数３桁の符号語を用いた符号化における標識パターンの一例について説明する。図６は、本実施の形態における標識パターンの一例を示す図である。図６に示す標識パターンは、ハミング距離に基づいて生成された、４進数３桁の符号語を用いた標識パターンである。ここで、図６に示す標識パターンにおいては、ハミング距離を用いて、全てのアミノ酸の組み合わせを、等しく、且つ、よく判別するように設計している。

しかしながら、本実施の形態においては、用途により、判別の精度を特に高くしたいアミノ酸の組み合わせ、または、逆に判別の精度が低くてもよい組み合わせがある場合には、そのような束縛条件を追加して最適化問題を解くことで、用途に適した標識パターンを設計してもよい。例えば、本実施の形態においては、標識率がぶれやすいアミノ酸と他のアミノ酸とのハミング距離が広くなるように設計してもよい。また、本実施の形態においては、出現率が低いアミノ酸同士はハミング距離が近くなるように設計してもよい。また、本実施の形態においては、本発明を三重共鳴による連鎖帰属法等と組み合わせて使う場合、化学シフトで区別しやすいアミノ酸同士のハミング距離が近くなるように設計してもよい。

ここで、本実施の形態において、ハミング距離とは、符号化理論における符号語間の情報学的距離であり、下記の数式（１）のように定義されてもよい。

また、ハミング距離は、^１５Ｎ標識率、および、^１３Ｃ標識率それぞれで定義できるが、図４に示すように、標識パターンは、^１３Ｃで定義したハミング距離が^１５Ｎで定義したハミング距離のちょうど２倍になっていてもよい。ここで、全てのアミノ酸間のハミング距離のうち最小のものを最小ハミング距離と定義できる。すなわち、最小ハミング距離は、全ての符号語間のハミング距離のうち最小のものである。そして、最小ハミング距離の値が大きいほど、どのような符号語同士であっても、よく判別できる。すなわち、最小ハミング距離が大きい標識パターンほど、ノイズなどの攪乱要因があっても、どのようなアミノ酸同士であっても、よく判別できる。したがって、最小ハミング距離を最大化するという最適化問題を解くことによって、任意のアミノ酸数を任意の標識体数で判別しようとする場合の、ノイズ等の攪乱要因に最も強い標識パターンを設計することができる。例えば、本実施の形態において、図４に示す標識パターンでは、^１３Ｃの最小ハミング距離が０．５００となる。また、図４と同じ１９アミノ酸を３標識体で判別するパターンでも、図６に示す標識パターンでは、^１３Ｃの最小ハミング距離が０．６６７となる。

また、図７を参照して、本実施の形態における２０アミノ酸を３標識体で判別する標識パターンの一例について説明する。図７は、本実施の形態における標識パターンの一例を示す図である。図７に示すように、本実施の形態においては、^１３Ｃの標識率については２９種類、および、^１５Ｎの標識率については２２種類用いて、２０アミノ酸を３標識体で判別する標識パターンを設計してもよい。なお、図７に示す標識パターンでは、最小ハミング距離が０．５９６となる。

図３に戻り、シグナル情報取得部１０２ｂは、ユーザにより、標識パターンデータベース１０６ｂに記憶された標識パターンで構成されたタンパク質である標識体が生成され、ＮＭＲ測定により当該標識体のシグナル情報が取得され、入力部１１４を介して当該シグナル情報が入力された場合、当該標識体のシグナル情報を取得し、シグナルデータベース１０６ｃに格納する（ステップＳＢ−２）。ここで、シグナル情報取得部１０２ｂは、ネットワーク３００を介して外部システム２００からダウンロードした標識体のシグナル情報（例えば、オープンソースとして公開されているもの、または、ユーザにより予め測定され外部システム２００に格納されているもの等）を取得してもよい。

ここで、図８乃至図１５を参照して、本実施の形態における無細胞タンパク質合成系による標識体生成について説明する。

まず、図８乃至図１０を参照して、本実施の形態における無細胞タンパク質合成系に用いるアミノ酸溶液の調製の一例について説明する。図８乃至図１０は、本実施の形態におけるアミノ酸溶液の組成の一例を示す図である。

ここで、本実施の形態においては、無細胞タンパク質合成系に用いるアミノ酸溶液として、種々の水溶液もしくは懸濁液を作製してもよい。例えば、本実施の形態においては、水溶液もしくは懸濁液として、８００ｍＭＬ−アラニン水溶液、８００ｍＭ ^１５ＮＬ−アラニン水溶液、８００ｍＭ ^１３Ｃ／^１５ＮＬ−アラニン水溶液、４００ｍＭＬ−アルギニン水溶液、４００ｍＭ ^１５ＮＬ−アルギニン水溶液、４００ｍＭ ^１３Ｃ／^１５ＮＬ−アルギニン水溶液、１４０ｍＭＬ−アスパラギン水溶液、１４０ｍＭ ^１５ＮＬ−アスパラギン水溶液、１４０ｍＭ ^１３Ｃ／^１５ＮＬ−アスパラギン水溶液、１４０ｍＭＬ−アスパラギン酸、水酸化カリウム水溶液ｐＨ７．０、１４０ｍＭ ^１５ＮＬ−アスパラギン酸、水酸化カリウム水溶液ｐＨ７．０、１４０ｍＭ ^１３Ｃ／^１５ＮＬ−アスパラギン酸、水酸化カリウム水溶液ｐＨ７．０、６００ｍＭＬ−システイン、６００ｍＭジチオスレイトール水溶液、６００ｍＭ ^１５ＮＬ−システイン、６００ｍＭジチオスレイトール水溶液、６００ｍＭ ^１３Ｃ／^１５ＮＬ−システイン、６００ｍＭジチオスレイトール水溶液、２００ｍＭＬ−グルタミン水溶液、２００ｍＭ ^１５ＮＬ−グルタミン水溶液、２００ｍＭ ^１３Ｃ／^１５ＮＬ−グルタミン水溶液、１６０ｍＭＬ−グルタミン酸、水酸化カリウム水溶液ｐＨ７．０、１６０ｍＭ ^１５ＮＬ−グルタミン酸、水酸化カリウム水溶液ｐＨ７．０、１６０ｍＭ ^１３Ｃ／^１５ＮＬ−グルタミン酸、水酸化カリウム水溶液ｐＨ７．０、８００ｍＭ ^１３Ｃ／^１５Ｎグリシン水溶液、２６０ｍＭＬ−ヒスチジン水溶液、２６０ｍＭ ^１５ＮＬ−ヒスチジン水溶液、２６０ｍＭ ^１３Ｃ／^１５ＮＬ−ヒスチジン水溶液、２００ｍＭＬ−イソロイシン水溶液、２００ｍＭ ^１５ＮＬ−イソロイシン水溶液、２００ｍＭ ^１３Ｃ／^１５ＮＬ−イソロイシン溶液、１００ｍＭＬ−ロイシン水溶液、１００ｍＭ ^１５ＮＬ−ロイシン水溶液、１００ｍＭ ^１３Ｃ／^１５ＮＬ−ロイシン溶液、４００ｍＭＬ−リジン水溶液、４００ｍＭ ^１５ＮＬ−リジン水溶液、４００ｍＭ ^１３Ｃ／^１５ＮＬ−リジン溶液、２００ｍＭＬ−メチオニン水溶液、２００ｍＭ ^１５ＮＬ−メチオニン水溶液、２００ｍＭ ^１３Ｃ／^１５ＮＬ−メチオニン溶液、１１０ｍＭＬ−フェニルアラニン水溶液、１１０ｍＭ ^１５ＮＬ−フェニルアラニン水溶液、１１０ｍＭ ^１３Ｃ／^１５ＮＬ−フェニルアラニン溶液、８００ｍＭＬ−プロリン水溶液、８００ｍＭＬ−セリン水溶液、８００ｍＭ ^１５ＮＬ−セリン水溶液、８００ｍＭ ^１３Ｃ／^１５ＮＬ−セリン水溶液、４００ｍＭＬ−スレオニン水溶液、４００ｍＭ ^１５ＮＬ−スレオニン水溶液、４００ｍＭ ^１３Ｃ／^１５ＮＬ−スレオニン水溶液、２０ｍＭＬ−トリプトファン水溶液、２０ｍＭ ^１５ＮＬ−トリプトファン水溶液、２０ｍＭ ^１３Ｃ／^１５ＮＬ−トリプトファン水溶液、１３０ｍＭＬ−チロシン懸濁液、１３０ｍＭ ^１５ＮＬ−チロシン懸濁液、１３０ｍＭ ^１３Ｃ／^１５ＮＬ−チロシン懸濁液、４００ｍＭＬ−バリン水溶液、４００ｍＭ ^１５ＮＬ−バリン水溶液、および／または、４００ｍＭ ^１３Ｃ／^１５ＮＬ−バリン水溶液を作製してもよい。

なお、本実施の形態における水溶液もしくは懸濁液の作製に用いる試薬のメーカーとしては、^１５ＮＬ−アラニン、^１３Ｃ／^１５ＮＬ−アラニン、^１３Ｃ／^１５ＮＬ−アルギニン、^１５ＮＬ−アスパラギン、^１３Ｃ／^１５ＮＬ−アスパラギン、^１５ＮＬ−アスパラギン酸、^１３Ｃ／^１５ＮＬ−アスパラギン酸、^１５ＮＬ−グルタミン、^１５ＮＬ−グルタミン酸、^１３Ｃ／^１５ＮＬ−グルタミン酸、^１３Ｃ／^１５Ｎグリシン、^１５ＮＬ−イソロイシン、^１５ＮＬ−ロイシン、^１３Ｃ／^１５ＮＬ−ロイシン、^１５ＮＬ−リジン、^１３Ｃ／^１５ＮＬ−リジン、^１５ＮＬ−メチオニン、^１３Ｃ／^１５ＮＬ−メチオニン、^１５ＮＬ−フェニルアラニン、^１３Ｃ／^１５ＮＬ−フェニルアラニン、^１５ＮＬ−セリン、^１５ＮＬ−スレオニン、^１５ＮＬ−チロシン、^１３Ｃ／^１５ＮＬ−チロシン、^１５ＮＬ−バリン、および、^１３Ｃ／^１５ＮＬ−バリンについては、Ｓｉｇｍａ−ＡｌｄｒｉｃｈＣｏ．ＬＬＣ．（会社名）、^１５ＮＬ−アルギニン、^１３Ｃ／^１５ＮＬ−グルタミン、^１５ＮＬ−ヒスチジン、^１３Ｃ／^１５ＮＬ−ヒスチジン、^１３Ｃ／^１５ＮＬ−ロイシン、^１３Ｃ／^１５ＮＬ−スレオニン、^１５ＮＬ−トリプトファン、および、^１３Ｃ／^１５ＮＬ−トリプトファンについては、味の素株式会社（会社名）、^１５ＮＬ−システイン、^１３Ｃ／^１５ＮＬ−システイン、および、^１３Ｃ／^１５ＮＬ−セリンについては、大陽日酸株式会社（会社名）、ならびに、その他の試薬については、ナカライテスク株式会社（会社名）を用いた。

そして、本実施の形態における無細胞タンパク質合成系においては、これらのアミノ酸溶液を、図８に示す組成で混合することで、タンパク質の合成に用いる７．５ｍＭアミノ酸混合溶液（システインを除く１９種類のアミノ酸を含む）を調製し、図４に示す標識パターンで構成された標識体１の生成に用いてもよい。また、本実施の形態における無細胞タンパク質合成系においては、これらのアミノ酸溶液を、図９に示す組成で混合することで、タンパク質の合成に用いる７．５ｍＭアミノ酸混合溶液を調製し、図４に示す標識パターンで構成された標識体２の生成に用いてもよい。また、本実施の形態における無細胞タンパク質合成系においては、これらのアミノ酸溶液を、図１０に示す組成で混合することで、タンパク質の合成に用いる７．５ｍＭアミノ酸混合溶液を調製し、図４に示す標識パターンで構成された標識体３の生成に用いてもよい。

また、図１１乃至図１３を参照して、本実施の形態における無細胞タンパク質合成系に用いるシステイン水溶液の調製の一例について説明する。図１１乃至図１３は、本実施の形態におけるシステイン水溶液の組成の一例を示す図である。

本実施の形態における無細胞タンパク質合成系においては、上記システイン水溶液を、図１１に示す組成で混合することで、タンパク質の合成に用いる６００ｍＭシステイン、および、６００ｍＭジチオスレイトール溶液を調製し、図４に示す標識パターンで構成された標識体１の生成に用いてもよい。また、本実施の形態における無細胞タンパク質合成系においては、上記システイン水溶液を、図１２に示す組成で混合することで、タンパク質の合成に用いる６００ｍＭシステイン、および、６００ｍＭジチオスレイトール溶液を調製し、図４に示す標識パターンで構成された標識体２の生成に用いてもよい。また、本実施の形態における無細胞タンパク質合成系においては、上記システイン水溶液を、図１３に示す組成で混合することで、タンパク質の合成に用いる６００ｍＭシステイン、および、６００ｍＭジチオスレイトール溶液を調製し、図４に示す標識パターンで構成された標識体３の生成に用いてもよい。

このように、これらの７．５ｍＭアミノ酸混合溶液、６００ｍＭシステイン、および、６００ｍＭジチオスレイトール溶液中の各アミノ酸の安定同位体標識率は、図４に示したようになっていてもよい。ただし、例外的に、標識体２のアスパラギン酸の^１３Ｃ標識率は、５０％ではなく３０％、標識体２のアスパラギン酸の^１５Ｎ標識率は、７５％ではなく６５％、標識体３のグルタミン酸の^１３Ｃ標識率は、５０％ではなく１５％、および、標識体３のグルタミン酸の^１５Ｎ標識率は、７５％ではなく５５％であってもよい。これらは、それぞれアスパラギン、および、グルタミンからの標識リークにより所望の標識率が達成されるからである。

次に、図１４および図１５を参照して、本実施の形態における無細胞タンパク質合成用鋳型ＤＮＡ調製の一例について説明する。図１４は、本実施の形態における透析外液の組成の一例を示す図である。図１５は、本実施の形態における透析内液の組成の一例を示す図である。

まず、本実施の形態においては、例えば、ヒトＳｍｏｏｔｈｅｌｉｎタンパク質のＣＨドメインの領域を合成するため、鋳型ＤＮＡを作製する。具体的には、本実施の形態においては、遺伝子特異的フォワードプライマーＤＮＡ（ＡＣＴＧＡＧＡＡＣＣＴＧＴＡＣＴＴＣＣＡＧＧＧＡＡＴＣＡＡＧＣＡＧＡＴＧＣＴＧＣＴＧＧＡＣ）と遺伝子特異的リバースプライマーＤＮＡ（ＧＧＧＣＧＧＧＧＡＴＣＡＡＴＣＡＡＴＣＡＴＴＡＧＧＡＣＴＴＴＴＴＧＧＴＴＴＴＴＡＣＣＡＧＣＣＣＣＴＴ）と、ヒトＳｍｏｏｔｈｅｌｉｎｃＤＮＡ（ＯｒｉＧｅｎｅＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ．（会社名））と、を用いて、従来技術（Ｙａｂｕｋｉ，Ｔ．，ｅｔａｌ．（２００７）．ＪＳｔｒｕｃｔＦｕｎｃｔＧｅｎｏｍｉｃｓ８（４）：１７３−１９１．）に基づいて、ヒスチジンアフィニティータグを含む鋳型ＤＮＡを作製してもよい。そして、本実施の形態においては、これを翻訳したアフィニティータグ切断前のアミノ酸配列（ＭＫＤＨＬＩＨＮＨＨＫＨＥＨＡＨＡＥＨＴＥＮＬＹＦＱＧＩＫＱＭＬＬＤＷＣＲＡＫＴＲＧＹＥＨＶＤＩＱＮＦＳＳＳＷＳＤＧＭＡＦＣＡＬＶＨＮＦＦＰＥＡＦＤＹＧＱＬＳＰＱＮＲＲＱＮＦＥＶＡＦＳＳＡＥＴＨＡＤＣＰＱＬＬＤＴＥＤＭＶＲＬＲＥＰＤＷＫＣＶＹＴＹＩＱＥＦＹＲＣＬＶＱＫＧＬＶＫＴＫＫＳ）を取得してもよい。

ここで、本実施の形態においては、作製した鋳型ＤＮＡを用いて、従来技術（Ｋｉｇａｗａ，Ｔ．（２０１０）．ＭｅｔｈｏｄｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ６０７：１０１−１１１．）の方法に従い、無細胞タンパク質合成系を用いて各標識体の調製（合成）をしてもよい。ただし、本実施の形態においては、所望の安定同位体標識率を達成するために、アミノ酸間の標識スクランブルを抑える方法（Ｙｏｋｏｙａｍａ，Ｊ．，ｅｔａｌ．（２０１１）．ＡｎａｌｙｔｉｃａｌＢｉｏｃｈｅｍｉｓｔｒｙ４１１（２）：２２３−２２９．）を参考に、反応液（図１４に示す透析外液、および、図１５に示す透析内液）の組成を変更してもよい。

また、合成反応は、３０℃にて振盪しながら１２時間行い、透析内液を回収して１８ｍｌのＡ緩衝液（２０ｍＭリン酸ナトリウム緩衝液ｐＨ７．４、５００ｍＭ塩化ナトリウム、および、２０ｍＭイミダゾール）を加えてもよい。そして、当該透析内液を回収して１８ｍｌのＡ緩衝液を加えた溶液を、ＨｉｓＴｒａｐ５ｍｌカラム（ＧＥヘルスケア（会社名））に吸着させ、５０ｍｌのＡ緩衝液で洗浄したのちに１５ｍｌのＢ緩衝液（２０ｍＭリン酸ナトリウム緩衝液ｐＨ７．４、５００ｍＭ塩化ナトリウム、および、５００ｍＭイミダゾール）で溶出してもよい。そして、この溶出液を、アミコン−ウルトラ１５ＭＷＣＯ−３０００（メルクミリポア（会社名））を用いて限外濾過法にてＡ緩衝液に溶媒交換し、３ｍｌに濃縮してもよい。そして、当該濃縮液に、３μｌの０．５ＭＥＤＴＡと０．４ｍｌの１ｍｇ／ｍｌＴｏｂａｃｃｏＥｔｃｈＶｉｒｕｓプロテアーゼ（自家調製）とを加え、室温で１８時間静置してもよい。

そして、当該静置した溶液を、ＨｉｓＴｒａｐ５ｍｌカラムに通し、素通り画分と１６ｍｌのＡ緩衝液とで洗浄した画分をあわせて回収してもよい。そして、当該回収した溶液を、アミコン−ウルトラ１５ＭＷＣＯ−３０００、および、ＶＩＶＡＳＰＩＮ２５０００ＭＷＣＯＰＥＳ（ザルトリウス（会社名））を用いて限外濾過法にてＮＭＲ測定用緩衝液（２０ｍＭ重水素化Ｔｒｉｓ−Ｃｌ緩衝液ｐＨ７．０、１００ｍＭ塩化ナトリウム、０．０２％アジ化ナトリウム、および、１ｍＭ重水素化ジチオスレイトール）に交換してもよい。そして、アミノ酸配列から、２８０ｎｍのモル吸光係数を２３９５０［Ｍ^−１ｃｍ^−１］と推定し（Ｐａｃｅ，Ｃ．Ｎ．，ｅｔａｌ．（１９９５）．ＰｒｏｔｅｉｎＳｃｉｅｎｃｅ４（１１）：２４１１−２４２３．の方法による）、紫外吸光法によってタンパク質濃度を測定して、最終濃度１０％の重水を加えたＮＭＲ測定用緩衝液中でタンパク質濃度が０．４ｍＭになるようＮＭＲ測定用試料を調製し、水溶液用５ｍｍ対称形ミクロ試験管（株式会社シゲミ株式会社（会社名））に充填してもよい。なお、こうして得られたタンパク質（ヒトＳｍｏｏｔｈｅｌｉｎ）は、アフィニティータグが取り除かれたアフィニティータグ切断後のアミノ酸配列（ＧＩＫＱＭＬＬＤＷＣＲＡＫＴＲＧＹＥＨＶＤＩＱＮＦＳＳＳＷＳＤＧＭＡＦＣＡＬＶＨＮＦＦＰＥＡＦＤＹＧＱＬＳＰＱＮＲＲＱＮＦＥＶＡＦＳＳＡＥＴＨＡＤＣＰＱＬＬＤＴＥＤＭＶＲＬＲＥＰＤＷＫＣＶＹＴＹＩＱＥＦＹＲＣＬＶＱＫＧＬＶＫＴＫＫＳ）であってもよい。

次に、本実施の形態におけるＮＭＲ測定について説明する。ここで、本実施の形態におけるＮＭＲ測定は、各標識体について、ＡＶＡＮＣＥ７００ＮＭＲ装置（ブルカー・バイオスピン株式会社（会社名））を用い、２２℃にて^１Ｈ−^１５Ｎ２次元ＨＳＱＣスペクトル（以下、ＨＳＱＣと記載）、および^１Ｈ−^１５Ｎ２次元ＨＮ（ＣＯ）スペクトル（以下、ＨＮＣＯと記載）を測定してもよい。

ここで、スペクトルは、ＮＭＲＰｉｐｅプログラム（Ｄｅｌａｇｌｉｏ，Ｆ．，ｅｔａｌ．（１９９５）ＪＢｉｏｍｏｌＮＭＲ６：２７７−２９３）を用いてプロセスし、標識体のＨＳＱＣスペクトルについてＮＭＲｖｉｅｗプログラム（Ｊｏｈｎｓｏｎ，Ｂ．Ａ．ｅｔａｌ．（１９９４）ＪＢｉｏｍｏｌＮＭＲ４：６０３−６１４．）を用いてピークピックを行い、１４８ピークからなるピークリストを得てもよい。このピークリストに含まれる各ピークについては、^１Ｈの化学シフト差が０．１ｐｐｍ以下、かつ、^１５Ｎの化学シフト差が０．８ｐｐｍ以下のピーク同士が同じグループに属するようにグループ分けを行い、８２グループを得るようにしてもよい。また、各グループについては、グループ内の各ピークのいずれかから^１Ｈの化学シフトが０．０５ｐｐｍ以内、かつ、^１５Ｎの化学シフトが０．４ｐｐｍ以内の領域を切り出す操作をスペクトル毎に行ってもよい。この切り出した領域毎に、ｍｉｎｐａｃｋ．ｌｍプログラム（ｈｔｔｐ：／／ＣＲＡＮ．Ｒ−ｐｒｏｊｅｃｔ．ｏｒｇ／ｐａｃｋａｇｅ＝ｍｉｎｐａｃｋ．ｌｍ）を用いて下記の数式（２）に示す２次元ガウス関数にフィッティングを行ってもよい。

（ここで、ｘ、ｙはそれぞれ^１Ｈ軸、^１５Ｎ軸を動く変数、Ｉ_{ＨＳＱＣ１}（ｘ，ｙ）は点（ｘ，ｙ）における標識体１のＨＳＱＣスペクトルの強度、Ｉ_{ＨＳＱＣ２}（ｘ，ｙ）は点（ｘ，ｙ）における標識体２のＨＳＱＣスペクトルの強度、Ｉ_{ＨＳＱＣ３}（ｘ，ｙ）は点（ｘ，ｙ）における標識体３のＨＳＱＣスペクトルの強度、Ｉ_{ＨＮＣＯ１}（ｘ，ｙ）は点（ｘ，ｙ）における標識体１のＨＮＣＯスペクトルの強度、Ｉ_{ＨＮＣＯ２}（ｘ，ｙ）は点（ｘ，ｙ）における標識体２のＨＮＣＯスペクトルの強度、Ｉ_{ＨＮＣＯ３}（ｘ，ｙ）は点（ｘ，ｙ）における標識体３のＨＮＣＯスペクトルの強度、ｎはグループに含まれるピーク数、ａ^ｋ _{ＨＳＱＣ１}はグループに含まれるｋ番目のピークの標識体１のＨＳＱＣにおける強度（フィッティングで求めるべき未知数）、ａ^ｋ _{ＨＳＱＣ２}はグループに含まれるｋ番目のピークの標識体２のＨＳＱＣにおける強度（フィッティングで求めるべき未知数）、ａ^ｋ _{ＨＳＱＣ３}はグループに含まれるｋ番目のピークの標識体３のＨＳＱＣにおける強度（フィッティングで求めるべき未知数）、ａ^ｋ _{ＨＮＣＯ１}はグループに含まれるｋ番目のピークの標識体１のＨＮＣＯにおける強度（フィッティングで求めるべき未知数）、ａ^ｋ _{ＨＮＣＯ２}はグループに含まれるｋ番目のピークの標識体２のＨＮＣＯにおける強度（フィッティングで求めるべき未知数）、ａ^ｋ _{ＨＮＣＯ３}はグループに含まれるｋ番目のピークの標識体３のＨＮＣＯにおける強度（フィッティングで求めるべき未知数）、ｘ^ｋ _０、ｙ^ｋ _０はそれぞれ^１Ｈ軸、^１５Ｎ軸上のｋ番目のピークの中心位置（求めるべき未知数）、σ^ｋ _ｘ、σ^ｋ _ｙはそれぞれ^１Ｈ軸、^１５Ｎ軸方向のｋ番目のピークの広がりをあらわす未知数である。）

そして、本実施の形態においては、数式（２）を用いて求められる６個の未知数ａ^ｋ _{ＨＳＱＣ１}乃至ａ^ｋ _{ＨＮＣＯ３}を、各ピークのアミノ酸判別に用いてもよい。

図３に戻り、補正部１０２ｃは、標識体間で濃度差がある場合、標識体を構成するアミノ酸（例えば、グリシン等）のシグナル強度比に基づいて、シグナルデータベース１０６ｃに記憶された標識体のシグナル情報を補正する（ステップＳＢ−３）。

ここで、図１６を参照して、本実施の形態における標識体の濃度補正処理の一例について説明する。図１６は、本実施の形態における標識体間のタンパク質濃度の一例を示す図である。

正確にアミノ酸を判別するために、標識体間でタンパク質濃度が等しいことが望ましい。しかしながら、実際には、調製誤差、または、標識体を順に測定していく際に生じる測定までの待ち時間の差異により、標識体間で沈殿または変性による濃度差が生じる。また、試料管内の磁場不均一性が標識体間で異なる場合にも、濃度差がある場合と同様の影響が生じる。

そこで、補正部１０２ｃは、これらの影響を調整するため、全て１００％標識してあるグリシンのピークを利用して、シグナル情報を補正してもよい。例えば、図１６に示すように、グリシンと判別されたピークの^１５Ｎ標識率から、標識体１乃至３の実際の濃度比は、９６．５：９９．５：９７．６であると推定される。そこで、補正部１０２ｃは、各ピークのＨＳＱＣ強度、および、ＨＮＣＯ強度を、標識体１については０．９６５、標識体２については０．９９５、および、標識体３については０．９７６で割った値をアミノ酸判別に用いる補正値として取得してもよい。

図３に戻り、判別部１０２ｄは、標識パターンデータベース１０６ｂに記憶された標識パターンに基づいて、補正部１０２ｃにより補正されたシグナル情報に基づく標識体のシグナルがどのアミノ酸に由来するかを判別する（ステップＳＢ−４）。

そして、帰属部１０２ｅは、タンパク質配列情報データベース１０６ａに記憶された配列情報に基づいて、判別部１０２ｄによりどのアミノ酸に由来するか判別された標識体のシグナルの主鎖帰属を行う（ステップＳＢ−５）。

ここで、図４および図１７を参照して、本実施の形態におけるアミノ酸判別処理の一例について説明する。図１７は、本実施の形態におけるアミノ酸判別処理の一例を示す図である。

まず、本実施の形態におけるアミノ酸判別（主鎖帰属）処理においては、各ピークについて以下の数式（３）を用いて、安定同位体標識率を求めてもよい。

（ここで、ｒ_Ｎ１乃至ｒ_Ｎ３はこのピークから見たｉ位の標識体１乃至３の^１５Ｎ標識率であり、ｍａｘ（ａ_ＨＳＱＣ）は標識体１乃至３におけるＨＳＱＣ強度の最大値である。）

また、ＨＮＣＯ強度は、ｉ位の^１５Ｎ標識率とｉ−１位の^１３Ｃ標識率との両方に比例するので、ＨＮＣＯ強度からｉ−１位の^１３Ｃ標識率を求めるには、まず、先に求めた^１５Ｎ標識率で割る必要があるため、以下の数式（４）を用いて、ＨＮＣＯ強度を計算してもよい。

（ここで、ａ’_{ＨＮＣＯ１}乃至ａ’_{ＨＮＣＯ３}は、^１５Ｎ標識率で割ったあとのＨＮＣＯ強度（以下、修正ＨＮＣＯ強度と記載する）であり、ｒ_Ｃ１乃至ｒ_Ｃ３は、このピークから見たｉ−１位の標識体１乃至３の^１３Ｃ標識率であり、ｍａｘ（ａ’_ＨＮＣＯ）は、標識体１乃至３の修正ＨＮＣＯ強度の最大値である。）

ここで、判別部１０２ｄは、このように求めたｉ位の^１５Ｎ標識率が、６２．５％未満の場合５０％、６２．５％以上８７．５％未満の場合７５％、または、８７．５％以上の場合１００％であるとして、図４に示す標識率から、その標識率に該当するアミノ酸をｉ位のアミノ酸として判別してもよい。また、判別部１０２ｄは、ｉ−１位の^１３Ｃ標識率が、２５％未満の場合０％、２５％以上７５％未満の場合５０％、または、７５％以上の場合１００％であるとして、図４に示す標識率から、その標識率に該当するアミノ酸をｉ−１位のアミノ酸として判別してもよい。

ここで、アミノ酸判別が正しいかどうかを確認するため、別途、本実施の形態において判別したタンパク質（ヒトＳｍｏｏｔｈｅｌｉｎタンパク質）について、三重共鳴による連鎖帰属法により主鎖帰属を行い、本実施の形態における判別結果と比較した。当該比較により、ＨＳＱＣ上で他のピークと重なっていない、主鎖由来のピークは８８個あった。そして、当該ピークについて、ｉ−１位がプロリンである場合には、ｉ位が正しく判別できている場合に正解であるとし、ｉ−１位がプロリン以外のアミノ酸残基である場合には、ｉ位とｉ−１位とがともに正しく判別できている場合に正解であるとして、解析したところ、８８ピーク全てについて正解であることが確かめられた。

例えば、図１７には、本実施の形態におけるヒトＳｍｏｏｔｈｅｌｉｎタンパク質のアミノ酸判別（アスパラギン酸７３の判別）の一例が示してある。図１７に示すピークのｉ−１位に相当する残基は、アラニン７２であるが、本発明を適用することにより、ｉ位のアスパラギン酸、および、ｉ−１位のアラニン共に正しく判別できた。

また、図１８を参照して、本実施の形態における判別精度の一例について説明する。図１８は、本実施の形態における判別精度の一例を示す図である。

図１８には、本発明による判別の精度を確認するため、ＨＳＱＣ上で他のピークと重なっていないヒトＳｍｏｏｔｈｅｌｉｎタンパク質の主鎖由来の８８ピークについて、標識体およびアミノ酸の種類毎に、求めた標識率の平均およびばらつきを示している。ここで、黒丸印は、平均値を示しており、バツ印は、設定した標識率（図４のとおり）を示しており、エラーバーは、標準偏差を示している。図１８に示すように、^１５Ｎについては、１００％、７５％、または、５０％の３段階のいずれであるか、^１３Ｃについては、１００％、５０％、または、０％の３段階のいずれであるかを見極めるために十分な標識精度があることが示された。

また、図１９を参照して、本実施の形態において観測されたシグナルに重複が生じている場合に、重複シグナルを分離して判別した一例について説明する。図１９は、本実施の形態における重複シグナルを分離して判別した一例を示す図である。

図１９には、ＨＳＱＣ上、および、ＨＮＣＯ上でヒトＳｍｏｏｔｈｅｌｉｎタンパク質の主鎖由来の２つのシグナル（トリプトファン９、および、グルタミン２３）が重なっている場合（図１９（ａ））に、本実施の形態における判別方法を適用することにより重複シグナルを分離して正しく判別できることが示されている。

まず、図１９（ｂ）には、重なってみえるピークが１つのアミノ酸残基に由来するものであると仮定した場合に、標識体１乃至３のＨＳＱＣ上、および、ＨＮＣＯ上の各シグナルを下記の数式（２）に示す２次元ガウス関数にフィッティングさせて解析した結果が示されている。

この結果について、下記の数式（３）に基づき、標識体１乃至３のｉ位の^１５Ｎ標識率を計算すると、ｒ_Ｎ１＝０．４９３、ｒ_Ｎ２＝０．７５１、および、ｒ_Ｎ３＝１．０００となり、スレオニンであると判別（誤判別）された。

また、下記の数式（４）に基づき、標識体１乃至３のｉ−１位の^１３Ｃ標識率を計算すると、ｒ_Ｃ１＝１．０００、ｒ_Ｃ２＝０．９３０、および、ｒ_Ｃ３＝０．２７１となり、フェニルアラニンであると判別（誤判別）された。

この場合、図１９（ｃ）に示すように、実際に観測されたピーク（図１９（ａ））と、１つのシグナルのものであると仮定した場合のモデル（図１９（ｂ））との間には残差（エラー）が生じており、適切なフィッティングが行えていないことがわかった。

一方、図１９（ｄ）には、重なってみえるピークが２つのアミノ酸残基に由来すると仮定した場合に、標識体１乃至３について、上述と同様に解析した結果が示されている。

ここで、図１９（ｄ）（ｉ）に示したシグナルについて、標識体１乃至３のｉ位の^１５Ｎ標識率は、ｒ_Ｎ１＝０．４８３、ｒ_Ｎ２＝０．４５４、および、ｒ_Ｎ３＝１．０００となり、トリプトファンであると判別（正しく判別）された。

そして、図１９（ｄ）（ｉ）に示したシグナルについて、標識体１乃至３のｉ−１位の^１３Ｃ標識率は、ｒ_Ｃ１＝１．０００、ｒ_Ｃ２＝０．４０９、および、ｒ_Ｃ３＝−０．０４３となり、アスパラギン酸であると判別（正しく判別）された。

また、図１９（ｄ）（ｉｉ）に示したシグナルについて、標識体１乃至３のｉ位の^１５Ｎ標識率は、ｒ_Ｎ１＝０．４９８、ｒ_Ｎ２＝０．９５４、および、ｒ_Ｎ３＝１．０００となり、グルタミンであると判別（正しく判別）された。

そして、図１９（ｄ）（ｉｉ）に示したシグナルについて、標識体１乃至３のｉ−１位の^１３Ｃ標識率は、ｒ_Ｃ１＝０．５９６、ｒ_Ｃ２＝１．０００、および、ｒ_Ｃ３＝０．４８７となり、イソロイシンであると判別（正しく判別）された。

このように、図１９（ｄ）に示すように、図１９（ｄ）（ｉ）にトリプトファン９のシグナル、図１９（ｄ）（ｉｉ）にグルタミン２３のシグナルが、それぞれ正しく判別されている。

この場合、図１９（ｅ）に示すように、実際に観測されたピーク（図１９（ａ））と、ピークが２つのシグナルの重複であると仮定した場合のモデル（図１９（ｄ）（ｉ）、（ｉｉ））の各ピーク強度を加算したものとの間には残差が殆ど生じておらず、適切なフィッティングが行えていることが明らかとなった。

以上のように、従来の組み合わせ選択標識法では、標識の有無または強弱という定性的な情報のみを用いているため重複シグナルを分離することができず、シグナルが重なっている場合、誤判別が生じる可能性が高かった。それに比べて、本実施の形態における判別方法によれば、各シグナルをガウス関数にフィッティングさせて定量的な解析を行うことにより、重複シグナルを分離して判別することが可能になるため、判別精度を飛躍的に向上させることが可能となる。

図３に戻り、結果出力部１０２ｆは、帰属部１０２ｅにより行われたシグナルの主鎖帰属に関する解析結果を表示部１１２に表示させ（ステップＳＢ−６）、処理を終了する。ここで、結果出力部１０２ｆは、解析結果を印刷出力部を介して出力させてもよい。

以上で、本実施の形態におけるタンパク質解析装置１００の処理の一例の説明を終える。

［他の実施の形態］
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。

例えば、タンパク質解析装置１００がスタンドアローンの形態で処理を行う場合を一例に説明したが、タンパク質解析装置１００は、クライアント端末（タンパク質解析装置１００とは別筐体である）からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。

また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。

このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。

また、タンパク質解析装置１００に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。

例えば、タンパク質解析装置１００の各装置が備える処理機能、特に制御部１０２にて行われる各処理機能については、その全部または任意の一部を、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）および当該ＣＰＵにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じてタンパク質解析装置１００に機械的に読み取られる。すなわち、ＲＯＭまたはＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）などの記憶部１０６などには、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）と協働してＣＰＵに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、ＲＡＭにロードされることによって実行され、ＣＰＵと協働して制御部を構成する。

また、このコンピュータプログラムは、タンパク質解析装置１００に対して任意のネットワーク３００を介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。

また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、ＵＳＢメモリ、ＳＤカード、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ、および、Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ等の任意の「可搬用の物理媒体」を含むものとする。

また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。

記憶部１０６に格納される各種のデータベース等（タンパク質配列情報データベース１０６ａ、標識パターンデータベース１０６ｂ、および、シグナルデータベース１０６ｃ）は、ＲＡＭ、ＲＯＭ等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。

また、タンパク質解析装置１００は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、タンパク質解析装置１００は、該情報処理装置に本発明の方法を実現させるソフトウェア（プログラム、および、データ等を含む）を実装することにより実現してもよい。

更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。

［本実施の形態のまとめ］
ＮＭＲを用いたタンパク質の解析において、主鎖アミド水素および窒素の化学シフトを決定する主鎖帰属の工程は、立体構造解析、相互作用部位解析、または、分子内運動の解析などに必要な工程である。また、主鎖帰属は、多くの場合、三重共鳴による連鎖帰属法によって達成されるが、タンパク質が高分子量である、低収量である、低溶解度である、または、会合しているなどの場合困難を伴う。したがって、このような場合、アミド窒素をアミノ酸選択的に^１５Ｎ標識することで、ｉ位のアミノ酸を判別することができるアミノ酸選択的安定同位体標識法が有効である。また、デュアル選択標識法では、さらにカルボニル炭素をアミノ酸選択的に^１３Ｃ標識することでｉ−１位のアミノ酸を判別することができる。

これら従来のアミノ酸選択標識法は、アミノ酸の種類の数に相当する多くの種類の選択標識体が必要であり、時間、コスト、および、手間のかかる方法であった。また、必要な選択標識体の数を減らすために、組み合わせ選択標識法が提案されているが、従来の組み合わせ選択標識法は、定性的な安定同位体標識の情報（標識の有無または強弱）を利用していた。すなわち、従来の組み合わせアミノ酸選択標識法においては、本発明のように、たとえ、安定同位体標識率の違いを符号で表現する、即ち、安定同位体標識の有（または標識率の高）を例えば「１」に、無（または標識率の低）を例えば「０」に対応づけることにより符号化したとしても、１６種類のアミノ酸を４桁の２進数で符号化していることとなり、２進数を使う限り１標識体あたりに盛り込める情報量は１ビットにとどまるため、さらなる標識体数の減少は望めないという問題点を有していた。これにより、特に対象タンパク質が高分子量である、低収量である、低溶解度である、または、会合しているなど難度の高いタンパク質である場合に、アミノ酸判別を行うのに十分なスペクトルを得るためにかかる時間が大幅に長くなってしまい、現実的には困難である場合が生じるという問題点を有していた。また、従来の組み合わせアミノ酸選択標識法においては、定量的なシグナル強度解析を行なわないことから、本発明のようにハミング距離を定義するなどして標識パターンを最適化することができず、標識体数とアミノ酸数との組み合わせによっては情報量に無駄が生じてしまうという問題点を有していた。また、ＨＮＣＯスペクトルのシグナル強度はｉ−１位の^１３Ｃの標識率のみならずｉ位の^１５Ｎ標識率にも影響を受けることから、定量的なシグナル強度解析を行なわず、ＨＮＣＯスペクトルにおけるシグナルの有無のみを利用する従来法では、そもそも^１３Ｃ標識率を３段階以上に設定できないという問題点を有していた。

一方、本発明は、定量的な安定同位体標識率の情報を利用することで、選択標識体１種類あたりの情報量を増やし、少ない数の選択標識体で同じ情報を得ることができる。すなわち、本発明では、安定同位体標識率を定量的に制御して符号化し、ＮＭＲスペクトルの強度比から標識率を逆算することによって復号することで、１つの標識体により多くの情報を盛り込んでいる。例えば、本発明のアミノ酸判別は、ＮＭＲスペクトルから標識率を逆算することによって行い、^１５Ｎの標識率を、ＨＳＱＣ強度を用いて求め、^１３Ｃの標識率を、ＨＮＣＯの強度を先にＨＳＱＣ強度を用いて求めた^１５Ｎの標識率で割ることにより求めることで、定性的な１ビットの情報ではなく、定量的な１ビットを超える情報を利用可能としている。また、本発明では、全てのアミノ酸について、少なくとも１つの標識体で１００％標識になるように標識パターンを設計することでリファレンスとしてのユニバーサル標識体を不要としている。また、本発明では、ハミング距離を考慮して標識パターンを最適化することにより、任意の標識体数と任意のアミノ酸数において情報量に無駄がなくノイズ等の攪乱要因に最も強い標識パターンを客観的に生成することが可能である。これらの工夫によって必要な選択標識体数を減らすことにより、高難度のタンパク質でも現実的な時間で解析することが可能である。

また、例えば、本発明にリファレンスとしてのユニバーサル標識体を加えた場合、リファレンスを含めて３種類の標識体で９種類、４種類の標識体で２７種類（実際には２０種類）を判別することもできる。

したがって、本発明は、従来多くの標識体を必要としていた選択標識法に代わり、同じ情報を、より少ない標識体数で得る方法であり、主鎖帰属の工程を時間、手間、および、コストの意味で効率化させ、これまで現実的には困難であったものを可能にするものである。また、主鎖帰属は、多くのタンパク質ＮＭＲ解析の基礎となる工程であり、本発明の波及効果は大きいものである。

以上詳述に説明したように、本発明によれば、少ない標識体数でアミノ酸判別を行なうことにより時間、コスト、および、手間を大幅に削減することができるタンパク質解析装置、タンパク質解析方法、および、プログラムを提供することができるので、特に医療、製薬、創薬、および、生物学研究などの様々な分野において極めて有用である。

１００タンパク質解析装置
１０２制御部
１０２ａ標識パターン生成部
１０２ｂシグナル情報取得部
１０２ｃ補正部
１０２ｄ判別部
１０２ｅ帰属部
１０２ｆ結果出力部
１０４通信制御インターフェース部
１０６記憶部
１０６ａタンパク質配列情報データベース
１０６ｂ標識パターンデータベース
１０６ｃシグナルデータベース
１０８入出力制御インターフェース部
１１２表示部
１１４入力部
２００外部システム
３００ネットワーク

Claims

記憶部と制御部とを少なくとも備えたタンパク質解析装置であって、
上記記憶部は、
タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの上記同位体標識率であるかを規定する標識パターンを記憶する標識パターン記憶手段と、
上記標識パターンで構成された上記タンパク質である標識体のＮＭＲ測定により得られるシグナル情報を記憶するシグナル記憶手段と、
を備え、
上記制御部は、
上記標識パターン記憶手段に記憶された上記標識パターンに基づいて、上記シグナル情報に基づく上記標識体のシグナルがどの上記アミノ酸に由来するかを判別する判別手段、
を備えたことを特徴とするタンパク質解析装置。
請求項１に記載のタンパク質解析装置において、
上記記憶部は、
上記タンパク質のアミノ酸配列に関する配列情報を記憶するタンパク質配列情報記憶手段、
を更に備え、
上記制御部は、
上記タンパク質配列情報記憶手段に記憶された上記配列情報に基づいて、上記判別手段によりどの上記アミノ酸に由来するか判別された上記シグナルの帰属を決定する帰属手段、
を更に備えたことを特徴とするタンパク質解析装置。
請求項１または２に記載のタンパク質解析装置において、
上記制御部は、
上記標識体毎の上記同位体標識率の差の絶対値の和であるハミング距離に基づいて、上記標識パターンを生成し、上記標識パターン記憶手段に格納する標識パターン生成手段、
を更に備えたことを特徴とするタンパク質解析装置。
請求項３に記載のタンパク質解析装置において、
上記ハミング距離は、
以下の数式（１）を用いて算出することを特徴とするタンパク質解析装置。

（ここで、ｄ（ｉ，ｊ）はアミノ酸ｉと，他のアミノ酸ｊと、の間のハミング距離、ｎは標識体の数、ｐ_ｉ ^ｋは標識体ｋにおけるアミノ酸ｉの同位体標識率、および、ｐ_ｊ ^ｋは標識体ｋにおけるアミノ酸ｊの同位体標識率である。）
請求項１または２に記載のタンパク質解析装置において、
上記制御部は、
上記タンパク質を構成するアスパラギン酸とアスパラギンと、および／または、グルタミン酸とグルタミンとの間で起こるスクランブルに基づいて、上記標識パターンを生成し、上記標識パターン記憶手段に格納する標識パターン生成手段、
を更に備えたことを特徴とするタンパク質解析装置。
請求項１乃至５のいずれか一つに記載のタンパク質解析装置において、
上記元素は、
窒素、および、炭素であることを特徴とするタンパク質解析装置。
請求項１乃至６のいずれか一つに記載のタンパク質解析装置において、
上記制御部は、
上記標識体間で濃度差がある場合、上記標識体を構成するアミノ酸のシグナル強度比に基づいて、上記シグナル情報を補正する補正手段、
を更に備えたことを特徴とするタンパク質解析装置。
請求項１乃至７のいずれか一つに記載のタンパク質解析装置において、
上記ＮＭＲ測定は、
ＮＭＲ相関スペクトルの測定であることを特徴とするタンパク質解析装置。
記憶部と制御部とを少なくとも備えたタンパク質解析装置において実行されるタンパク質解析方法であって、
上記記憶部は、
タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの上記同位体標識率であるかを規定する標識パターンを記憶する標識パターン記憶手段と、
上記標識パターンで構成された上記タンパク質である標識体のＮＭＲ測定により得られるシグナル情報を記憶するシグナル記憶手段と、
を備え、
上記制御部において実行される、
上記標識パターン記憶手段に記憶された上記標識パターンに基づいて、上記シグナル情報に基づく上記標識体のシグナルがどの上記アミノ酸に由来するかを判別する判別ステップ、
を含むことを特徴とするタンパク質解析方法。
記憶部と制御部とを少なくとも備えたタンパク質解析装置に実行させるためのプログラムであって、
上記記憶部は、
タンパク質を構成する各アミノ酸が、３段階以上の同位体標識率のうち元素毎にどの上記同位体標識率であるかを規定する標識パターンを記憶する標識パターン記憶手段と、
上記標識パターンで構成された上記タンパク質である標識体のＮＭＲ測定により得られるシグナル情報を記憶するシグナル記憶手段と、
を備え、
上記制御部において、
上記標識パターン記憶手段に記憶された上記標識パターンに基づいて、上記シグナル情報に基づく上記標識体のシグナルがどの上記アミノ酸に由来するかを判別する判別ステップ、
を実行させるためのプログラム。