JP3607948B2 - NMR signal attribution support system - Google Patents

NMR signal attribution support system Download PDF

Info

Publication number
JP3607948B2
JP3607948B2 JP2001333904A JP2001333904A JP3607948B2 JP 3607948 B2 JP3607948 B2 JP 3607948B2 JP 2001333904 A JP2001333904 A JP 2001333904A JP 2001333904 A JP2001333904 A JP 2001333904A JP 3607948 B2 JP3607948 B2 JP 3607948B2
Authority
JP
Japan
Prior art keywords
attribution
cluster
amino acid
spectrum
support system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001333904A
Other languages
Japanese (ja)
Other versions
JP2003139832A (en
Inventor
冬彦 稲垣
政志 横地
Original Assignee
国立大学法人 北海道大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人 北海道大学 filed Critical 国立大学法人 北海道大学
Priority to JP2001333904A priority Critical patent/JP3607948B2/en
Publication of JP2003139832A publication Critical patent/JP2003139832A/en
Application granted granted Critical
Publication of JP3607948B2 publication Critical patent/JP3607948B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、NMRによるタンパク質の立体構造の解析に関するものであり、特に、立体構造の解析に必要なNMRシグナルの帰属に対する支援システムに関するものである。
【0002】
【技術的背景】
核磁気共鳴法(NMR)は、溶液中におけるタンパク質の原子レベルにおける静的・動的立体構造を決定できる唯一の分光法である。いまや、NMRによって決定されたタンパク質の立体構造をもとに、さまざまな生命現象を分子認識の観点から説明することが可能になり、NMRは構造生物学を支える重要な柱のひとつになった。
【0003】
NMRを用いたタンパク質の立体構造解析の手順は以下のようになる。
(1)NMR測定
NMR測定には、1mM程度の水溶液(90%HO,10%DO)を400μl用いる。測定対象によっては不規則な会合体を形成して、試料溶液が白濁することもある。このような状態は、のちのNMR測定および解析に多大な障害をもたらすので、測定試料のpH、イオン強度などを変化させ至適測定条件を見つけだす。
(2)NMRシグナルの帰属
検出されたNMRシグナルがタンパク質中のどの原子核由来であるかを明らかにすることをNMRシグナルの帰属とよぶ。このステップはタンパク質の立体構造決定においてきわめて重要であり、慎重に行なうべきである。シグナル帰属法に関してはいくつかの2次元NMRをはじめとして3次元、4次元NMRスペクトルを使用する組織だった戦略が確立されている。
(3)構造情報の収集
NMRスペクトルの中には、核オーバーハウザ−効果(NOE)、スピン結合などタンパク質の構造決定に有用な情報が多数含まれている。NMRスペクトル多次元表示することにより、たとえばプロトン核間の距離情報を反映したNOE交差ピークを一望に鳥瞰することができ、シグナル帰属に基づき溶液中のタンパク質のプロトン間距離を見積もることができる。
(4)立体構造計算
3次元空間に存在する点の座標が与えられるならば、その座標からある2点間の距離を算出することは簡単なことである。ではこの逆、すなわち2点間の距離からそれぞれの点の3次元座標を求めることは可能であろうか?答えは’可’であり、ある立体を構成する点間の距離からそれぞれの点の座標を求める計算をディスタンス・ジオメトリー計算とよんでいる。したがって、NMRによるタンパク質の立体構造計算とは、ワークステーションを用いて、NOEから得られた距離情報などをもとにディスタンス・ジオメトリー法により立件構造を計算することである。X線結晶構造解析と異なり、NMRによるタンパク質の立体構造は近距離(5Å以内)情報の積み重ねにより決定されている。実際の計算に際しては、共有結合周りの回転角度である2面角に関する情報など、できるかぎりの構造情報を利用している。
【0004】
NMR法は、水溶液におけるタンパク質の立体構造を明らかにできる点で、構造生物学の重要な解析手法である。この解析手法では、上述したように、シグナル帰属を正確に行うことが必要である。シグナル帰属では、主鎖のシグナル帰属、側鎖のシグナル帰属、距離情報を得るためのNOEの帰属と、10−20種類以上におよぶスペクトルを組み合わせて解析し、必要な情報を取り出すことが必要である。図1にその例を示す。
図1(a)に、66残基からなる2量体タンパク質の1次元スペクトルのアミドプロトン−芳香環領域を示す。数十のアミドプロトン・シグナルが重なり合い、解析はほとんど不可能である。同じ領域を1H−15N2次元HSQC(図1(b)参照)で観測すると、アミドプロトン・シグナルはアミド窒素の化学シフト軸に展開され、シグナルの縮重が軽減されることがわかる。さらに、図1(c)に示すように、3次元HNCOスペクトルでは、アミドプロトン(H)軸、アミド窒素(N)軸に加え、カルボニル炭素(CO)軸の導入によりシグナルの完全分離が達成される。
この帰属過程は複稚であり、スペクトルの組合せ等、研究者の経験や直感に依存する点が多い。従来の方法では、帰属のプロセスを振り返って変更したり、帰属に至る過程を他の研究者が再現することは困難である。
【0005】
【発明が解決しようとする課題】
本発明の目的は、NMRシグナルの正確な帰属を行うための支援システムを提供することである。
【0006】
【課題を解決するための手段】
上記の目的を達成するために、本発明は、少なくとも、アミノ酸配列、2次元スペクトル、複数の3次元スペクトルを用いて行うNMRシグナル帰属支援システムであって、前記アミノ酸配列を記録しているアミノ酸配列記録手段及びタンパク質のスペクトルを記録しているスペクトル記録手段とを有し、前記アミノ酸配列記録手段から、アミノ酸配列の読み込みを指示するアミノ酸配列読み込み指示入力手段と、前記スペクトル記録手段から前記2次元及び3次元スペクトルの読み込みを指示するスペクトル読み込み指示入力手段と、前記2次元スペクトルを表示する2次元スペクトル表示手段と、前記2次元スペクトル表示手段に表示されたピークが指定されることで、対応する前記複数の3次元スペクトルを表示する3次元スペクトル表示手段と、表示された前記2次元スペクトル又は前記3次元スペクトルを用いて前記ピークが帰属するボンド・コネクティビティを関連づけるボンド・コネクティビティの指示を入力するボンド・コネクティビティ指示入力手段と前記ボンド・コネクティビティの原子型を指示する原子型指示入力手段と、前記ボンド・コネクティビティの一意に連続したものをまとめてクラスタとし、アミノ酸配列の候補と前記作成されたクラスタとを、両者の関連性の確率を計算し、計算された確率により対応させて表示するクラスタ表示手段と、表示された前記アミノ酸配列の候補と、前記クラスタの両者を関連づけるクラスタ帰属指示を入力するクラスタ帰属指示入力手段と、前記クラスタに含まれないピークをフラグメントとして検出し、前記アミノ酸配列の候補と対応させて表示するフラグメント表示手段と、表示された前記アミノ酸配列の候補と前記フラグメントの両者を関連づけるフラグメントの帰属の指示を入力するフラグメント帰属指示入力手段と、前記入力された指示をコマンドとして、コマンド記録手段に帰属過程を記録するログ手段とを備え、帰属の支援を行うとともに帰属過程を記録することを特徴とする。
【0007】
さらに、前記コマンド記録手段に記録したコマンドを再度実行することにより、帰属過程を再現可能とするコマンド実行手段を備えてもよい。
前記原子型指示入力手段は、予め設定したパターンを用いて自動的に原子型を帰属する自動帰属処理手段を含み、自動的に原子型を関連付けてもよい。
前記クラスタ表示手段は、前記アミノ酸配列の候補と前記作成されたクラスタとの関連性の確率を、化学シフトに依存した項とクラスタ両末端の化学シフトの同一性に関わる項から計算して表示してもよい。このとき、前記アミノ酸配列の候補と前記作成されたクラスタとの帰属指示が行われると、確率を計算し直して表示し、帰属が確定するごとに、判断が容易になるようにすることもできる。
また、上述のNMRシグナル帰属支援システムの機能をコンピュータ・システムに実現させるプログラムやプログラムを格納した記録媒体も本発明である。
【0008】
【発明の実施の形態】
以下、図面を参照して、本発明の実施形態であるNMRシグナル帰属支援システムを説明する。
さて、NMRシグナル帰属支援システムにおいて、帰属の操作を行うためには、
(1)帰属の過程と帰属に必要な一連のスペクトルをリンクさせて帰属過程がスペクトル上で確認できること、
(2)帰属の変更を必要とする場合は、スペクトル上で連動して変更できることが必要である。また、
(3)帰属の確度を確かめるため、データベースを参照し、最も確度の高い帰属を確認しながら仕事を進めていくこと
も重要である。
【0009】
パソコン等のコンピュータ・システムに実装した実施形態のNMRシグナル帰属支援システムにおける処理の流れを、図2のフローチャートに基づき、詳しく説明する。
<帰属操作>
本支援システムを起動すると、図3のようなウインドウ200が表示される。本支援システムにおいては、化学シフトデータベースBioMagResBank (The BMRB Database)を利用して予測、診断を行っている。このため、このデータベースに行くためのボタン282がある。
ここで、画面280内の「OK」ボタン281を押してから、ウィンドウ200上部の「ファイル」210をクリックすることにより表示されるメニューを選択して、本支援システムで使用するファイルの読み込みを行う。
まず、試料のアミノ酸配列のファイルを読み込む(S102)。マルチチェインの場合には鎖の数を入力して、アミノ酸配列ファイルを続けて読み込む。アミノ酸配列ファイルとして、一文字表記のアミノ酸一次配列のテキスト・ファイルを用いている。
このときに、読み込んだアミノ酸配列ファイルの名称(試料名)を基に、ログ・ファイルも自動的に作成される(S104)。このログファイルは、本支援システムにおける全ての帰属に関する操作が記録される。このログファイルを使って、前回の帰属状態を回復させることができる。このログファイルについては後で説明する。
【0010】
次に、スペクトル・ファイルとして、フーリエ変換ファイルおよびピークピック・ファイルを読み込む(S106)。フーリエ変換ファイルに対応するピークピック・ファイルを同時に指定して読み込ませる必要がある。3次元以上のスペクトル・ファイルで複数に分かれている場合も、どれか一つ指定すれだけでよい。フーリエ変換したスペクトルだけの読み込みは許されないので、事前にピークテーブル・ファイルを作っておく必要がある。本システムでは、スペクトル・ファイルとしては、 NMRPipeでフーリエ変換処理したファイルおよびNMRDrawで作成したピークテーブル・ファイルを用いている。読みとったスペクトル・ファイルごとに、実験名を定義する(S108)。これにより、読みとったスペクトル・ファイルの表示名、軸名等を指定する。
なお、初期設定として、主鎖連鎖帰属のための実験である、HN−HSQC, HNCO, HNCA, HN(CO)CA, HNCACB, CBCA(CO)NH等がメニューに登録されており、これらに対するスペクトル・ファイルの読み込み、実験名の定義が容易にできる。
【0011】
NMRのスペクトルの帰属に必要なファイルを全て読み込む(S110でYES)と、帰属の操作を開始する。主鎖の帰属を行うため、まず、HSQCスペクトルのシグナルをピックする。そのために、図3において、「contoure−2D」220をクリックして、実験名を指定し、読み込んだHN−HSQCの2次元ファイルを表示する(S112)。これを示したのが図4である。
図4に示した様に、本支援システムでは、HN−HSQCの2次元スペクトル300は、S/N分析、双3次補間、双曲線補間を用いて、常に適当な閾値が調整された等高線でスペクトルを表示している。各ピーク位置は、十字により表示されている。2次元スペクトル300には、実験名310,軸名320と330も表示されている。また、各ピークに対しては、読み込んだピークピック・ファイルにおけるピーク番号(インデックス)が付与されている。
表示される2次元スペクトルは9つに分割して、ウインドウ340で選択することで、分割されたそれぞれを拡大して表示できる。また、範囲を指定して、指定された範囲を拡大して表示することもできる。図4は拡大された2次元スペクトルである。
【0012】
重なり合ったり、肩になったピークについては、HN(CO)CA等の3次元スペクトルを投影して、ピーク位置を確定する。この操作は後で説明する。この時にも、インデックスが付与される。この様にして、HSQCスペクトル上に観測される全てのピークについてインデックス付けを行なう(例えば図4の360参照)。以降の帰属過程はこのピーク番号(インデックス)に基づいて行う。
ピーク情報には最大24文字までのメモを残すことができる。これは、ウインドウ350内のテキスト・ボックス354に書き込むことで作成される。1つのピークには最大10個のメモを残すことができる。それらは日付管理され、通常最新のメモは強制的にスペクトル上に表示される。
ピークに与えられる帰属ラベルは、3次元実験との連結の確定、さらに帰属を確定することで、”アミノ酸一文字表記+残基番号”形式で表示されるようになる。リンクが確定しないうちは、何も表示されない。ラベル表示色については、以下の規則がある。
灰色:他の3次元実験と連結なし
黄色:3次元実験との連結があり、帰属は未確定
ピンク:帰属が確定
【0013】
<主鎖の帰属>
さて、主鎖連鎖帰属の作業手順は、
(a)ボンド・コネクティビティ(Bond Connectivity)の確立作業
(b)クラスタ・コネクティビティ(Cluster Connectivity)およびクラスタ・タグ(Cluster−Tag)の確立
(c)クラスタ・タグ(Cluster−Tag)の帰属
(d)フラグメント(Fragment)の帰属
(e)帰属の評価
の5段階に分けられている。
ここで、ボンド・コネクティビティとは、参照する2次元実験のピークテーブルの化学シフト値で3次元実験の領域を切り出し、その面上にある3次元ピークと2次元ピークとを関連づける情報である。クラスタ・コネクティビティとは、2つのボンド・コネクティビティ間で、前後の化学シフトがユニークに一致した情報である。クラスタ・タグとは、複数のクラスタ・コネクティビティが一意に連続したもの集まりに、順番にタグ番号を与えて管理した情報である。クラスタ・タグは、インデックスのシーケンスとして表現される。フラグメント(Fragment)とは、クラスタ・タグに含まれなかった全てのボンド・コネクティビティのことである。
【0014】
(a)ボンド・コネクティビティ(原子型帰属)の確立
主鎖帰属でまず最初に行うことは、3次元実験を2次元実験の化学シフトの軸でスライスした面を切り出した上で、原子型帰属ボンド・コネクティビティ(原子型帰属)を確定することである。これを行うために、3次元のスペクトルを表示する必要がある。
このため、図4で、「Main Chain Assignment」230から、メニューを選択して、図5に示すウインドウ370を開き、インデックス入力欄372に、インデックスを入力することで、ピークを指定する(S114)。これにより、図6に示すように、指定したインデックスに対応する3次元スペクトル画面400が表示される(S116)。
画面400には、指定インデックスのシグナルに対応するストリップ・チャートである、HNCO410,HNCA420,HN(CO)CA430,CBCANH440,CBCA(CO)NH450が、各スペクトル・ファイルから自動的に切り出されて、表示されている。この表示されているストリップは、図5のウインドウ370内のボタン類376により、指定インデックスの化学シフトから、各軸に対して少しずつ切り出し面をずらして表示することができる。これらのボタン類376は、2次元実験で複数のシグナルが接近している場合に、3次元実験上の対応するシグナルを区別するために使用する。なお、切り出し面をずらすことは、各ストリップごとでもできるし、全ストリップ同時に行うこともできる。
【0015】
図6に示すように、表示された3次元のHNCAスペクトルでは、アミドプロトン、アミド窒素の化学シフト(HN,N)と同じ残基のαカーボンCA(i)と前の残基のαカーボンCA(i−1)との相関が表示される。同様に、HN(CO)CAでは(HN,N)とCA(i−1)、CBCANHでは(HN,N)とCA(i−1)、CB(i−1)、CA(i)、CB(i)の相関が、CACB(CO)NHでは(HN,N)とCA(i−1)、CB(i−1)との相関が表示される。
ここで、シグナルの示す強弱、正負の違いから、また、必要ならば隣接したスライスでシグナルの増減を確認するなどして、参照実験上で重なり合ったシグナルを完全に区別する。そして、インデックスと関連のある3次元ピークをクリックして、ウインドウ470を表示し、「Create Bond Connectivity」ボタン472をクリックすることによって、ボンド・コネクティビティを確定する。この確定の後、炭素原子の型を、例えば、「Assign Atom Type」ボタン476をクリックして、メニュー480から、CO(−)/CO/CO(HB),CA(−)/CA,CB(−)/CBのように分類して帰属をする(S118)。いったん確定した関連性は、同じインデックスのストリップ面上でのみ、「Destroy Bond Connectivity」ボタン474をクリックすることで、解除することができる。なお、CO(HB)とは、水素結合のドナーのカルボニル炭素のことである。
各ストリップ上で全ての相関ピークが観測されるのではなく、重なったり、S/Nが悪いため、ピークが観測されないこともある。そこで、可能なパターンを各スペクトルについて生成し、全てのストリップ・チャートの組についてつじつまのあう帰属を求める。
【0016】
インデックス間で重なりがあったら、新たにピークを追加するなどして、2次元実験との関連性を一対一に保つよう帰属する。これを行うために、「ReturnFeedbacktoRef−2D」ボタン478をクリックする。これにより、新たなピークが形成されて、そのピークに対してインデックスが付与される。なお、付与されたピークには「Feedbackfrom3D」が表示される。また、2次元スペクトル上で少しでもピークの形状が歪んでいたら、インデックスの重なりがあるかどうか検討して、全ての曖昧さに決着をつける必要がある。
この様にして、2次元のHSQCスペクトル上のピークと、3次元の各スペクトル上でのピークとの対応と、それぞれのピークの帰属(CA(i−1),CB(i−1)、CA(i)、CB(i))が完了する(S120でYES)。
【0017】
(b)クラスタ・タグの作成
クラスタ・コネクティビティおよびクラスタ・タグは、メニュー「Main Chain Assignment」230(図6参照)をクリックすると現れる「Make Cluster Connectivities」ボタンをクリックすることで作成される(S122)。この処理では、複数のクラスタ・コネクティビティが一意に連続したもの集まりに、順番にタグ番号を与えて、クラスタ・タグを作成する。出来上がったクラスタ・タグは、「View Cluster Connectivities」メニューで、ウインドウ490(図7参照)を表示することで確認できる。ここで、「Cluster−Tag Index」492として、#1が表示されている。クラスタ・インデックスは、「+」「−」ボタン494で増減でき、その番号のクラスタ・タグの内容は、「Show Cluster−Tags」ボタン496で、表示することができる。クラスタ・タグの内容は、「Cluster−Tag’s Sequence」498に、インデックスの連続として表示される。
【0018】
(c)クラスタ・タグの帰属
クラスタ・タグの帰属では、アミノ酸一次配列と化学シフト・ライブラリーとを用いてアミノ酸予測を行い、クラスタ・タグとアミノ酸配列とを対応させる。この処理は、メニュー「Main Chain Assignment」230(図7参照)をクリックすると現れる「Assign Cluster−Tag Sequences」ボタンをクリックすることで行われ、図8に示す画面500が表示される。
図8において、画面500は、上下2段に別れ、各段の上部には、読み込んだアミノ酸の一次配列512,514が表示されている。これに対応するクラスタ・タグ・シーケンスが、右側に表示されているクラスタ・タグ番号540の線上に、帰属可能な候補として黄緑のバーで明示されている。バーの横の数字は、アミノ酸配列番号と括弧内に表示されている予測による確率である。表示されている確率の計算については、後で説明する。このバーをクリックすると、バーに対応したクラスタ・タグの内容がウインドウ550に表示される。
クラスタ・タグの帰属の処理は、当てはまり予測により、確かそうなクラスタ・タグから順番にアミノ酸配列に対して帰属させる。帰属操作は、ウインドウ550内の「Assign Cluster−Tag」ボタン552をクリックすることで行う(S124)。一度タグによって帰属された配列は、次回のアミノ酸の型予測の対象から外されるので、帰属可能な候補の確率は再計算される。この帰属操作・再計算は繰り返される。従って、はじめは、帰属可能な配列の特定できなかったタグも他が帰属されるごとに、候補が絞り込まれていく。この帰属を繰り返すことによって、数分のうちに7割以上の帰属が終了する。
【0019】
(d)フラグメントの帰属
ある程度クラスタ・タグの帰属解析が進んでいくと、どうしても帰属ができない領域が生まれる。この原因は、クラスタ・コネクティビティが一意でなかったり、Cbの化学シフトが決まらなかったりして、生じたフラグメントによって説明される。それらの帰属は、アミノ酸の型予測とクラスタ・タグの端の化学シフトの一致、不一致の情報を頼りにして帰属を埋めていかなければならない。
これを行うために、メニュー「Main Chain Assignment」230(図8参照)をクリックすると現れる「Assign Fragment Indeces」によって行われ、図9に示す画面600が表示される。図9の画面600は、図8に示した画面500と同様の構成であり、上下2段に別れ、各段の上部には、読み込んだアミノ酸の一次配列612,614が表示されている。フラグメントが検出され、アミノ酸配列612,614に対応して、右側に表示されているフラグメント番号640の線上に、帰属可能な候補として黄緑の三角で明示されている。三角の横の括弧内の数字は、予測による確率である。この三角をクリックすると、三角に対応したフラグメントの情報がウインドウ650に表示される。
このウインドウ650に表示される情報を参考に、フラグメントの帰属を決定する。フラグメントを帰属させるためには、ウインドウ650内の「Assign Fragment」ボタン652をクリックする(S126)。
【0020】
(e)帰属の評価
決定された帰属の評価は、メニュー「Main Chain Assignment」230(図9参照)をクリックすると現れる「Assess Main Chain Assignments」によって行われ、図10に示す画面700が表示される(S128)。図10における画面700では、上下2段に分かれて、アミノ酸配列712,714が表示されている。このアミノ酸配列に対応して、右側の表示に対するクラスタ間の化学シフトの不一致やアミノ酸型予測からの逸脱等が、色やバーの高さで表示される。緑<黄<赤の順、あるいはバーの高さが高いほどその帰属の信頼性が低いことを示している。それらの帰属を評価し直し、その原因を必ず追及することにより、フラグメントの帰属が解消される。帰属の結果は、メニュー「Main Chain Assignment」230(図10参照)をクリックすると現れる「List Main Chain Assignments」ボタンによってテキスト保存される。また、アミノ酸の文字をクリックするとウィンドウ540が現れ、帰属を外すことができる。
なお、上述では、3次元スペクトルを用いているが、4次元のスペクトルを用いることもできる。
【0021】
<側鎖の帰属>
側鎖についても、上述の主鎖における2次元実験とクラスタ・コネクティビティを確定し原子型を帰属する過程と同様の手順で、メニュー240を用いることにより帰属操作を行うことができる。
アミドプロトン−アミド窒素(HN−N)を経由する脂肪族側鎖の帰属は、2次元実験としてNH−HSQCを使用し、リンクを確定する実験として、3次元のHBHA(CO)NH,C(CO)NH,HC(CO)NHを使用する。
また、芳香族側鎖の帰属は、参照する2次元実験として、HN−HSQC,CT−HSQCの両方を用い、クラスタ形成に必要なスピン系を裏付ける実験として、2次元のCOSY,TOCSY,NOESYも使われる。帰属を確定する実験としては、3次元のHCCH−COSY,HCCH−TOCSY,15NeditedNOESY,13CeditedNOESYあるいは4次元のHCCH−COSY,HCCH−TOCSY,C−C NOESY,C N NOESYなどが使われる。
次に、例えば、芳香族側鎖の帰属の際には、主鎖帰属と同様に、化学シフトの一致とBMRBデータベースとの比較、芳香環属プロトン間のCOSY,TOCSY,NOESYシグナルの存在を調べた結果からクラスタ形成を行い、芳香環を一つのクラスタ・タグにまとめ、一括して帰属を行う。
<構造計算段階の帰属>
構造計算の段階では、帰属の完了した帰属テーブルを用いて、NOEシグナルの帰属を行う。NOEシグナルの帰属は各実験にリンクされており、帰属の修正を行う場合でも、修正に関連した全てのシグナルが同時に修正される。このため、構造計算と帰属過程とを同時に行うことができる。
以上、特定のシグナルとスペクトルをリンクすることにより、帰属過程を行うことが可能となり、初心者でも熟練者同様の確度でスペクトル解析を進めることができる。
【0022】
<操作のログ>
一連の帰属の過程で、HSQCスペクトル上で定義された特定のピーク番号(インデックス)を持つシグナル(HN,N)は、他の3次元スペクトル上のシグナルとのリンクにより有機的に関連づけられている。また、特定のインデックスを持つシグナルは、アミノ酸配列ともリンクされる。これらのリンクを作成することにより帰属が行われている。この帰属の操作過程は、一連の操作コマンド列として、ログ・ファイルに書き込まれる。帰属を修正した場合でも、修正を含めて帰属過程の全てのログを残すことにより、帰属過程を再現することができる。これを図2,図11,図12を用いて説明する。
図2のフローチャートにおいて、上述したように、アミノ酸配列のファイルを読み込むことで、この帰属の処理を開始している(S102)。このときに、ログ・ファイルも自動的に作成されている(S104)。このログ・ファイルには、帰属のための操作を行うごとに、その操作により発行されるコマンドを格納している。
操作のときに発行されるコマンドの例を、図11に示す。例えば、アミノ酸配列ファイルの読み込み操作には、図11に示した「1・・・ReadAminoAcidSequenceFile」(S102参照)を発行することで行っている。図2のフローチャートには、そのステップの操作により発行されるコマンドを例示している。
【0023】
ログ・ファイルの内容の最初の部分を図12に示す。図12において、実行されないRemark(これは起動時の設定に自動的に書き込まれる)の次に、アミノ酸配列ファイルの読み込み(S102)と、一連のスペクトル・ファイルの読み込み(S104),実験の定義(S108)に対応するコマンドが読みとれる。また、その次には、ボンド・コネクティビティの確定(S118)のためのコマンドが続いている。
この帰属のためのコマンドで構成されたログ・ファイルは、本支援システムにより、再実行できる。これにより、他の人が行った帰属処理を、ログ・ファイルを再実行することで、再現することができる。
本支援システムを用いることにより、膨大なスペクトル群と帰属過程を有機的に結合することにより、帰属過程の共有化を行うことが可能となる。また、ログファイルを用いることにより、他の研究者の行った帰属の過程を再現できる。
【0024】
<帰属の自動化>
このシステムを用いることにより、原子型帰属の自動化を行うこともできる。この帰属の自動化により、初心者でも熟練した研究者同様に正確な帰属を進めることが可能となり、作業効率を大幅に向上することができる。
本支援システムでは、典型的な帰属を行うと、それらを学習して自動帰属を行う。学習を行うインデックスはプロファイル・インデックスと呼ばれ、自動帰属の見本となる。このため、このインデックスとしては、S/Nが良好で、一連の実験で見えるべきシグナルが揃っているインデックスを利用すべきである。このプロファイル・インデックスの帰属から、帰属,帰属シグナルの総数,シグナルの符号,シグナル間の強度比の情報から、帰属規則が分かる。
図13は、図6と同じ画面で、プロファイル・インデックスの帰属を決めて、自動帰属(Auto Assign)を行うところを示す図である。プロファイル・インデックスの帰属を決めてから、図5,図6でも表示されているウインドウ370内の「Auto Assign」ボタン374をクリックすると、図13に示した、自動帰属のためのウインドウ810,820,830が開く。ウインドウ810,820で、自動帰属のための各種パラメータを設定後、ウインドウ830の「Start」ボタン832をクリックすることで、自動帰属処理が開始する。
【0025】
自動帰属処理が開始されると、まず、どのシグナルにどの原子型が帰属するかを決定するパターンを作成する。このパターンは、どのシグナルにどの原子型帰属を当てはめるかの情報の集まりである。本支援システムでは、シグナルの総数によって、原子型帰属の種になるパターンの最大数を変化させる。学習通りにシグナルが揃っている場合には、数十程度のパターンを生成することで、十分な精度が得られる。一つのパターンを生成する作業は以下のように行う。まずストリップ上のピークの数が不足している場合に備えて、ピークピックを行う。ピークが巨大なシグナルのリッジピークであるかどうか調べ、そうであるならピークを参照する優先順位を下げる処置を行う。次にストリップ上のシグナルを正負に区別して大きさ順に並べ変え、ストリップ上のシグナルの総数に比例した偏差を与えたガウス分布に従う確率で、大きい方のシグナルをパターンに加える。ここで同じピークに異なる原子型帰属をしたり、また異なる実験の間で等しいはずの化学シフトが有意に異なったパターンは捨てる。同じパターンを避けて、それぞれに異なるパターンを次々生成し、設定した最大パターン数が集まるまで、あるいはパターン生成の試行数が最大パターンの二乗に達するまで続ける。
【0026】
生成した帰属パターンには、原子型帰属の規則の十分条件に違反するものも含まれる。例えば、当然加わるべきシグナルがパターンに含まれなかったことで、偶然に帰属規則の必要条件を満たしているように見せかけている偽のパターンが存在する。そこで原子型帰属パターンに対して以下の最適化を行う。
シグナルの補完、同一実験内で異なる原子型を与えるシグナルがその実験の分解能以上に近づいた場合にマイナーピークの排除、基準化学シフトからのずれが異常なピークの排除、同じ原子型帰属の化学シフトが実験の間で異なるものを排除、シグナルの欠落箇所でスペクトルの振幅の符号が違反したピークの排除。
(このとき、候補パターンを判定するのに必要なスペクトル上の強度は、一括してバッファにとっておき、随時参照するとよい。)
こうして、最適化された原子型帰属パターンの総数を単純に増やすことにより、帰属規則の必要十分条件を満たす範囲で原子型帰属の可能な組み合わせを調べ尽くすことができる。
【0027】
最後の評価ステージでは、評価関数を用いて原子型帰属パターンの優劣を判断する。このとき使用する評価関数は、それぞれ帰属段階の性質に合うように調整されている必要がある。評価項目として重要なのは、典型的なアミノ酸の化学シフト統計であるBMRBデータベースを利用する項目である。BMRB化学シフト統計は多くのソフトウェア(CSI,SHIFTY,TALOS,TATAPRO等)によってこれまで構造予測や自動帰属などに頻繁に利用されてきた実績がある。
パターンの評価関数は他に、全シグナルの大きさの和、基準化学シフトからのずれ、異なる実験の間の化学シフトの同一性、シグナル強度比と学習プロファイルとの一致、最大帰属可能候補をどれだけ埋められたのか、原子型帰属とシグナルの大きさの順番に逸脱があるか等の複数の項目を考慮したものになる。最終的に全評価関数は、独立の事象に対する評価のように、各評価項目が乗算で寄与する複合関数となる。各評価項目の判定値にかかる指数因子によって、ユーザーが全評価関数を調整することができる。ある一定の閾値を越え、全評価関数値の最も優れた原子型帰属パターンを選択することにより、原子型帰属の自動化処理は完了する。処理結果は、ユーザーによる確認、修正を経た後で次のクラスタの帰属に進むことになる。
【0028】
帰属が一通り済んだら、3次元実験のピーク情報を2次元実験へ情報をフィードバックする。これは、2次元実験の重なり合ったピークやブロードな交換ピークを「Feedback」ボタン478(図6参照)で自動検出して、再び帰属をくり返すことで行う。これらの手順をまとめて自動的に行う便利なボタンを設けている。これが、「Main Chain Assignment」230内の「Auto Assign<−> Feedback Repeat」ボタンであり、これを利用すれば主鎖帰属が一発で完了する可能性がある。本支援システムでは、帰属とフィードバックとを3回繰り返している。
【0029】
<確率の計算>
(アミノ酸型分配確率)
まず、単純なアミノ酸型分配確率計算を示す。
化学シフトの中心値(x=HN,N,C,Ca,Cb,...)が分かっていれば、あるアミノ酸aに帰属する確率分布を以下のように計算できる。
【数1】

Figure 0003607948
ここで、xは化学シフトの中心値、x(a),σ(a)はBMRB化学シフトの統計平均および標準偏差である。xmin(a)、xmax(a)はその最小値および最大値である。
なお、第2式は統計上起こりえない事象を完全に除くためにある。
絶対的な帰属確率の値は必ずしも必要ではない。むしろ、確率分布量の最も大きなアミノ酸の型が何であるか知るだけでよい。
簡単のため、化学シフト値の広がり(dHN,dN,dC’,dCα,dCβ,・・・)を全て1とすると、ある化学シフトの中心値xを与えたときにそのアミノ酸の型がaである分配確率は、次のように計算できる。
【数2】
Figure 0003607948
【0030】
(クラスタの帰属予測)
クラスタの帰属予測では、上述の化学シフト中心値と化学シフト統計との間の対応を調べる他に、クラスタの両末端で既存の帰属の化学シフトが一致するかどうか考慮しなければならない。このため、主鎖帰属のクラスタの分配確率は、BMRB化学シフト統計情報に依存した前述のp(a)項とクラスタ両末端(termini)の化学シフトの同一性(前後のC,Ca,Cbの化学シフトに関わる)に関わる項から計算される。
クラスタが一次配列cのi番目に帰属される分配確率は、
【数3】
Figure 0003607948
ただし、分母が0の場合は、最大許容誤差を代入する。
【数4】
Figure 0003607948
ここで、σは化学シフトの標準偏差である。H,13C,15Nには、それぞれ0.01,0.04,0.1ppmを与える。このとき、標準誤差、最大許容誤差程度の値を与える、n個のクラスタからなるクラスタの先頭が、一次配列cのi番目に帰属される分配確率は、
【数5】
Figure 0003607948
である。
【0031】
(分配確率計算に基づくクラスタ形成)
この分配確率を利用すると、タンパク質の一次配列とBMRB化学シフト統計データと矛盾のないクラスタ形成が可能である。化学シフトの同一性だけを考慮したクラスタ形成には問題がある。不用意に長いクラスタが、実は別々の帰属に当てはまるべき、全く別の2つのクラスタでなければならないかもしれない。
そこで、分配確率の基本的な性質を理解する必要がある。
「クラスタ・サイズnが十分大きい場合」、ある特定のサイトに対する帰属(正しい帰属と考えられる)への分配量が集まりやすい。クラスタ・サイズが1つ大きくなると、望ましい第一候補以外の対立候補であるアミノ酸の型が一致しなくなって分配量が減少する。すると、ますます第一候補への比重が増加する。その結果、分配確率の最大値は上昇する。よって、クラスタの形成が正しく行われているときには、分配確率の最大値はnが大きくなるに従い、分配確率の最大値は1.0に斬近しながら増え続ける。
問題は、アミノ酸の型が合っていないときにもクラスタが一定以上大きいと、やはり分配確率の最大値が増加する可能性があることである。偶然に化学シフトが一致して付加したクラスタは、正しい帰属サイト付近の絶対的な確率分配量は減少する。しかしながら、対立候補でも型が合わないことが起きているため、分配確率の最大値はこうしたエラーに鈍感でありうる。これは、できあがったクラスタを一つ一つ刈り込んで、同時に分配確率の最大値の変化率を監視することで問題は解決する。
【0032】
偶然、化学シフトが同一になった結果、誤ったクラスタが構成されている場合、最大分配確率の増加率はnの増加に従って、一時有意に減少する点が存在するのである。そのような点を見いだしたときには、クラスタを分割しなくてはならない。また一方、「nが3以下のような小さな場合」、nを増やしていった場合に、最初のうち最大の分配確率を示す帰属サイトが正しいとは限らない。従って、ある程度、変化率の減少は起きていてもおかしくはない。結局、経験上、以下の判別式を用いることで目的が達成できる。
【数6】
Figure 0003607948
この第一の判別式は、nが小さい場合には、分配確率の最大値の変化率で減少する場合を許している。またnが大きいときには、その変化率が1.0に十分近づいて、分配確率の最大値は1.0が漸近的に近づくことを要求している。結局、この判別式は定性的に正しい振る舞いをしていることが理解できる。
また、第二の判別式はその長さのクラスタが最低限有意であることを保証する。ここで、Nは一次配列cの長さである。つまり、クラスタ・サイズが配列に対して応分の長さがあるなら、その長さを占めるだけの責任に対して、n/Nは分配確率で負担しなければならないことを意味する。
実際のクラスタ作成は、まず、ブランチのないように化学シフトの同一性だけでクラスタ作成した後、それぞれのクラスタについて順次刈り込んでいく。そして、長さが1になるまで、上記の判別式を満たしているかどうかを確かめることを行えばよい。
【0033】
この支援システムを用いて、いくつかのタンパク質の帰属を進めた。従来の方法はスペクトルから帰属への流れで仕事は進み、流れを遡って帰属をチェックすることは困難である。本支援システムにより、遡って帰属のチェックを行うことが可能となり、帰属効率を大幅に向上することができた。また、構造計算の過程で明らかになった帰属の誤りをスペクトルに戻って見直すことができた。データベースを使用し、帰属の確度を統計的に処理するとともに、評価関数を設定することにより、確度の高い帰属を行うことができた。
ポストゲノム時代に入り、網羅的なタンパク質の構造解析が必要になっている。我が国も、3,000個のタンパク質の立体構造をNMRで決定することを国際的に約束している。また、製薬会社も、創薬のターゲットとしてタンパク質の立体構造決定が急務となっている。NMRによるハイスループットなタンパク質の立体構造決定は広く望まれている。本支援システムはこのような要請を満たすものであり、NMRを用いたハイスループットな構造解析を可能とする。
【0034】
【発明の効果】
上述するように、本発明の支援システムにより、従来では主鎖帰属に1ヵ月程度、構造決定までは半年以上を要したが、主鎖帰属は1−3日へ、構造決定も2ヵ月程度に短縮することができる。
本プログラムを使用することにより、初心者でも、熟練者同様に確度の高い帰属と精度の高い構造解析を行うことが可能となった。
【図面の簡単な説明】
【図1】NMRシグナルの帰属法について説明する図である。
【図2】本支援システムを用いて行う帰属操作を説明するフローチャートである。
【図3】本支援システムを起動すると現れる画面を示す図である。
【図4】2次元のスペクトルを表示した画面を示す図である。
【図5】2次元のピークと対応する3次元のスペクトルを表示するための操作を説明する図である。
【図6】3次元のスペクトルを表示した画面を示す図である。
【図7】クラスタ・タグ作成を示す図である。
【図8】クラスタ・タグの帰属を行う画面を示す図である。
【図9】フラグメントの帰属を行う画面を示す図である。
【図10】帰属の評価の画面を示す図である。
【図11】ログ・ファイルに記録される操作に対応したコマンドのリストである。
【図12】ログ・ファイルに記録された操作履歴の例を示す図である。
【図13】自動帰属を行う画面を示す図である。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to analysis of a protein's three-dimensional structure by NMR, and more particularly, to a support system for assignment of NMR signals necessary for three-dimensional structure analysis.
[0002]
[Technical background]
Nuclear magnetic resonance (NMR) is the only spectroscopic method that can determine the static and dynamic conformations of proteins in solution at the atomic level. Now, it is possible to explain various life phenomena from the viewpoint of molecular recognition based on the three-dimensional structure of proteins determined by NMR, and NMR has become one of the important pillars supporting structural biology.
[0003]
The procedure for the three-dimensional structure analysis of a protein using NMR is as follows.
(1) NMR measurement
For NMR measurement, an aqueous solution of about 1 mM (90% H 2 O, 10% D 2 Use 400 μl of O). Depending on the measurement target, irregular aggregates may be formed, and the sample solution may become cloudy. Such a state causes a great obstacle to the later NMR measurement and analysis. Therefore, the optimum measurement conditions are found by changing the pH and ionic strength of the measurement sample.
(2) Assignment of NMR signal
It is called assignment of NMR signals to clarify which nuclei in the protein the detected NMR signals are derived from. This step is crucial in determining protein conformation and should be done with caution. With regard to the signal attribution method, an organization strategy has been established that uses 3D and 4D NMR spectra, including several 2D NMR.
(3) Collection of structural information
The NMR spectrum contains a lot of information useful for protein structure determination, such as nuclear overhauser effect (NOE) and spin coupling. By displaying the NMR spectrum in a multidimensional manner, for example, a NOE cross peak reflecting distance information between proton nuclei can be seen from a bird's-eye view, and the distance between protons of a protein in a solution can be estimated based on signal attribution.
(4) 3D structure calculation
Given the coordinates of a point that exists in a three-dimensional space, it is easy to calculate the distance between two points from that coordinate. So, is it possible to find the 3D coordinates of each point from the opposite, ie, the distance between the two points? The answer is 'Yes', and the calculation to find the coordinates of each point from the distance between the points that make up a solid is called distance geometry calculation. Therefore, the calculation of the three-dimensional structure of a protein by NMR is to calculate a standing structure by a distance geometry method based on distance information obtained from NOE using a workstation. Unlike X-ray crystal structure analysis, the three-dimensional structure of a protein by NMR is determined by accumulation of information at a short distance (within 5 mm). In actual calculation, structural information as much as possible, such as information on the dihedral angle that is the rotation angle around the covalent bond, is used.
[0004]
The NMR method is an important analytical technique for structural biology because it can reveal the three-dimensional structure of proteins in aqueous solution. In this analysis method, as described above, it is necessary to perform signal assignment accurately. In signal attribution, it is necessary to analyze the combination of main chain signal attribution, side chain signal attribution, NOE attribution for obtaining distance information, and more than 10-20 spectra to extract necessary information. is there. An example is shown in FIG.
FIG. 1A shows an amide proton-aromatic ring region of a one-dimensional spectrum of a dimeric protein consisting of 66 residues. Dozens of amide proton signals overlap, making analysis almost impossible. When the same region is observed with 1H-15N two-dimensional HSQC (see FIG. 1 (b)), it can be seen that the amide proton signal is developed on the chemical shift axis of the amide nitrogen and the degeneracy of the signal is reduced. Furthermore, as shown in FIG. 1 (c), in the three-dimensional HNCO spectrum, complete signal separation is achieved by introducing a carbonyl carbon (CO) axis in addition to the amide proton (H) axis and amide nitrogen (N) axis. The
This attribution process is complex and often depends on the researcher's experience and intuition, such as spectrum combinations. In the conventional method, it is difficult for other researchers to look back and change the process of attribution or to reproduce the process leading to attribution.
[0005]
[Problems to be solved by the invention]
An object of the present invention is to provide a support system for performing accurate assignment of NMR signals.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, the present invention uses at least an amino acid sequence, a two-dimensional spectrum, and a plurality of three-dimensional spectra. Do An NMR signal attribution support system, comprising: An amino acid sequence recording means for recording the amino acid sequence and a spectrum recording means for recording the spectrum of the protein, and an amino acid sequence reading instruction input means for instructing reading of the amino acid sequence from the amino acid sequence recording means, Spectrum reading instruction input means for instructing reading of the two-dimensional and three-dimensional spectra from the spectrum recording means; A two-dimensional spectrum display means for displaying the two-dimensional spectrum; Spectrum The peak displayed on the display means By being specified, Three-dimensional spectrum display means for displaying the corresponding plurality of three-dimensional spectra; Bond connectivity instruction input means for inputting a bond connectivity instruction that relates the bond connectivity to which the peak belongs using the displayed two-dimensional spectrum or the three-dimensional spectrum; , Indicate the atomic type of the bond connectivity Atomic type instruction input means; A unique sequence of the bond connectivity Together with the cluster And Amino acid sequence Candidate And the created cluster, Calculate the probability of relevance between the two. Display in correspondence Cluster display means for displaying, the displayed candidate amino acid sequence, and the cluster Associate the two Enter cluster attribution instructions Cluster attribution Instruction input Means, A fragment display means for detecting a peak not included in the cluster as a fragment and displaying it corresponding to the amino acid sequence candidate, and an indication of fragment attribution that associates both the displayed amino acid sequence candidate and the fragment. A fragment attribution instruction input means for inputting and a log means for recording the attribution process in the command recording means by using the inputted instruction as a command, supporting the attribution and recording the attribution process. It is characterized by.
[0007]
Further, the command recording means By executing the recorded command again, the attribution process can be reproduced. With command execution means Also good.
The atomic type indication input Means Using a preset pattern Automatic attribution processing means for automatically assigning atomic types may be included, and atomic types may be automatically associated.
The cluster display means includes Said amino acid sequence Candidate And the created cluster Of relevance Probability, From terms related to chemical shift and terms related to the identity of chemical shifts at both ends of the cluster Calculate and display May be. At this time, Said amino acid sequence Candidate And attribution of the created cluster Instructions Is performed, the probability is recalculated and displayed, and the determination can be made easier every time the attribution is determined.
In addition, the above-mentioned NMR signal attribution support system Function of Into a computer system Realization The program to be executed and the recording medium storing the program are also the present invention.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an NMR signal attribution support system according to an embodiment of the present invention will be described with reference to the drawings.
In the NMR signal attribution support system, in order to perform the attribution operation,
(1) The attribution process can be confirmed on the spectrum by linking the attribution process and a series of spectra necessary for attribution.
(2) When it is necessary to change the attribution, it is necessary to be able to change it in conjunction with the spectrum. Also,
(3) To confirm the accuracy of attribution, refer to the database and work while confirming the attribution with the highest accuracy.
It is also important.
[0009]
The flow of processing in the NMR signal attribution support system of the embodiment implemented in a computer system such as a personal computer will be described in detail based on the flowchart of FIG.
<Attribution operation>
When the support system is activated, a window 200 as shown in FIG. 3 is displayed. In this support system, prediction and diagnosis are performed using the chemical shift database BioMagResBank (The BMRB Database). For this reason, there is a button 282 to go to this database.
Here, after the “OK” button 281 in the screen 280 is pressed, a menu displayed by clicking the “file” 210 at the top of the window 200 is selected, and the file used in the support system is read.
First, a sample amino acid sequence file is read (S102). In the case of multi-chain, input the number of chains and read the amino acid sequence file continuously. As the amino acid sequence file, a text file of an amino acid primary sequence expressed in one letter is used.
At this time, a log file is also automatically created based on the name (sample name) of the read amino acid sequence file (S104). This log file records operations related to all attributions in the support system. This log file can be used to restore the previous attribution state. This log file will be described later.
[0010]
Next, a Fourier transform file and a peak pick file are read as a spectrum file (S106). It is necessary to simultaneously specify and read the peak pick file corresponding to the Fourier transform file. If the spectrum file is divided into a plurality of three or more dimensions, it is only necessary to specify one of them. Since reading only the spectrum obtained by Fourier transform is not permitted, it is necessary to create a peak table file in advance. In this system, as a spectrum file, a file subjected to Fourier transform processing with NMRPipe and a peak table file created with NMRDraw are used. An experiment name is defined for each spectrum file read (S108). This specifies the display name, axis name, etc. of the read spectrum file.
In addition, as an initial setting, HN-HSQC, HNCO, HNCA, HN (CO) CA, HNCACB, CBCA (CO) NH, etc., which are experiments for main chain linkage assignment, are registered in the menu, and spectra for these・ Easy file reading and experiment name definition.
[0011]
When all files necessary for NMR spectrum attribution are read (YES in S110), the attribution operation is started. To assign the main chain, first pick the signal of the HSQC spectrum. For this purpose, in FIG. 3, “contour-2D” 220 is clicked, the experiment name is designated, and the read two-dimensional file of HN-HSQC is displayed (S112). This is shown in FIG.
As shown in FIG. 4, in the present support system, the two-dimensional spectrum 300 of HN-HSQC is a spectrum with contour lines whose appropriate threshold values are always adjusted using S / N analysis, bicubic interpolation, and hyperbolic interpolation. Is displayed. Each peak position is indicated by a cross. In the two-dimensional spectrum 300, an experiment name 310 and axis names 320 and 330 are also displayed. Each peak is given a peak number (index) in the read peak pick file.
The displayed two-dimensional spectrum is divided into nine parts, and each divided part can be enlarged and displayed by selecting in the window 340. In addition, a range can be designated and the designated range can be enlarged and displayed. FIG. 4 is an enlarged two-dimensional spectrum.
[0012]
For peaks that overlap or shoulder, a three-dimensional spectrum such as HN (CO) CA is projected to determine the peak position. This operation will be described later. At this time, an index is assigned. In this way, all peaks observed on the HSQC spectrum are indexed (see, for example, 360 in FIG. 4). The subsequent attribution process is performed based on this peak number (index).
A peak of up to 24 characters can be left in the peak information. This is created by writing to a text box 354 in window 350. A maximum of 10 notes can be left in one peak. They are dated and usually the latest notes are forced to be displayed on the spectrum.
The assignment label given to the peak is displayed in the form of “one amino acid code + residue number” by confirming the connection with the three-dimensional experiment and further confirming the assignment. Nothing is displayed until the link is confirmed. The following rules apply to label display colors.
Gray: No connection with other 3D experiments
Yellow: Linked with 3D experiment, attribution not yet determined
Pink: Attribution confirmed
[0013]
<Main chain assignment>
Now, the work procedure of main chain linkage assignment is
(A) Establishing Bond Connectivity
(B) Establishment of cluster connectivity (Cluster Connectivity) and cluster tag (Cluster-Tag)
(C) Cluster tag assignment
(D) Fragment assignment
(E) Evaluation of attribution
It is divided into five stages.
Here, the bond connectivity is information that cuts out a region of a three-dimensional experiment with a chemical shift value of a peak table of a reference two-dimensional experiment and associates the three-dimensional peak on the surface with the two-dimensional peak. Cluster connectivity is information in which chemical shifts before and after the two bond connectivity are uniquely matched. The cluster tag is information that is managed by sequentially assigning a tag number to a collection of a plurality of uniquely connected cluster connectivity. A cluster tag is represented as a sequence of indexes. Fragment refers to all bond connectivity that was not included in the cluster tag.
[0014]
(A) Establishment of bond connectivity (atomic type attribution)
The first thing to do with main chain assignment is to cut out the plane of the 3D experiment sliced along the axis of the chemical shift of the 2D experiment and determine the atomic type bond connectivity (atomic type assignment). . To do this, it is necessary to display a three-dimensional spectrum.
Therefore, in FIG. 4, a menu is selected from “Main Chain Assignment” 230, a window 370 shown in FIG. 5 is opened, and an index is entered in the index input field 372 to designate a peak (S114). . Thereby, as shown in FIG. 6, the three-dimensional spectrum screen 400 corresponding to the designated index is displayed (S116).
On the screen 400, HNCO410, HNCA420, HN (CO) CA430, CBCANH440, and CBCA (CO) NH450, which are strip charts corresponding to the signal of the specified index, are automatically cut out from each spectrum file and displayed. Has been. The displayed strips can be displayed by slightly shifting the cut-out surface with respect to each axis from the chemical shift of the designated index by the buttons 376 in the window 370 of FIG. These buttons 376 are used to distinguish the corresponding signals in the three-dimensional experiment when a plurality of signals are approaching in the two-dimensional experiment. The cut-out surface can be shifted for each strip or all strips can be simultaneously performed.
[0015]
As shown in FIG. 6, in the displayed three-dimensional HNCA spectrum, α carbon CA (i) of the same residue as the chemical shift (HN, N) of amide proton and amide nitrogen and α carbon CA of the previous residue. The correlation with (i-1) is displayed. Similarly, for HN (CO) CA, (HN, N) and CA (i-1), and for CBCANH, (HN, N) and CA (i-1), CB (i-1), CA (i), CB Correlation between (i) and CACB (CO) NH displays the correlation between (HN, N) and CA (i-1) and CB (i-1).
Here, the overlapped signals in the reference experiment are completely distinguished from each other by checking the increase or decrease of the signal in the adjacent slice if necessary, based on the difference between the strength and the positive / negative of the signal. Then, by clicking on the three-dimensional peak associated with the index, a window 470 is displayed, and a “Create Bond Connectivity” button 472 is clicked to confirm the bond connectivity. After this determination, the type of the carbon atom is changed from the menu 480 by clicking the “Assign Atom Type” button 476 and selecting from the menu 480, CO (−) / CO / CO (HB), CA (−) / CA, CB ( Classification is made as in (-) / CB (S118). Once the relationship has been established, it can be canceled by clicking the “Destroy Bond Connectivity” button 474 only on the strip surface of the same index. Note that CO (HB) is a carbonyl carbon of a hydrogen bond donor.
Not all correlation peaks are observed on each strip, but peaks may not be observed due to overlap or poor S / N. Therefore, a possible pattern is generated for each spectrum, and a consistent attribution is obtained for all sets of strip charts.
[0016]
If there is an overlap between the indexes, a new peak is added, for example, so that the relevance with the two-dimensional experiment is kept one to one. To do this, click the “ReturnFeedbacktoRef-2D” button 478. Thereby, a new peak is formed and an index is given to the peak. Note that “Feedbackfrom3D” is displayed on the assigned peak. Also, if the peak shape is distorted even a little on the two-dimensional spectrum, it is necessary to determine whether there is an index overlap and to settle all ambiguities.
In this way, the correspondence between the peak on the two-dimensional HSQC spectrum and the peak on each three-dimensional spectrum, and the assignment of each peak (CA (i-1), CB (i-1), CA (I), CB (i)) is completed (YES in S120).
[0017]
(B) Cluster tag creation
The cluster connectivity and the cluster tag are created by clicking a “Make Cluster Connections” button that appears when the menu “Main Chain Assignment” 230 (see FIG. 6) is clicked (S122). In this process, a cluster tag is created by sequentially assigning a tag number to a collection of a plurality of uniquely connected cluster connectivity. The completed cluster tag can be confirmed by displaying a window 490 (see FIG. 7) in the “View Cluster Connectivity” menu. Here, # 1 is displayed as “Cluster-Tag Index” 492. The cluster index can be increased / decreased by the “+” / “−” button 494, and the contents of the cluster tag of that number can be displayed by the “Show Cluster-Tags” button 496. The contents of the cluster tag are displayed in “Cluster-Tag's Sequence” 498 as a series of indexes.
[0018]
(C) Cluster tag attribution
In cluster tag assignment, amino acid prediction is performed using a primary amino acid sequence and a chemical shift library, and the cluster tag is associated with the amino acid sequence. This process is performed by clicking the “Assign Cluster-Tag Sequences” button that appears when the menu “Main Chain Assignment” 230 (see FIG. 7) is clicked, and a screen 500 shown in FIG. 8 is displayed.
In FIG. 8, the screen 500 is divided into two upper and lower levels, and the primary sequences 512 and 514 of the read amino acids are displayed at the top of each level. The cluster tag sequence corresponding to this is clearly indicated by a yellow-green bar on the line of the cluster tag number 540 displayed on the right side as a candidate that can be assigned. The numbers next to the bars are the amino acid sequence numbers and the predicted probabilities displayed in parentheses. The calculation of the displayed probability will be described later. When this bar is clicked, the contents of the cluster tag corresponding to the bar are displayed in the window 550.
In the cluster tag assignment process, it is assigned to the amino acid sequence in order from the cluster tag that seems to be sure by the prediction. The attribution operation is performed by clicking the “Assign Cluster-Tag” button 552 in the window 550 (S124). Since the sequence once assigned by the tag is excluded from the target of the next amino acid type prediction, the probability of the assignable candidate is recalculated. This attribution operation / recalculation is repeated. Therefore, at first, the candidates for the tags for which the assignable sequence could not be specified are narrowed down every time other tags are assigned. By repeating this attribution, the attribution of 70% or more is completed within a few minutes.
[0019]
(D) Fragment attribution
As the cluster tag attribution analysis progresses to some extent, areas that cannot be attributed inevitably arise. This cause is explained by the resulting fragments, where the cluster connectivity is not unique or the chemical shift of Cb is not determined. These assignments must be filled in by relying on the information on the coincidence and mismatch of amino acid type predictions and chemical shifts at the ends of cluster tags.
In order to do this, it is performed by “Assign Fragment Index” that appears when the menu “Main Chain Assignment” 230 (see FIG. 8) is clicked, and a screen 600 shown in FIG. 9 is displayed. The screen 600 of FIG. 9 has the same configuration as the screen 500 shown in FIG. 8 and is divided into two upper and lower levels, and the primary sequences 612 and 614 of the read amino acids are displayed at the top of each level. Fragments are detected, and corresponding to the amino acid sequences 612 and 614, are shown as yellow-green triangles as assignable candidates on the line of fragment number 640 displayed on the right side. The numbers in parentheses next to the triangles are prediction probabilities. When this triangle is clicked, fragment information corresponding to the triangle is displayed in the window 650.
Fragment attribution is determined with reference to the information displayed in this window 650. To assign a fragment, the “Assign Fragment” button 652 in the window 650 is clicked (S126).
[0020]
(E) Evaluation of attribution
Evaluation of the determined attribution is performed by “Assess Main Chain Assignments” that appears when the menu “Main Chain Assignment” 230 (see FIG. 9) is clicked, and a screen 700 shown in FIG. 10 is displayed (S128). In the screen 700 in FIG. 10, the amino acid sequences 712 and 714 are displayed in two upper and lower stages. Corresponding to this amino acid sequence, mismatches in chemical shifts between clusters with respect to the display on the right side, deviations from amino acid type predictions, and the like are displayed in color and bar height. The order of green <yellow <red, or the higher the bar height, the lower the reliability of the attribution. By re-evaluating their attribution and always searching for the cause, fragment attribution is resolved. The result of the attribution is stored as text by a “List Main Chain Assignments” button that appears when the menu “Main Chain Assignment” 230 (see FIG. 10) is clicked. In addition, when an amino acid character is clicked, a window 540 appears, and the attribution can be removed.
In the above description, a three-dimensional spectrum is used, but a four-dimensional spectrum can also be used.
[0021]
<Side chain assignment>
With respect to the side chain, the assignment operation can be performed by using the menu 240 in the same procedure as the above-described two-dimensional experiment in the main chain and the process of assigning the cluster connectivity and assigning the atomic type.
The assignment of the aliphatic side chain via the amide proton-amide nitrogen (HN-N) uses NH-HSQC as a two-dimensional experiment and three-dimensional HBHA (CO) NH, C ( CO) NH, HC (CO) NH are used.
In addition, the assignment of aromatic side chains is based on two-dimensional experiments that use both HN-HSQC and CT-HSQC, and experiments that support the spin system necessary for cluster formation include two-dimensional COSY, TOCSY, and NOESY. used. As an experiment for determining the attribution, three-dimensional HCCH-COSY, HCCH-TOCSY, 15NitedNOESY, 13CeditedNOESY, or four-dimensional HCCH-COSY, HCCH-TOCSY, C-C NOESY, CN NOESY, or the like is used.
Next, for example, when assigning aromatic side chains, similar to main chain assignment, comparison of chemical shifts and comparison with the BMRB database, and the presence of COSY, TOCSY, NOESY signals between aromatic ring group protons were examined. Clusters are formed from the results, and the aromatic rings are combined into one cluster tag and assigned together.
<Attribution of structural calculation stage>
In the structure calculation stage, NOE signal attribution is performed using the attribution table in which attribution has been completed. NOE signal assignments are linked to each experiment, and all signals associated with the correction are corrected at the same time, even when the assignment correction is made. For this reason, the structure calculation and the attribution process can be performed simultaneously.
As described above, by linking a specific signal and a spectrum, it becomes possible to perform an attribution process, and even a beginner can proceed with spectrum analysis with the same accuracy as an expert.
[0022]
<Operation log>
In the course of a series of assignments, a signal (HN, N) having a specific peak number (index) defined on the HSQC spectrum is organically related by linking with signals on other three-dimensional spectra. . A signal having a specific index is also linked to an amino acid sequence. Attribution is made by creating these links. This attribution operation process is written in the log file as a series of operation command strings. Even when the attribution is corrected, the attribution process can be reproduced by leaving all the logs of the attribution process including the correction. This will be described with reference to FIGS.
In the flowchart of FIG. 2, as described above, this assignment process is started by reading an amino acid sequence file (S102). At this time, a log file is also automatically created (S104). In this log file, every time an operation for attribution is performed, a command issued by the operation is stored.
An example of a command issued at the time of operation is shown in FIG. For example, the amino acid sequence file is read by issuing “1... ReadAminoAcidSequenceFile” (see S102) shown in FIG. The flowchart in FIG. 2 illustrates a command issued by the operation of that step.
[0023]
The first part of the contents of the log file is shown in FIG. In FIG. 12, Remark which is not executed (this is automatically written in the setting at the time of starting), then reading of the amino acid sequence file (S102), reading of a series of spectrum files (S104), and the definition of the experiment ( The command corresponding to S108) can be read. Next, a command for determining bond connectivity (S118) is followed.
A log file composed of commands for this attribution can be re-executed by the support system. As a result, the attribution process performed by another person can be reproduced by re-executing the log file.
By using this support system, it becomes possible to share the attribution process by organically coupling the enormous spectrum group and the attribution process. In addition, the log file can be used to reproduce the attribution process performed by other researchers.
[0024]
<Automation of attribution>
By using this system, it is possible to automate atomic type assignment. This automation of attribution makes it possible for beginners to proceed with accurate attribution as well as skilled researchers, and can greatly improve work efficiency.
In this support system, if typical attribution is performed, they are learned and automatic attribution is performed. The index for learning is called a profile index and serves as a model for automatic attribution. For this reason, as this index, an index having a good S / N and having signals that should be seen in a series of experiments should be used. From the attribution of this profile index, the attribution rule can be determined from the attribution, the total number of attribution signals, the sign of the signal, and the intensity ratio between signals.
FIG. 13 is a diagram showing that the attribution of the profile / index is determined and the automatic assignment (Auto Assign) is performed on the same screen as FIG. When the “Auto Assign” button 374 in the window 370 displayed in FIGS. 5 and 6 is clicked after the attribution of the profile index is determined, the windows 810, 820, 820, 820, 830 opens. After setting various parameters for automatic attribution in the windows 810 and 820, the automatic attribution processing is started by clicking the “Start” button 832 in the window 830.
[0025]
When the automatic attribution process is started, first, a pattern for determining which atom type belongs to which signal is created. This pattern is a collection of information on which atomic type assignment is applied to which signal. In this support system, the maximum number of patterns that become atomic type seeds is changed according to the total number of signals. When the signals are aligned as learned, sufficient accuracy can be obtained by generating several tens of patterns. The operation of generating one pattern is performed as follows. First, a peak pick is performed in case the number of peaks on the strip is insufficient. Check if the peak is a ridge peak of a huge signal, and if so, take action to lower the priority with reference to the peak. Next, the signals on the strip are distinguished from each other in order of magnitude, and the larger signal is added to the pattern with a probability of following a Gaussian distribution giving a deviation proportional to the total number of signals on the strip. Here, we assign different atomic type assignments to the same peak, and discard patterns with significantly different chemical shifts that should be equal between different experiments. Avoiding the same pattern, generate different patterns one after another and continue until the set maximum number of patterns is collected or until the number of pattern generation trials reaches the square of the maximum pattern.
[0026]
The generated attribution patterns include those that violate the sufficient conditions of the atomic type attribution rules. For example, there is a fake pattern that appears to meet the attribution rule requirements by chance because the signal to be added is not included in the pattern. Therefore, the following optimization is performed on the atomic type assignment pattern.
Complementation of signals, elimination of minor peaks when signals giving different atomic types within the same experiment approach the resolution of the experiment, elimination of peaks that are abnormal from the reference chemical shift, chemical shifts belonging to the same atomic type Eliminating what is different between experiments, eliminating peaks where the sign of the spectrum amplitude was violated at the point where the signal was missing.
(At this time, the intensity on the spectrum necessary to determine the candidate pattern is stored in the buffer in a lump and may be referred to as needed.)
In this way, by simply increasing the total number of optimized atomic type attribution patterns, possible combinations of atomic type attribution can be investigated within a range that satisfies the necessary and sufficient conditions of the attribution rule.
[0027]
In the final evaluation stage, the superiority or inferiority of the atomic type attribution pattern is determined using the evaluation function. The evaluation function used at this time needs to be adjusted so as to match the property of the attribution stage. What is important as an evaluation item is an item using the BMRB database, which is a typical chemical shift statistic of amino acids. The BMRB chemical shift statistics have been used frequently for structural prediction and automatic assignment so far by many softwares (CSI, SHIFTY, TALOS, TATAPRO, etc.).
Other evaluation functions for the pattern include the sum of the magnitudes of all signals, the deviation from the reference chemical shift, the identity of the chemical shift between different experiments, the match between the signal intensity ratio and the learning profile, and the maximum assignable candidate. It is considered that there are multiple items such as whether or not there is a deviation in the order of atomic type assignment and signal magnitude. Ultimately, all evaluation functions become composite functions in which each evaluation item contributes by multiplication, as in the case of evaluation for independent events. The user can adjust the entire evaluation function according to the exponential factor applied to the judgment value of each evaluation item. The atomic type attribution automation process is completed by selecting the best atomic type attribution pattern of all evaluation function values exceeding a certain threshold. The processing result proceeds to the attribution of the next cluster after confirmation and correction by the user.
[0028]
When the attribution is complete, the peak information of the three-dimensional experiment is fed back to the two-dimensional experiment. This is done by automatically detecting overlapping peaks and broad exchange peaks in the two-dimensional experiment with the “Feedback” button 478 (see FIG. 6) and repeating the attribution again. Convenient buttons that automatically perform these procedures are provided. This is the “Auto Assign <−> Feedback Repeat” button in the “Main Chain Assignment” 230, and if this is used, the main chain assignment may be completed in one shot. In this support system, attribution and feedback are repeated three times.
[0029]
<Calculation of probability>
(Amino acid type distribution probability)
First, simple amino acid type distribution probability calculation is shown.
Center value of chemical shift (x = HN, N, C 1 , Ca, Cb,. . . ), The probability distribution attributed to a certain amino acid a can be calculated as follows.
[Expression 1]
Figure 0003607948
Where x is the center value of chemical shift, x (a), σ x (A) is the statistical mean and standard deviation of the BMRB chemical shift. x min (A), x max (A) is the minimum value and the maximum value.
Note that the second equation is for completely eliminating events that cannot occur statistically.
Absolute attribution probability values are not necessarily required. Rather, it is only necessary to know what type of amino acid has the largest probability distribution.
For simplicity, assuming that the spread of chemical shift values (dHN, dN, dC ′, dCα, dCβ,...) Is all 1, the amino acid type is a when a center value x of a certain chemical shift is given. A certain distribution probability can be calculated as follows.
[Expression 2]
Figure 0003607948
[0030]
(Cluster attribution prediction)
In cluster membership prediction, in addition to examining the correspondence between the above-mentioned chemical shift center value and chemical shift statistics, it is necessary to consider whether the chemical shifts of the existing attribution match at both ends of the cluster. For this reason, the distribution probability of the cluster belonging to the main chain depends on the identity of the chemical shift between the above-mentioned p (a) term and both ends (termini) of the cluster depending on the BMRB chemical shift statistical information (C 1 , Ca, and Cb chemical shift).
The distribution probability that the cluster belongs to the i th of the primary array c is
[Equation 3]
Figure 0003607948
However, if the denominator is 0, the maximum allowable error is substituted.
[Expression 4]
Figure 0003607948
Where σ x Is the standard deviation of the chemical shift. 1 H, 13 C, 15 N is given in 0.01, 0.04, and 0.1 ppm, respectively. At this time, the distribution probability that the top of the cluster consisting of n clusters giving values of standard error and maximum allowable error is attributed to the i-th of the primary array c is
[Equation 5]
Figure 0003607948
It is.
[0031]
(Cluster formation based on distribution probability calculation)
Utilizing this distribution probability, cluster formation consistent with the primary protein sequence and the BMRB chemical shift statistical data is possible. There is a problem in cluster formation considering only the identity of chemical shift. An inadvertently long cluster may actually have to be two completely separate clusters that should apply to different attributions.
Therefore, it is necessary to understand the basic nature of the distribution probability.
When “the cluster size n is sufficiently large”, the distribution amount to the attribution (considered to be correct attribution) to a specific site is likely to be gathered. When the cluster size is increased by one, the type of amino acid that is an opponent candidate other than the desired first candidate becomes inconsistent and the amount of distribution decreases. As a result, the specific gravity of the first candidate increases. As a result, the maximum value of the distribution probability increases. Therefore, when the cluster is formed correctly, the maximum value of the distribution probability continues to increase while approaching 1.0 as n increases.
The problem is that even when the amino acid types do not match, if the cluster is larger than a certain value, the maximum value of the distribution probability may still increase. Clusters added by coincidence with chemical shifts coincidentally reduce the absolute probability distribution near the correct attribution site. However, the maximum value of the distribution probability can be insensitive to such errors, as even conflicting candidates are not matched in type. This solves the problem by pruning the completed clusters one by one and simultaneously monitoring the rate of change of the maximum value of the distribution probability.
[0032]
If an accidental cluster is formed as a result of accidental chemical shifts, there is a point where the rate of increase in the maximum distribution probability decreases significantly as n increases. When you find such a point, you must divide the cluster. On the other hand, when “n is as small as 3 or less”, when n is increased, the belonging site showing the maximum distribution probability among the first is not always correct. Therefore, it is not strange that the rate of change is reduced to some extent. After all, the purpose can be achieved by experience using the following discriminant.
[Formula 6]
Figure 0003607948
This first discriminant allows a case where n is small and decreases at the rate of change of the maximum value of the distribution probability. When n is large, the rate of change is sufficiently close to 1.0, and the maximum value of the distribution probability requires 1.0 to be asymptotically approached. After all, it can be understood that this discriminant behaves qualitatively correctly.
The second discriminant also ensures that the cluster of that length is at least significant. Where N c Is the length of the primary sequence c. In other words, if the cluster size has a reasonable length for the array, n / N for the responsibility to occupy that length c Means that it must be borne by the distribution probability.
In the actual cluster creation, first, clusters are created only with the same chemical shift so that there is no branch, and then each cluster is trimmed sequentially. Then, it is sufficient to check whether the above discriminant is satisfied until the length becomes 1.
[0033]
Using this support system, we assigned several proteins. In the conventional method, work proceeds in the flow from spectrum to attribution, and it is difficult to check the attribution retroactively. With this support system, it was possible to check the attribution retroactively, and the attribution efficiency could be greatly improved. In addition, we were able to return to the spectrum and review the attribution errors that were clarified during the structural calculation. Using the database, the accuracy of attribution was statistically processed, and by assigning an evaluation function, attribution with high accuracy could be performed.
In the post-genomic era, comprehensive protein structural analysis is required. Japan has also promised internationally that the three-dimensional structure of 3,000 proteins will be determined by NMR. Also, pharmaceutical companies are urgently required to determine the three-dimensional structure of proteins as a target for drug discovery. High-throughput protein structure determination by NMR is widely desired. This support system satisfies such a demand and enables high-throughput structural analysis using NMR.
[0034]
【The invention's effect】
As described above, with the support system of the present invention, it has conventionally been about one month for main chain attribution, and it took more than half a year to determine the structure. It can be shortened.
By using this program, even beginners can perform attribution with high accuracy and structural analysis with high accuracy, just like experienced people.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining an NMR signal assignment method.
FIG. 2 is a flowchart for explaining attribution operation performed using the support system.
FIG. 3 is a diagram showing a screen that appears when the support system is activated;
FIG. 4 is a diagram showing a screen displaying a two-dimensional spectrum.
FIG. 5 is a diagram illustrating an operation for displaying a three-dimensional spectrum corresponding to a two-dimensional peak.
FIG. 6 is a diagram showing a screen displaying a three-dimensional spectrum.
FIG. 7 is a diagram showing cluster tag creation.
FIG. 8 is a diagram showing a screen for assigning cluster tags;
FIG. 9 is a diagram showing a screen for assigning fragments.
FIG. 10 is a diagram showing a screen for attribution evaluation.
FIG. 11 is a list of commands corresponding to operations recorded in a log file.
FIG. 12 is a diagram illustrating an example of an operation history recorded in a log file.
FIG. 13 is a diagram showing a screen for performing automatic attribution.

Claims (7)

少なくとも、アミノ酸配列、2次元スペクトル、複数の3次元スペクトルを用いて行うNMRシグナル帰属支援システムであって、
前記アミノ酸配列を記録しているアミノ酸配列記録手段及びタンパク質のスペクトルを記録しているスペクトル記録手段とを有し、
前記アミノ酸配列記録手段から、アミノ酸配列の読み込みを指示するアミノ酸配列読み込み指示入力手段と、
前記スペクトル記録手段から前記2次元及び3次元スペクトルの読み込みを指示するスペクトル読み込み指示入力手段と、
前記2次元スペクトルを表示する2次元スペクトル表示手段と、
前記2次元スペクトル表示手段に表示されたピークが指定されることで、対応する前記複数の3次元スペクトルを表示する3次元スペクトル表示手段と、
表示された前記2次元スペクトル又は前記3次元スペクトルを用いて前記ピークが帰属するボンド・コネクティビティを関連づけるボンド・コネクティビティの指示を入力するボンド・コネクティビティ指示入力手段と
前記ボンド・コネクティビティの原子型を指示する原子型指示入力手段と、
前記ボンド・コネクティビティの一意に連続したものをまとめてクラスタとし、アミノ酸配列の候補と前記作成されたクラスタとを、両者の関連性の確率を計算し、計算された確率により対応させて表示するクラスタ表示手段と、
表示された前記アミノ酸配列の候補と、前記クラスタの両者を関連づけるクラスタ帰属指示を入力するクラスタ帰属指示入力手段と、
前記クラスタに含まれないピークをフラグメントとして検出し、前記アミノ酸配列の候補と対応させて表示するフラグメント表示手段と、
表示された前記アミノ酸配列の候補と前記フラグメントの両者を関連づけるフラグメントの帰属の指示を入力するフラグメント帰属指示入力手段と、
前記入力された指示をコマンドとして、コマンド記録手段に帰属過程を記録するログ手段とを備え、
帰属の支援を行うとともに帰属過程を記録することを特徴とするNMRシグナル帰属支援システム。
At least the amino acid sequence, two-dimensional spectrum, a NMR signal attributable support system for using a plurality of three-dimensional spectrum,
An amino acid sequence recording means for recording the amino acid sequence and a spectrum recording means for recording a protein spectrum;
Amino acid sequence reading instruction input means for instructing reading of an amino acid sequence from the amino acid sequence recording means,
Spectrum reading instruction input means for instructing reading of the two-dimensional and three-dimensional spectra from the spectrum recording means;
Two-dimensional spectrum display means for displaying the two-dimensional spectrum;
3D spectrum display means for displaying the plurality of corresponding 3D spectra by designating the peak displayed on the 2D spectrum display means;
Bond connectivity indication input means for inputting an indication of bond connectivity for associating the bond connectivity to which the peak belongs using the displayed two-dimensional spectrum or the three-dimensional spectrum ;
Atomic type instruction input means for indicating the atomic type of the bond connectivity ;
And clusters are collectively those uniquely continuously the bond connectivity, and a candidate with the created cluster amino acid sequence, to calculate the probability of both relevance, by corresponding display the calculated probability Cluster display means;
A cluster attribution instruction input means for inputting a cluster attribution instruction associating both of the displayed amino acid sequence candidates and the cluster ;
Fragment display means for detecting a peak that is not included in the cluster as a fragment and displaying it corresponding to the candidate amino acid sequence;
Fragment attribution instruction input means for inputting a fragment attribution instruction that associates both the displayed candidate amino acid sequence and the fragment;
Log means for recording the attribution process in the command recording means, using the input instruction as a command,
NMR signal attribution support system characterized by supporting attribution and recording the attribution process .
請求項に記載のNMRシグナル帰属支援システムにおいて、
さらに、前記コマンド記録手段に記録したコマンドを再度実行することにより、帰属過程を再現可能とするコマンド実行手段を備えることを特徴とするNMRシグナル帰属支援システム。
In the NMR signal attribution support system according to claim 1 ,
The NMR signal attribution support system , further comprising command execution means for reproducing the attribution process by executing the command recorded in the command recording means again.
請求項1又は2に記載のNMRシグナル帰属支援システムにおいて、
前記原子型指示入力手段は、予め設定したパターンを用いて自動的に原子型を帰属する自動帰属処理手段を含むことを特徴とするNMRシグナル帰属支援システム。
In the NMR signal attribution support system according to claim 1 or 2 ,
The NMR signal attribution support system, wherein the atomic type instruction input means includes automatic attribution processing means for automatically assigning atomic types using a preset pattern .
請求項1〜3のいずれかに記載のNMRシグナル帰属支援システムにおいて、前記クラスタ表示手段は、前記アミノ酸配列の候補と前記作成されたクラスタとの関連性の確率を、化学シフトに依存した項とクラスタ両末端の化学シフトの同一性に関わる項から計算して表示することを特徴とするNMRシグナル帰属支援システム。The NMR signal attribution support system according to any one of claims 1 to 3 , wherein the cluster display means has a probability of relevance between the amino acid sequence candidate and the created cluster depending on a chemical shift. An NMR signal attribution support system characterized by calculating and displaying from terms related to the identity of chemical shifts at both ends of a cluster . 請求項に記載のNMRシグナル帰属支援システムにおいて、前記クラスタ表示手段は、前記アミノ酸配列の候補と前記作成されたクラスタとの帰属指示が行われると、確率を計算し直して表示することを特徴とするNMRシグナル帰属支援システム。5. The NMR signal attribution support system according to claim 4 , wherein the cluster display means recalculates and displays the probability when the attribution instruction between the candidate amino acid sequence and the created cluster is performed. NMR signal attribution support system. 請求項1〜5のいずれかに記載のNMRシグナル帰属支援システムの機能をコンピュータ・システムに実現させるプログラム。The program which makes a computer system implement | achieve the function of the NMR signal attribution support system in any one of Claims 1-5 . 請求項1〜5のいずれかに記載のNMRシグナル帰属支援システムの機能をコンピュータ・システムに実現させるプログラムを記録した記録媒体。Recording medium for recording a program for realizing the functions of the NMR signal attributable support system according to the computer system in any one of claims 1 to 5.
JP2001333904A 2001-10-31 2001-10-31 NMR signal attribution support system Expired - Lifetime JP3607948B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001333904A JP3607948B2 (en) 2001-10-31 2001-10-31 NMR signal attribution support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001333904A JP3607948B2 (en) 2001-10-31 2001-10-31 NMR signal attribution support system

Publications (2)

Publication Number Publication Date
JP2003139832A JP2003139832A (en) 2003-05-14
JP3607948B2 true JP3607948B2 (en) 2005-01-05

Family

ID=19149111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001333904A Expired - Lifetime JP3607948B2 (en) 2001-10-31 2001-10-31 NMR signal attribution support system

Country Status (1)

Country Link
JP (1) JP3607948B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4381077B2 (en) * 2003-09-22 2009-12-09 独立行政法人理化学研究所 Noise filter device, noise filter method, and noise filter program in three-dimensional heteronuclear correlation NMR spectrum
US7904252B2 (en) * 2003-11-28 2011-03-08 Hitachi, Ltd. Method for measuring a structural change in a protein
JP4381126B2 (en) * 2003-12-16 2009-12-09 独立行政法人理化学研究所 NMR structure analysis system, NMR structure analysis method, and NMR structure analysis program
EP1715357A4 (en) * 2004-02-02 2009-09-16 Mitsubishi Chem Corp Nmr signal assignment method
GB0517349D0 (en) * 2005-08-24 2005-10-05 Isis Innovation Biomolecular structure determination

Also Published As

Publication number Publication date
JP2003139832A (en) 2003-05-14

Similar Documents

Publication Publication Date Title
US7814111B2 (en) Detection of patterns in data records
JP5265071B2 (en) Method for mapping process analysis data and machine-readable medium storing instructions for executing the method
CN109523316A (en) The automation modeling method of commerce services model
CN107103205A (en) A kind of bioinformatics method based on proteomic image data notes eukaryotic gene group
US8269606B2 (en) Methods and systems for RFID tag read verification
US20080091742A1 (en) System and method for detecting and updating geographical information dataset versions
CN108830554B (en) Task model-based intelligent detection method and system for data result information quality
CN110378206B (en) Intelligent image examination system and method
CN103562905B (en) Improved data visualization configuration system and method
Younis et al. Detection and annotation of plant organs from digitised herbarium scans using deep learning
Huang et al. Technology life cycle analysis: From the dynamic perspective of patent citation networks
CN106446000A (en) Boundary interaction-based area combination topological similarity measurement method
CN107146026A (en) A kind of space planning land used difference automatic synchronization method
JP3607948B2 (en) NMR signal attribution support system
JP3394694B2 (en) Format information registration method and OCR system
WO2001043038A1 (en) Tracking of clinical study samples, information and results
CN110377768A (en) It is a kind of intelligently to know drawing system and method
JP4501459B2 (en) Program, method and apparatus for creating cross table
CN104915486B (en) A kind of part link information search method
KR100889940B1 (en) Method to predict protein secondary structure using NMR spectroscopy
CN110533093A (en) A kind of automobile front face brand family analysis method
CN108595693A (en) A kind of matrimony vine data-reduction system
CN113240353B (en) Cross-border e-commerce oriented export factory classification method and device
CN109583675A (en) Oilfield development project checks method and system
TWI301203B (en) Test point pitch analyzing method for logic circuit

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040430

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040430

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040914

R150 Certificate of patent or registration of utility model

Ref document number: 3607948

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term