JP2008003856A - 生命科学解析支援プログラム及び生命科学解析支援装置 - Google Patents

生命科学解析支援プログラム及び生命科学解析支援装置 Download PDF

Info

Publication number
JP2008003856A
JP2008003856A JP2006172903A JP2006172903A JP2008003856A JP 2008003856 A JP2008003856 A JP 2008003856A JP 2006172903 A JP2006172903 A JP 2006172903A JP 2006172903 A JP2006172903 A JP 2006172903A JP 2008003856 A JP2008003856 A JP 2008003856A
Authority
JP
Japan
Prior art keywords
analysis
information
guidance information
program
guidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006172903A
Other languages
English (en)
Inventor
Yasuyuki Nozaki
康行 野崎
Daniel Reda
レダ ダニエル
Takahiko Kasuga
孝彦 春日
Takeo Nagai
健夫 永井
Takamune Yamamoto
崇主 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2006172903A priority Critical patent/JP2008003856A/ja
Publication of JP2008003856A publication Critical patent/JP2008003856A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】様々な解析作業を複数の解析プログラムを用いて実行するに際して操作者の負担を軽減し、より有効な解析結果を導き出す。
【解決手段】入力手段、表示手段及び中央処理装置を備えるコンピュータに、少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットをガイダンス情報として格納するガイダンス情報部から、入力手段で特定のガイダンス情報を入力し、入力したガイダンス情報に含まれるデータセットを操作者により再設定可能に表示手段に表示する処理と、表示手段に表示されたパラメータ値に基づいて、中央処理装置が上記特定のガイダンス情報に含まれる複数の解析プログラムを実行する処理と、上記複数の解析プログラムを実行した結果を出力する処理とを実行させる。
【選択図】図2

Description

本発明は、利用者の解析の目的に合わせて様々な解析プログラムを実行させる生命科学解析支援プログラム及び生命科学解析支援装置に関する。
世界中のゲノム配列解読プロジェクトの貢献及び配列解読のための実験機器や実験手法の進歩によって、現在までに様々な生物種でゲノム配列の解読に成功してきた。解読された配列情報は、通常、インターネット上の公共のデータベースに蓄積され、そのリソースはまた、一般の人にも公開される。公共データベースのひとつであるGenBank(http://www.nlm.nih.gov/)では、2004年末の時点で40,604,319個の配列(44,575,745,176塩基)が登録されており、今もなお、指数的な速度で規模が増大している(14ヶ月で約2倍のペース)。このような大量の情報が利用可能になったことによって、研究者は、自分の興味のあるゲノム配列を公共のデータベースに入っている配列と比較することが可能となり、その結果、新たな生物学的知見を得ることができるようになってきた。
これらの配列情報を実際に利用して意味を見出すため、コンピュータによる情報解析の手法(バイオインフォマティクス)を用いる。これらはコンピュータにインストールされたアプリケーションプログラム又はインターネット上のプログラムとして提供されている。具体的な例としては、1)ある1つのDNAまたはアミノ酸配列に対して、それと類似した配列をデータベースから探すプログラム「BLAST」(http://www.ncbi.nlm.nih.gov/BLAST/)、2)複数のDNAまたはアミノ酸配列に対して、それら配列間の進化的な関係を推測し、その類縁関係を系統樹という形式で表示するプログラム「Phylip」(http://evolution.genetics.washington.edu/phylip.html)、3)RNA配列に対して、その二次構造を予測するプログラム「Mfold」(http://www.bioinfo.rpi.edu/applications/mfold/old/rna/)、などがある。上記以外にも多数のプログラムが開発されており、これらの種類や使い方を解説した本も販売されている(非特許文献1参照)。
David W. Mount "Bioinformatics:Sequence and Genome Analysis" Cold Spring Harbor Laboratory Press
背景技術で述べたように、バイオインフォマティクスを利用するための環境は整備されつつある。しかしながら、実際にバイオインフォマティクスに利用される解析プログラムを用いて一連の解析を行うには、大変な時間と労力を要するといった問題がある。例えば、研究者は、実験の結果として得られた配列情報等の生体関連情報を、如何なる解析プログラムを用いて如何なる条件のもとで解析を行うかといった戦略をたてる必要がある。
しかしながら、現状では、同様な解析を行うプログラムとしても、数十から数百の解析プログラムがあり、また個々の解析プログラムについて多数のパラメータを設定する必要があるため、最適な戦略を立てることが非常に困難であるといえる。例えば、系統樹解析のソフトウェアを集めたサイトPhylogeny(http://evolution.genetics.washington.edu/phylip/software.html)では、100個以上の解析プログラムが紹介されている。個々のソフトウェアを利用する際にも、それぞれのパラメータの意味を理解し、研究の目的に合った最適なパラメータをみつけだす必要がある。
そこで、本発明は、上述した実情に鑑み、様々な解析作業を複数の解析プログラムを用いて実行するに際して操作者の負担を軽減し、より有効な解析結果を導き出すことのできる生命科学解析支援プログラム及び生命科学解析支援装置を提供することを目的としている。
上記目的を達成した本発明は以下を包含する。
(1)入力手段、表示手段及び中央処理装置を備えるコンピュータに、少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットをガイダンス情報として格納するガイダンス情報部から、入力手段で特定のガイダンス情報を入力し、入力したガイダンス情報に含まれるデータセットを操作者により再設定可能に表示手段に表示する処理と、表示手段に表示されたパラメータ値に基づいて、中央処理装置が上記特定のガイダンス情報に含まれる複数の解析プログラムを実行する処理と、上記複数の解析プログラムを実行した結果を出力する処理とを実行させる生命科学解析支援プログラム。
(2)上記解析プログラムは、塩基配列情報及び/又はアミノ酸配列情報を処理するプログラムであることを特徴とする(1)記載の生命科学解析支援プログラム。
(3)上記ガイダンス情報部は、通信回線網を介して上記コンピュータとデータ通信可能であり、上記特定のガイダンス情報は当該通信回線網を介して入力されることを特徴とする(1)記載の生命科学解析支援プログラム。
(4)上記複数の解析プログラムを実行した後、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラム関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを新たなガイダンス情報として上記ガイダンス情報部及び/又は他の記憶手段に格納することを特徴とする(1)記載の生命科学解析支援プログラム。
(5)少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを入力手段により入力し、当該データセットを含むガイダンス情報に基づいて、中央処理装置が当該ガイダンス情報に含まれる複数の解析プログラムを実行する処理をさらに実行させることを特徴とする請求項(1)記載の生命科学解析支援プログラム。
(6)少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットをガイダンス情報として格納するガイダンス情報部から、入力手段で入力した解析の目的をキーとして検索された特定のガイダンス情報を入力し、入力したガイダンス情報に含まれるデータセットを操作者により再設定可能に表示手段に表示するガイダンス情報実行処理部と、表示手段に表示されたパラメータ値に基づいて、中央処理装置が上記特定のガイダンス情報に含まれる複数の解析プログラムを実行する解析プログラム処理部とを備える生命科学解析支援装置。
(7)上記解析プログラムは、塩基配列情報及び/又はアミノ酸配列情報を処理するプログラムであることを特徴とする(6)記載の生命科学解析支援装置。
(8)上記ガイダンス情報部は、通信回線網を介して上記コンピュータとデータ通信可能であり、上記特定のガイダンス情報は当該通信回線網を介して入力されることを特徴とする(6)記載の生命科学解析支援装置。
(9)上記複数の解析プログラムを実行した後、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを新たなガイダンス情報として上記ガイダンス情報部及び/又は他の記憶手段に格納するガイダンス情報作成処理部を更に備えることを特徴とする(6)記載の生命科学解析支援装置。
(10)上記ガイダンス情報作成処理部は、少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを入力手段により入力し、当該データセットを含むガイダンス情報を新規に作成し、上記解析プログラム処理部は中央処理装置が当該ガイダンス情報に含まれる複数の解析プログラムを実行することを特徴とする(9)記載の生命科学解析支援装置。
以上の本発明に係る生命科学解析支援プログラム及び生命科学解析支援装置によれば、操作者は表示手段に表示されたガイダンス情報を参照して、複数の解析プログラムからなる一連の解析作業を容易に行うことができる。また、本発明に係る生命科学解析支援プログラム及び生命科学解析支援装置によれば、ガイダンス情報に裏付けられた一連の解析作業を実行することによって、信頼性の高い有効な解析結果を得ることができる。
また、本発明に係る生命科学解析支援プログラム及び生命科学解析支援装置においては、上記ガイダンス情報を格納する記憶手段がガイダンス情報提供サーバであって、ガイダンス情報の登録や、ガイダンス情報の参照及びガイダンス情報の使われ方によって算出されるガイダンス情報の有用度の集計処理及び集計結果の表示を提供するものであってもよい。
本発明により、複数の解析プログラムからなる一連の解析作業を容易に行うことができ、且つ、信頼性の高い有効な解析結果を導くことができる生命科学解析支援プログラム及び生命科学解析支援装置を提供することができる。
以下、図面を参照し、本発明を詳細に説明する。なお、以下に説明する実施形態において使用される機器、手法等は一例であり、本発明はこれらに限定されるものではない。
本実施の形態では、一例として、「手持ちのヒト由来のDNA断片に対して、その配列内で進化的に保存されている領域をみつけ、その領域をクローニングする」といった処理を挙げる。この処理では、概略、図1に示すような一連の解析を行うこととなる。
先ず、図1に示す一連の解析処理について説明する。図1に示すように、公知の遺伝子解析実験等によって取得されたヒト由来DNA断片の塩基配列がテキストデータとして得られたとする。このDNA断片の塩基配列をクエリー配列として、ヒト以外の生物種に関する遺伝子配列データが含まれるデータベースを用いて「配列類似性検索」を行う。この結果、クエリー配列に対して所定の基準値以上の相同性を有する、ヒト以外の他の生物種由来の塩基配列が読み出される。
次に、クエリー配列であるヒト由来のDNA断片において、進化的に保存されている領域(例えば図1における領域100)を見つけるため、いわゆるマルチプルアライメント解析を実行する。具体的には、ヒト由来のDNA断片の塩基配列と、配列類似性検索で読み出したチンパンジー由来の塩基配列、マウス由来の塩基配列、ラット由来の塩基配列、イヌ由来の塩基配列、メダカ由来の塩基配列とからそれぞれ領域100を抜き出し、ギャップ文字(−)を挿入することにより、類似したパターンが縦に揃うように配置する操作である。これによって、進化に伴う配列の保存・変化のパターンを詳細にみることができる(図1では全ての種の塩基配列で同じ塩基であるものを下段に*で表している)。
次に、マルチプルアライメント解析によって特定した保存領域をクローニングするために、クエリー配列であるヒト由来のDNA断片の塩基配列に対して「制限酵素切断部位検索」を行う。制限酵素切断部位検索では、ヒト由来のDNA断片の塩基配列において、上記保存領域を挟み込むように位置する切断部位を有する制限酵素の種類を特定する。制限酵素切断部位検索の結果、どの制限酵素でどの位置が切断されるか(図1では▲の部分)がわかる。具体的には、図1に示す例において制限酵素Bが特定されることとなる。
最後に、制限酵素Bで切断される部位を囲む領域(図1の101)に対して、その領域を増幅するためのプライマーを設計するため、「プライマー配列検索」を行う。ここで得られたプライマー配列(図1では「ACTAGT」と「GTAGGC」)を用いることによって、プライマー配列に囲まれる領域をPCRで増幅することができる。増幅された配列は、制限酵素Bによって切断され、その切断面とベクター配列の切断面を結合することによって、最終的にクローニングすることができる。
以上のような一連の解析処理を実行するためには、「配列類似性検索」、「マルチプルアライメント解析」、「制限酵素切断部位検索」及び「プライマー配列検索」をこの順で実行することとなる。本発明に係る生命科学解析支援プログラム及び生命科学解析支援装置は、一例として、この一連の解析処理を実行することができる。以下の説明において、本発明に係る生命科学解析支援プログラム及び生命科学解析支援装置をまとめて本システムと称する。
図2は、本システムの構成図である。本システムは、解析対象の配列の格納および配列の参照を提供する配列データ部201、バイオインフォマティクスに使用される解析プログラムの入出力情報の格納および参照を提供するプログラム入出力情報部202、解析の目的を実行するための一連の解析プログラム情報に関する実行順序、個々の解析プログラム関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットをガイダンス情報として格納及びその参照を提供するガイダンス情報部203、解析プログラムの入力パラメータと解析結果の格納及びそれらの参照を提供するプログラム入出力結果格納部204、解析結果を表示するための表示装置206(表示手段)、本システムの値の入力や選択の操作を行うためのキーボード207やマウス208(入力手段)、ネットワーク上の資源にアクセスし情報を得るための通信制御装置209、バイオインフォマティクスに利用される解析プログラムをネットワーク上で提供するサービスを公開しているプログラム管理サーバ210、ネットワーク上で前記ガイダンス情報の登録や、ガイダンス情報の参照、ガイダンス情報のアクセス回数度合い(ダウンロードの回数など)の集計処理及び集計結果の表示を提供するガイダンス情報提供サーバ211、ネットワーク上で遺伝子等の塩基配列及び/又はアミノ酸配列の格納および参照を提供する公共配列データ部212、上記解析プログラムを実行したり、ガイダンス情報を作成したり、解析結果を表示したり、解析結果の自動実行を行ったりする中央演算装置213から構成される。
中央演算装置213には、利用者からの指定によって解析プログラムを選択し、利用者のパラメータの設定をもとにその解析プログラムを実行し、ガイダンス情報に従って複数の解析プログラムを順次起動する解析プログラム処理部214、ガイダンス情報を作成するガイダンス情報実行処理部215、実行済みの解析をベースとしたガイダンス情報作成処理部216、ユーザ定義のガイダンス情報を生成するガイダンス情報作成処理部217、ガイダンス情報、解析結果、パラメータ情報など本システムで扱われるすべての解析を表示するための処理を行う解析表示処理部218、からなる。解析プログラム処理部214は、種種の実際のバイオインフォマティクスプログラムである解析プログラムA219、解析プログラムB220及び解析プログラムC221を含んでいる。これらは、ネットワーク上で公開している解析プログラム管理サーバ210上の解析プログラムを、あたかもローカルなプログラムを実行するかのようにしてラッピングする形態も含んでいる。また以上に述べたプログラム・処理部・データ部等は、CD−ROM、DVD−ROM、MO、フロッピーディスク、USBメモリ等の記録媒体に格納して提供することもできる。
図3は配列データ部201に格納されているゲノム配列データの一例である。配列データは、実際の塩基配列(又はアミノ酸配列)と、それに付随するアノテーション情報からなるが、ここでは例えば図3に示すように、それをXML形式で表している。図3に示したXML文書は、NCBIが決めたDTD(http://www.ncbi.nlm.nih.gov/dtd/NCBI_Sequence.mod.dtd )に則って作られており、一般的に利用されているフォーマットの一つである。配列データ部201には、図3に示すようなフォーマットに従って、解析対象でDNA断片の塩基配列や、解析対象であるタンパク質或いはペプチドのアミノ酸配列が格納されている。
図4はプログラム入出力情報部202に格納されているデータの一例を示したもので、本システムで使うことが可能なバイオインフォマティクスに利用される解析プログラムの入力情報および出力形式に関する情報がXML形式で書かれている。
具体的には、図4中、<head>ブロックにこのプログラムに関する一般的な情報が記述されており、headの中のtitile・description・authors・category・doclinkはそれぞれ、プログラム名・プログラムの説明・プログラムの著者・プログラムが属する解析分野のカテゴリ・プログラムが公開されているURLに対応している。またparametersブロックには、この解析プログラムで必要とされるパラメータの一覧が記述されており、<parameter>が一つ一つの解析プログラムでの引数(解析パラメータ設定画面での個々のボックス)に対応している。parameterの属性として、type(入力データの型)・ismandatory(そのパラメータが必須か否か)・issimple(リストボックスなど選択式のパラメータの場合、そのうちの一つだけが選ばれるのか、複数が選ばれることも許すのか)などが挙げられる。
さらにparameterの要素としてname(パラメータ名)とattributes(このパラメータの属性)がある。attributesは複数の要素からなり、prompt(入力パラメータボックスに表示する入力内容の説明文)、format(解析ツールを実行するときに使うパラメータの指定方法)、seqtype(入力配列がDNAかアミノ酸かなどの指定)、default(デフォルト値)などからなる。
最後に<output_format>として出力形式を入れている。多くの解析プログラムは、出力形式を決められたフォーマットで出力していることが多いので、もし定型のフォーマットで出力していれば、ここにそれを記述しておく。
図5はガイダンス情報部203に格納されているデータの一例を示したものである。図5では、図1で説明した部分で、(1)類似配列の検索を行った後、(2)マルチプルアライメントを実行し、(3)制限酵素切断部位を検索する部分の解析フローの流れを示しており、XML形式で記述している。
初めのtitle、description、author、reference、rating、created_dateは、それぞれ、このガイダンス情報のタイトル、ガイダンス情報の説明、ガイダンス情報の作成者、このガイダンス情報が用いられている論文やドキュメントがあればその参照先、ガイダンス情報のアクセス度合いのレーティング、ガイダンス情報の作成日である。ガイダンス情報のレーティングは通常、ユーザがガイダンス情報提供サーバ211からガイダンス情報をダウンロードしたときに確認できる。レーティングは、そのガイダンス情報のアクセスの度合いを5段階等の評価で表したものであり、例えば、そのガイダンス情報がガイダンス情報提供サーバ211からダウンロードされた回数やダウンロードしたユーザによる人気度投票をもとにして、レーティングが算出されるようになっている。
実際の解析の流れは<analysis_flow>のブロックに記述されている。
前記ブロックは複数の<step>要素から構成されており、これが一連のバイオインフォマティクス解析における個々の解析プログラムに対応している。
個々の解析プログラムを意味するstepは、title(本ステップで行う解析の概要)、description(本ステップで行う解析の詳細な説明、解析の意味やパラメータの選び方に関することなどの記述(アノテーション情報))、program(実際に用いる解析プログラムに関する情報)の要素からなっている。
さらに<program>のブロックは、name(解析プログラムの名前で、図4のプログラム入出力情報の<head>ブロックの<title>に対応したもの)とparameters(プログラムに渡す引数の情報)の要素からなる。parametersは、このガイダンス情報の解析の目的に特化した、最適なパラメータ値が指定されており、ひとつひとつのパラメータに対して<param>が設定される。
paramには属性として、name(パラメータの名前で、図4のプログラム入出力情報の<parameters>ブロックの<parameter>ブロックの<name>要素に対応)と<value>(実際のパラメータに渡す値)がある。したがって、ガイダンス情報に従って解析をおこなうとき、パラメータ入力ボックスには、これらの値が既に入った状態になっている。
図6はプログラム入出力結果格納部204に格納されているプログラムの解析結果のデータの一例を示したもので、バイオインフォマティクスに利用される解析プログラムのひとつ、BLAST(Altschul, Stephen F, Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402.)の結果の一部を示している。
図6に示すように、バイオインフォマティクスプログラムの出力は、いくつかのまとまり(図6でいえば、上から、BLASTプログラムに関する情報、検索対象のデータベースに関する情報、問合せ配列と類似性があるとしてヒットした公共データベースの配列とその統計量の一覧、問合せ配列とヒットした個々の配列とのペアワイズアライメントなど)から構成されている。
図7はプログラム入出力結果格納部204に格納されているプログラムの入力情報のデータの一例を示したもので、実際にどのようなコマンドおよび引数で実行されたかを記述している。
図8はガイダンス情報に従って解析を行うフローを示しており、図2のガイダンス実行処理部215に相当している。まず初めにガイダンス情報部203に格納されている全てのガイダンス情報の一覧を表示する。表示する項目としては、例えば、ガイダンス情報の<title>の部分の文字列がある。この一覧の中に、利用者の目的とするものが無かった場合は、ガイダンス情報提供サーバ211に登録されているガイダンス情報の一覧を表示する。一覧の中から、利用者の目的のものをひとつ選択させる(ステップ801)。以降、利用者が目的のガイダンスを見つけたとして、説明を続ける。次にステップ801で選択されたガイダンス情報を詳細に表示する。
表示する項目としては、例えば、ガイダンス情報において、<title>、<description>、<author>、<reference>、<rating>、<created_date>と、<analysis_flow>における各<step>の中の<title>の文字列を表示する(ステップ802)。
1番目のステップ(それぞれの解析ツールに対応した処理手続き。ここでの解析ツールとは「配列類似性検索」「マルチプルアライメント解析(多重配列アライメント)」「制限酵素切断部位検索」「プライマー配列検索」などを行うもの)がクリック等で選択されると、そのステップの解析処理内容の詳細な説明(ガイダンス情報の<analysis_flow>の1番目の<step>の<description>の内容)が表示され、そして実際のバイオインフォマティクスプログラム(ガイダンス情報の<analysis_flow>の1番目の<step>の中の<program>の<name>に相当するプログラム)に対する入力パラメータボックス(ダイアログ)が表示される。
この入力パラメータボックスには、予め最適なパラメータ(ガイダンス情報の<analysis_flow>の1番目の<step>の中の<program>の<param>に記述されたパラメータ)が設定されている。
実際には入力ゲノム配列の内容などによって適切なパラメータ値が異なる場合もあるので(例えば、入力配列が環状配列のときは、入力パラメータボックス「Allow circular DNA?」の入力エリアところで「Yes」を指定しなければならないことなど)、それは前に述べた解析処理内容の詳細な説明(ガイダンス情報の<analysis_flow>の1番目の<step>の<description>の内容)に記述しておく(ステップ803)。利用者に解析パラメータを設定または変更させて、バイオインフォマティクスプログラムを実行し、解析結果を表示装置206に表示する(ステップ804,805)。
このステップ(<step>)がガイダンス情報の<analysis_flow>の最後の<step>ならば、これで処理が終わる。もし最後の<step>でないならば、ステップ803〜805のことと同様のことを、最後の<step>まで繰り返し実行する。すなわち、次の<step>の解析処理内容の詳細な説明(ガイダンス情報の<analysis_flow>の次の<step>の<description>の内容)を表示し、そして実際のバイオインフォマティクスプログラム(ガイダンス情報の<analysis_flow>の1番目の<step>の中の<program>の<name>に相当するプログラム)に対する入力パラメータボックス(ダイアログ)を表示する。この入力パラメータボックスには、予め最適なパラメータ(ガイダンス情報の<analysis_flow>の該当<step>の中の<program>の<param>に記述されたパラメータ)が設定されている(ステップ807)。利用者に解析パラメータを設定または変更させて、バイオインフォマティクスに利用される解析プログラムを実行し、解析結果を表示装置206に表示させる(ステップ808,809)。
以上、図8に示したフローに従えば、ガイダンス情報部203或いはガイダンス情報提供サーバ211に格納されている全てのガイダンス情報から所望のガイダンス情報を選択することによって、複数の解析プログラムからなる一連の解析を実行するに際して、の負担を軽減することができる。
また、本システムによれば、利用者は、選択したガイダンス情報に含まれる個々の解析プログラムについて、個々の解析プログラムに関するアノテーション情報を参照しながら、パラメータ値を適宜設定することができるため、有効な解析結果を導き出すことが可能となる。
また、本システムは、図8に示した解析フローに限らず、図9に示すフローを実行することができる。
図9は、ユーザが実行した解析フローをもとにして、ガイダンス情報を生成する処理のフローを示したもので、図2の実行済みの解析をベースとしたガイダンス情報作成処理部216に相当している。
例えば、ユーザが試行錯誤の上作成した解析フローや、図8に示した解析フローで再設定したガイダンス情報をテンプレート化したい場合に、この機能が使われる。まずガイダンス生成ダイアログを出して、先に行った解析の流れを表示する(ステップ901)。続いて、このガイダンス情報に関する説明(ガイダンス情報のタイトル、解析の詳細な説明(アノテーション情報)、作成者、参照先、作成日など)が入力され、それをガイダンス情報の該当部分(ガイダンス情報の<title>、<description>、<author>、<reference>、<created_date>)にそれぞれ登録する(ステップ902)。次に、先に行った解析の流れの表示画面において、1番目の解析の項目が選択される。また、入出力結果格納部204からプログラム入力結果(図7)を読み出し、そこでどのようなパラメータが入力されたのかを読み出し、これらのパラメータを最適な(あるいは適切な)パラメータとして表示する(ステップ903)。利用者は該当する解析ステップの内容をみて、これをガイダンス情報に採用するか判断する(ステップ904)。この解析ステップをガイダンス情報に採用するなら、解析の概要および詳細な説明や注意事項などが入力される(ステップ905)。
この後、ガイダンス情報の<analysis_flow>の中に<step>要素を1つ追加し、ステップ905で記述された解析の概要・詳細な説明、および、先にステップ903で抽出した解析プログラム名と入力パラメータ値を、新しく作った<step>の中の<title>、<description>、<program>の<name>および<parameters>にそれぞれ登録する(ステップ906)。もしこのステップが、先に行った解析の流れの中で最後の解析ステップで無い場合は、先に行った解析の流れの中での次の解析ステップが選択され、ステップ903と同様に、解析の詳細情報を表示し(ステップ907、908)、ステップ904に戻って処理を続ける。ステップ907において、該当する解析ステップが最後の解析ステップであった場合は、作成したガイダンス情報をガイダンス情報提供サーバ211に登録するかどうか利用者に尋ねる。もし、それを登録したい場合は、ガイダンス情報提供サーバ211に登録する(ステップ909、910)。
また、本システムは、図8に示した解析フローに限らず、図10に示すフローを実行することができる。図10は、ユーザが解析フローを作成し、それをガイダンス情報として生成する処理のフローを示した図で、図2のユーザ定義のガイダンス情報を生成するガイダンス情報作成処理部217に相当している。
まず、ガイダンス生成ダイアログを出して(ステップ1001)、このガイダンス情報に関する説明(ガイダンス情報のタイトル、解析の詳細な説明(アノテーション情報)、作成者、参照先、作成日など)が入力される。それをガイダンス情報の該当部分(ガイダンス情報の<title>、<description>、<author>、<reference>、<created_date>)にそれぞれ登録する(ステップ1002)。次に、ガイダンスを実現する解析フローの一番目の解析ツールが選択される(ステップ1003)。選択された解析ツールに関する解析内容の説明が入力され、解析ツール名とそれに用いられる最適な(あるいは適切な)パラメータ値が設定される(ステップ1004)。
ガイダンス情報の<analysis_flow>の中に<step>要素を1つ追加し、ステップ1004で記述・設定された解析の概要・詳細な説明、解析ツール名、入力パラメータ値を、新しく作った<step>の中の<title>、<description>、<program>の<name>および<parameters>にそれぞれ登録する(ステップ1005)。これをガイダンス情報の中で最後の解析ステップにしないならば、最後の解析ステップになるまで、ステップ1003、1004、1005と同様の処理を行う(ステップ1006)。すなわち、ガイダンスを実現する解析フローにおいて、次に実行されるべき解析ツールを選択する(ステップ1007)。選択された解析ツールに関する解析内容の説明が記述され、解析ツール名とそれに用いられる最適な(あるいは適切な)パラメータ値が設定される(ステップ1008)。ガイダンス情報の<analysis_flow>の中に<step>要素を1つ追加し、ステップ1008で記述・設定された解析の概要・詳細な説明、解析ツール名、入力パラメータ値を、新しく作った<step>の中の<title>、<description>、<program>の<name>および<parameters>にそれぞれ登録する(ステップ1009)。ステップ1006において、最後のステップまで作成した場合は、作成したガイダンス情報をガイダンス情報提供サーバ211に登録するかどうか利用者に尋ねる。もし、それを登録したい場合は、ガイダンス情報提供サーバ211に登録する(ステップ1010、1011)。
図11は、ガイダンス情報に従って解析を行っているときの画面例を示したものである。画面では左上のペインに解析フロー(1101)が表示されており、行った解析の一連の流れが表示されている。また左下のペインに解析ガイダンス(1102)が表示されており、解析ガイダンスの情報と実際の解析の手順が示されている。ユーザはここの情報を見ながらバイオインフォマティクス解析を行っていく。図の例では、初めのステップ「他の生物種を対象にして類似配列検索を実行」が終わって、次のステップ「マルチプルアライメントを実行し、進化保存領域を特定」のステップが選択されている様子を示している。
該当するステップが選択されれば、その詳細説明「BLASTで得られた類似配列に対して、マルチプルアライメントを実行する。種間で保存されている塩基はアライメントの最下段に印で現れる。配列中で強く保存されているところを探す。」が表示される。ここでは解析の意味、パラメータを入力するときの注意事項、出力結果の意味などを表示するヘルプ画面が表示される。
右のペインには解析結果(1103)が表示されている。また、今、2番目のステップが選択されているので、そのステップに相当する解析プログラムの入力パラメータボックスがポップアップで表示されている(1104)。
ここには既に最適な(または適切な)パラメータが設定されている。ユーザは基本的には、該当する塩基配列を入力ボックスに入れるだけでよい。これによって、ユーザにプログラムを探す手間や、最適なパラメータを探す手間を省き、利用者はひとつひとつの解析を「意味」のレベルで解釈することができる。なお、ユーザは、適宜最適なパラメータを再設定することもできる。
図12は、ユーザが実行した解析フローをもとにして、ガイダンス情報を生成するときの画面例を示したものである(図9のフローに対応)。
今まで解析を行っていたフロー(1201)に対して、それをテンプレートとしてガイダンス情報を生成する様子を示している。
ガイダンス情報を生成するときは、ガイダンス情報ジェネレータのダイアログを出して(1202)、その中に今まで行ってきた解析フロー1201を表示する(1203)。解析ガイダンスジェネレータが起動した直後、ガイダンスを表すタイトル(1204)、ガイダンスの詳細な説明(1205)、このガイダンスを作成する作成者(1206)、そしてこのガイダンスを参考にする文献情報を入力するための参考文献(1207)の欄を出す。
これらのそれぞれの項目がユーザによって入力される。これらの情報でよければ「次へ」のボタン(1208)が押下されて次の詳細な設定画面に移る。ガイダンス情報の作成をやめるのであれば「キャンセル」のボタン(1209)が押下されて、ガイダンス情報ジェネレータダイアログを閉じる。また作成日の情報(ガイダンス情報の<created_date>タグ)の入力については図12にないが、これはこのシステム内で自動的に日付の情報が入手できるものとしている。
図13は図12において、ガイダンス情報全体の情報が入力され、「次へ」のボタン(1208)が押下された後の画面の様子を示している。今まで解析を行っていたフロー(1301)を、ガイダンス情報ジェネレータのダイアログ(1302)の1303に表示する。この表示画面の中では、説明を入力すべき解析ステップには、それが目立つように太枠で強調表示している(図の例ではDBSEARCH)。このダイアログの1304,1305で、該当するバイオインフォマティクス解析のタイトル・説明が入力される。またプログラム名と前回使われたパラメータを表示し(1306)、ユーザがパラメータを編集したい場合は「パラメータの再設定」ボタン(1307)が押下されることで行うことができる(1307)。以上の情報でよければ、「このステップを登録」ボタン(1308)が押下されてガイダンスに登録する。登録したステップは、作成されたガイダンス1309の中に表示する。1309内のステップがクリックで選択され、選択されたステップの内容を後で編集することも可能である。編集した結果を反映させるには、再度「このステップを登録」ボタン(1308)が押下される。また、作成されたガイダンス内でステップが選択され、「ステップを削除」ボタン(1310)が押下されれば、該当ステップを削除する。逆にステップを新たに追加することも可能である(1312:ステップの追加ボタン)。更に、ステップの順序を変更することも可能である(1311:順序の変更ボタン)。内部的のフローとしては、ガイダンス情報の<analysis_flow>の中の<step>の順番を対応する実際の順番に変えるだけでよい。この画面において、ガイダンスの全体情報(ガイダンスのタイトルや説明文など)の設定をやり直したい場合は、「ガイダンスの全体情報の設定に戻る」ボタン(1313)が押下され図12の設定画面に戻ることが可能である。また、キャンセルボタン(1314)が押下されれば、登録情報を破棄し、ガイダンス情報ジェネレータを閉じる。OKボタン(1315)が押されれば、登録された情報をガイダンス情報部203に登録する。
図14は、ユーザが解析フローを作成し、それをガイダンス情報として生成するときの画面例を示したものである(図10のフローに対応)。このときも図12と同様に解析ガイダンスジェネレータを起動し、そこに、ガイダンスを表すタイトル(1401)、ガイダンスの詳細な説明(1402)、このガイダンスを作成する作成者(1403)、そしてこのガイダンスを参考にする文献情報を入力するための参考文献(1404)の欄を出し、それぞれの項目がユーザによって入力される。これらの情報でよければ「次へ」のボタン(1405)が押下されて次の詳細な設定画面に移る。ガイダンス情報の作成をやめるのであれば「キャンセル」のボタン(1406)が押下されて、ガイダンス情報ジェネレータダイアログを閉じる。また作成日の情報(ガイダンス情報の<created_date>タグ)の入力については図14にないが、これはこのシステム内で自動的に日付の情報が入手できるものとしている。
図15は、図14において、ガイダンス情報全体の情報が入力され、「次へ」のボタン(1405)が押下された後の画面の様子を示している。図13と異なるところは、ここでは解析ツールを選択しながらガイダンス情報を作成することである。解析ツール1501では、解析ツールの一覧をカテゴリに分けられた状態で表示している。ここで、ユーザによってガイダンスを実行するための解析ツールが(ダブルクリックなどによって)選択される。すると、1504に解析ツール名と、デフォルトのパラメータ値を表示する。デフォルトのパラメータの設定を変更したい場合は、「パラメータを設定」ボタン(1505)が押下される。するとパラメータ入力ダイアログ1513が現れ、ガイダンスに適したパラメータを設定することが出来る。パラメータボックス内の「OK」ボタン(1515)が押されれば、設定したパラメータの内容が保存され、それを1504に表示する。また「キャンセル」ボタン(1514)が押されれば、入力された内容を破棄する。パラメータの他に、この解析の内容を説明するために、ユーザによってタイトル(1502)、説明(1503)が入力される。これらの解析ツール名・パラメータ・タイトル・説明でよければ、「このステップを登録」ボタン(1506)が押下され、ステップの情報をガイダンスに登録する。登録したステップは、作成されたガイダンス(1507)の中に表示される。1507はクリッカブルになっており、1507内のステップが選択され、ステップの内容を後で編集することも可能である。編集した結果を反映させるには、再度「このステップを登録」ボタン(1506)が押下されることによってできる。また、ステップがクリックされ、「ステップを削除」ボタン(1508)が押下されれば、該当ステップは削除される。さらに「順序の変更」ボタン(1509)によって、ステップの順序を変更することも可能である。内部的なフローとしては、ガイダンス情報の<analysis_flow>の中の<step>の順番を対応する実際の順番に変えるだけでよい。この画面において、ガイダンスの全体情報(ガイダンスのタイトルや説明文など)の設定をやり直したい場合は、「ガイダンスの全体情報の設定に戻る」ボタン(1510)が押下されて、図14の設定画面に戻ることが可能である。また、キャンセルボタン(1511)が押下されれば、登録情報は破棄され、ガイダンス情報ジェネレータが閉じる。OKボタン(1512)が押されれば、登録された情報をガイダンス情報部203に登録する。
バイオインフォマティクス解析の一例である。 本発明の実施の形態に係る生命科学解析プログラムのガイダンスシステムの概略図である。 配列データのデータ構造の一例である。 プログラム入出力情報のデータ構造の一例である。 ガイダンス情報のデータ構造の一例である。 バイオインフォマティクスプログラムの解析結果の一例である。 プログラム入力結果の一例である。 ガイダンス情報に従って解析を行うときのフローチャートである。 ユーザが実行したときの解析フローをもとにして、ガイダンス情報を生成するときのフローチャートである。 ユーザが解析フローを作成し、それをガイダンス情報として生成するときのフローチャートである。 ガイダンス情報に従って解析を行っているときの画面図である。 ユーザが実行した解析フローをもとにして、ガイダンス情報を生成するときの画面図である。 ユーザが実行した解析フローをもとにして、ガイダンス情報を生成するときの画面図である。 ユーザが実行した解析フローを作成し、それをガイダンス情報として生成するときの画面図である。 ユーザが実行した解析フローを作成し、それをガイダンス情報として生成するときの画面図である。
符号の説明
100…類似配列検索において進化的に保存されたと推定される領域
101…酵素Bで切断される箇所と酵素Bで切断される箇所の間のゲノム領域
201…配列データ部
202…プログラム入出力情報部
203…ガイダンス情報部
204…プログラム入出力結果格納部
206…表示装置
207…キーボード
208…マウス
209…通信制御装置
210…プログラム管理サーバ
211…ガイダンス情報提供サーバ
212…公共配列データ部
213…中央処理装置
1101…解析フローペイン
1102…解析ガイダンスペイン
1103…解析結果ペイン
1104…入力パラメータダイアログ
1201…解析フローペイン
1202…解析ガイダンスジェネレータダイアログ
1203…解析フローウィンドウ
1204…解析ガイダンスのタイトル入力ボックス
1205…解析ガイダンスの詳細説明入力ボックス
1206…解析ガイダンスの作成者入力ボックス
1207…解析ガイダンスの参考文献入力ボックス
1208…解析ガイダンスの設定をキャンセルするボタン
1209…解析ガイダンスの詳細設定の画面へ進むボタン
1301…解析フローペイン
1302…解析ガイダンスジェネレータダイアログ
1303…解析フローウィンドウ
1304…解析ステップのタイトル入力ボックス
1305…解析ステップの詳細説明入力ボックス
1306…解析ステップのプログラム名およびパラメータ表示ペイン
1307…解析ステップのパラメータ再設定ボタン
1308…解析ステップの登録ボタン
1309…作成された解析ガイダンスの表示ペイン
1310…解析ステップの削除ボタン
1311…解析ステップの順序変更ボタン
1312…解析ステップの追加ボタン
1313…解析ガイダンスの全体情報の設定画面に戻るボタン
1314…解析ガイダンスの設定をキャンセルするボタン
1315…解析ガイダンスを登録するボタン
1401…解析ガイダンスのタイトル入力ボックス
1402…解析ガイダンスの詳細説明入力ボックス
1403…解析ガイダンスの作成者入力ボックス
1404…解析ガイダンスの参考文献入力ボックス
1405…解析ガイダンスの設定をキャンセルするボタン
1406…解析ガイダンスの詳細設定の画面へ進むボタン
1501…解析フローウィンドウ
1502…解析ステップのタイトル入力ボックス
1503…解析ステップの詳細説明入力ボックス
1504…解析ステップのプログラム名およびパラメータ表示ペイン
1505…解析ステップのパラメータの設定ダイアログ起動ボタン
1506…解析ステップの登録ボタン
1507…作成された解析ガイダンスの表示ペイン
1508…解析ステップの削除ボタン
1509…解析ステップの順序変更ボタン
1510…解析ガイダンスの全体情報の設定画面に戻るボタン
1511…解析ガイダンスの設定をキャンセルするボタン
1512…解析ガイダンスを登録するボタン
1513…解析ガイダンスのパラメータ設定ダイアログ
1514…解析ガイダンスのパラメータ設定キャンセルボタン
1515…解析ガイダンスのパラメータ設定登録ボタン

Claims (10)

  1. 入力手段、表示手段及び中央処理装置を備えるコンピュータに、
    少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットをガイダンス情報として格納するガイダンス情報部から、入力手段で特定のガイダンス情報を入力し、入力したガイダンス情報に含まれるデータセットを操作者により再設定可能に表示手段に表示する処理と、
    表示手段に表示されたパラメータ値に基づいて、中央処理装置が上記特定のガイダンス情報に含まれる複数の解析プログラムを実行する処理と、
    上記複数の解析プログラムを実行した結果を出力する処理と
    を実行させる生命科学解析支援プログラム。
  2. 上記解析プログラムは、塩基配列情報及び/又はアミノ酸配列情報を処理するプログラムであることを特徴とする請求項1記載の生命科学解析支援プログラム。
  3. 上記ガイダンス情報部は、通信回線網を介して上記コンピュータとデータ通信可能であり、上記特定のガイダンス情報は当該通信回線網を介して入力されることを特徴とする請求項1記載の生命科学解析支援プログラム。
  4. 上記複数の解析プログラムを実行した後、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラム関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを新たなガイダンス情報として上記ガイダンス情報部及び/又は他の記憶手段に格納することを特徴とする請求項1記載の生命科学解析支援プログラム。
  5. 少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを入力手段により入力し、当該データセットを含むガイダンス情報に基づいて、中央処理装置が当該ガイダンス情報に含まれる複数の解析プログラムを実行する処理を
    さらに実行させることを特徴とする請求項1記載の生命科学解析支援プログラム。
  6. 少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットをガイダンス情報として格納するガイダンス情報部から、入力手段で入力した解析の目的をキーとして検索された特定のガイダンス情報を入力し、入力したガイダンス情報に含まれるデータセットを操作者により再設定可能に表示手段に表示するガイダンス情報実行処理部と、
    表示手段に表示されたパラメータ値に基づいて、中央処理装置が上記特定のガイダンス情報に含まれる複数の解析プログラムを実行する解析プログラム処理部と、
    を備える生命科学解析支援装置。
  7. 上記解析プログラムは、塩基配列情報及び/又はアミノ酸配列情報を処理するプログラムであることを特徴とする請求項6記載の生命科学解析支援装置。
  8. 上記ガイダンス情報部は、通信回線網を介して上記コンピュータとデータ通信可能であり、上記特定のガイダンス情報は当該通信回線網を介して入力されることを特徴とする請求項6記載の生命科学解析支援装置。
  9. 上記複数の解析プログラムを実行した後、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを新たなガイダンス情報として上記ガイダンス情報部及び/又は他の記憶手段に格納するガイダンス情報作成処理部を更に備えることを特徴とする請求項6記載の生命科学解析支援装置。
  10. 上記ガイダンス情報作成処理部は、少なくとも、複数の解析プログラム情報に関する実行順序を示す情報、個々の解析プログラムに関するパラメータ値、個々の解析プログラムに関するアノテーション情報を含むデータセットを入力手段により入力し、当該データセットを含むガイダンス情報を新規に作成し、
    上記解析プログラム処理部は中央処理装置が当該ガイダンス情報に含まれる複数の解析プログラムを実行することを特徴とする請求項9記載の生命科学解析支援装置。
JP2006172903A 2006-06-22 2006-06-22 生命科学解析支援プログラム及び生命科学解析支援装置 Pending JP2008003856A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006172903A JP2008003856A (ja) 2006-06-22 2006-06-22 生命科学解析支援プログラム及び生命科学解析支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006172903A JP2008003856A (ja) 2006-06-22 2006-06-22 生命科学解析支援プログラム及び生命科学解析支援装置

Publications (1)

Publication Number Publication Date
JP2008003856A true JP2008003856A (ja) 2008-01-10

Family

ID=39008180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006172903A Pending JP2008003856A (ja) 2006-06-22 2006-06-22 生命科学解析支援プログラム及び生命科学解析支援装置

Country Status (1)

Country Link
JP (1) JP2008003856A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101282798B1 (ko) 2011-09-08 2013-07-04 한국과학기술정보연구원 생명 정보 분석 파이프라인 처리 시스템 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171636A (ja) * 1996-12-06 1998-06-26 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置および方法
JP2003216869A (ja) * 2001-11-16 2003-07-31 Nippon Telegr & Teleph Corp <Ntt> コンテンツ提供仲介サービスシステムとそのログ分析情報提供方法およびプログラムと記録媒体
JP2005228155A (ja) * 2004-02-13 2005-08-25 National Institute Of Advanced Industrial & Technology 生物学情報統合装置、生物学情報統合方法及び生物学情報統合プログラム
JP2006099746A (ja) * 2004-09-02 2006-04-13 Ricoh Co Ltd 動作定義情報作成方法、動作定義情報作成装置、動作定義情報作成プログラム、記録媒体及びデータ構造
JP2007520773A (ja) * 2003-07-04 2007-07-26 メディセル・オーワイ 生化学情報のための情報管理システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171636A (ja) * 1996-12-06 1998-06-26 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置および方法
JP2003216869A (ja) * 2001-11-16 2003-07-31 Nippon Telegr & Teleph Corp <Ntt> コンテンツ提供仲介サービスシステムとそのログ分析情報提供方法およびプログラムと記録媒体
JP2007520773A (ja) * 2003-07-04 2007-07-26 メディセル・オーワイ 生化学情報のための情報管理システム
JP2005228155A (ja) * 2004-02-13 2005-08-25 National Institute Of Advanced Industrial & Technology 生物学情報統合装置、生物学情報統合方法及び生物学情報統合プログラム
JP2006099746A (ja) * 2004-09-02 2006-04-13 Ricoh Co Ltd 動作定義情報作成方法、動作定義情報作成装置、動作定義情報作成プログラム、記録媒体及びデータ構造

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNG200600439007; 川本祥子: 'バイオデータベースの今' 情報処理 第47巻,第3号, 20060315, p.249-258, 社団法人情報処理学会 *
JPN6012004780; 阿部貴志: 'Webサービスによるバイオ情報資源の統合化の可能性' 情報処理学会研究報告. BIO, バイオ情報学 第2005巻,第74号, 20050725, p.21-28, 社団法人情報処理学会 *
JPN6012004783; 川本祥子: 'バイオデータベースの今' 情報処理 第47巻,第3号, 20060315, p.249-258, 社団法人情報処理学会 *
JPN6012004785; 木戸善之: 'in-Silicoスクリーニングを支援するワークフロースキーマの設計と実装' 情報処理学会研究報告. BIO, バイオ情報学 第2005巻,第99号, 20051007, p.17-24, 社団法人情報処理学会 *
JPN6012056582; Oinn, T.: 'Taverna: a tool for the composition and enactment of bioinformatics workflows' Bioinformatics Vol.20, No.17, 2004, p.3045-3054 *
JPN6012056585; Oinn, T.: 'Taverna: Lessons in creating a workflow environment for the life sciences' Concurrency and Computation: Practice and Experience Vol.18, 20051213, p.1067-1100 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101282798B1 (ko) 2011-09-08 2013-07-04 한국과학기술정보연구원 생명 정보 분석 파이프라인 처리 시스템 및 방법

Similar Documents

Publication Publication Date Title
Blankenberg et al. Galaxy: a web‐based genome analysis tool for experimentalists
Page Visualizing phylogenetic trees using TreeView
Hokamp et al. ArrayPipe: a flexible processing pipeline for microarray data
Fernandez-Fuentes et al. ArchPRED: a template based loop structure prediction server
Sinha et al. YMF: a program for discovery of novel transcription factor binding sites by statistical overrepresentation
Ogata et al. KEGG: Kyoto encyclopedia of genes and genomes
Yang et al. MAK, a computational tool kit for automated MITE analysis
WO2007032095A1 (ja) ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア
Jareborg et al. Alfresco—a workbench for comparative genomic sequence analysis
Bailey et al. GAIA: framework annotation of genomic sequence
Mistry et al. Pfam: a domain-centric method for analyzing proteins and proteomes
Griffin et al. MacVector: an integrated sequence analysis program for the Macintosh
JPWO2003017138A1 (ja) 生物配列情報の閲覧及び保存方法
JP2008003856A (ja) 生命科学解析支援プログラム及び生命科学解析支援装置
Lushbough et al. BioExtract server—an integrated workflow-enabling system to access and analyze heterogeneous, distributed biomolecular data
Hennell et al. Using GenBank® for genomic authentication: a tutorial
JP2007207113A (ja) 系統樹表示システム
JP2007241642A (ja) 解析方法、解析装置及びコンピュータプログラム
Rampp et al. The MIGenAS integrated bioinformatics toolkit for web-based sequence analysis
Mallika et al. PASS2: a semi-automated database of protein alignments organised as structural superfamilies
Sweeney et al. R2DT: computational framework for template-based RNA secondary structure visualisation across non-coding RNA types
Ramachandran et al. Exploring zebrafish genomic, functional and phenotypic data using ZFIN
Hu et al. SeqVISTA: a new module of integrated computational tools for studying transcriptional regulation
US7647290B2 (en) Method for performing bioinformatics analysis program and bioinformatics analysis platform
Reinharz et al. Modeling and Predicting RNA Three-Dimensional Structures

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130312