JP2004054775A - 生体分子配列情報の編集サーバ - Google Patents

生体分子配列情報の編集サーバ Download PDF

Info

Publication number
JP2004054775A
JP2004054775A JP2002214124A JP2002214124A JP2004054775A JP 2004054775 A JP2004054775 A JP 2004054775A JP 2002214124 A JP2002214124 A JP 2002214124A JP 2002214124 A JP2002214124 A JP 2002214124A JP 2004054775 A JP2004054775 A JP 2004054775A
Authority
JP
Japan
Prior art keywords
sample data
data
server
client device
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002214124A
Other languages
English (en)
Inventor
Atsushi Shimizu
清水 淳
Hiroshi Miura
三浦 宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Space Software Co Ltd
Original Assignee
Mitsubishi Space Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Space Software Co Ltd filed Critical Mitsubishi Space Software Co Ltd
Priority to JP2002214124A priority Critical patent/JP2004054775A/ja
Publication of JP2004054775A publication Critical patent/JP2004054775A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データベースからダウンロードしたすべてのサンプルデータの塩基配列に対して、編集済みのサンプルデータを元のデータベースへアップロードする一連の作業をWebブラウザ上で実行し、かつサンプルデータの読み取り品質予測値を付加・変更することができる生体分子配列情報の編集サーバを提供する。
【解決手段】データベース2に保存されているサンプルデータから所望のサンプルデータをダウンロードし、該サンプルデータDの編集済みデータをデータベースに保存するサンプルデータローダ7と、サンプルデータDとその編集結果とをディスプレイ14に表示するデータを生成する情報生成部15とを有した、WWWサーバ6が接続した編集サーバ4であって、外部のクライアント装置1からアクセスがあった場合に、該装置1に組み込まれているWebブラウザBによるログオン要求に基づいてその後のデータの送受信を実行するセッション管理部18を設けた。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
この発明は、バイオインフォマティックス(生命情報科学)分野において、コンピュータを利用して核酸配列やタンパク質アミノ酸配列等の生体分子配列情報が多数蓄積されているデータべースにアクセスして、生体分子配列情報をダウンロードして、ダウンロードした生体分子配列情報に編集を加え、その編集結果を元のデータベースにアップロードすることができる生体分子配列情報の編集サーバに関し、より詳しくは生体分子配列情報の編集作業がWebブラウザ上で行えるようにした編集サーバに関するものである。
【0002】
【従来の技術】
従来、蛍光プライマー法や蛍光ジデオキシ法によりDNAの塩基配列を決定する1個又は複数のDNAシーケンサ(例えば、ABI Genetic Analyzer、ABI社製)から出力されるサンプルファイルを直接、データベース化したDNAの塩基配列やサンプルファイルを解析したフラグメント解析データ等のサンプルデータを1箇所のサーバで集中管理するデータ管理システムを実現するソフトウエアとして、バイオ・リムス(BioLIMS(商標)、ABI社製)やシーケンス・コレクタ(Sequence Collector(商標)、ABI社製)等のシーケンスデータベース用ソフトウエアがある。
【0003】
このバイオ・リムスやシーケンス・コレクタは、データベースに汎用性の高いオラクル・データベース(ORACLE(登録商標)、オラクル社製)を使用しているため、サードパーティの各種ソフトウエアとの連携も図れることから、一般に広く使用されている。
【0004】
【発明が解決しようとする課題】
しかしながら、DNAシーケンサには、電気泳動波形データを読み、A、T、G、C塩基配列に変換するソフトウエア(例えば、トレース・チューナ(Trace Tuner(商標)、パラセル社製)が同梱されているが、日本では有効に活用されていないのが実状である。
【0005】
また、シーケンスデータベース用ソフトウエアを使用してDNAの塩基配列やフラグメント解析データを1箇所のサーバで集中管理するデータ管理システムを構築した場合の問題点として、シーケンスデータベース用ソフトウエア自体には読み取りデータの品質の程度を表す表示がなされないため、データの信頼性に疑問を残したまま後工程としての編集作業を行うこととなっていた。
【0006】
そこで、この発明は、以上のような問題点を解消するために考えられたもので、シーケンスデータベース用ソフトウエアが組み込まれた逐次処理サーバのデータベースからダウンロードしたすべてのサンプルデータの塩基配列に対して、塩基の追加、変更、削除等の編集作業を行った編集済みのサンプルデータを元の逐次処理サーバのデータベースへアップロードする一連の作業をWebブラウザ上で実行できるものとし、かつサンプルデータの読み取り品質予測値を付加・変更することができる生体分子配列情報の編集装置を提供することを課題としている。
【0007】
【課題を解決するための手段】
かかる課題を解決するために、請求項1に記載の発明は、核酸配列やタンパク質アミノ酸配列等の生体分子配列のサンプルデータが多数蓄積されているデータベースを有する逐次処理サーバに接続され、前記データベースに保存されているサンプルデータから所望のサンプルデータをダウンロードし、かつ該ダウンロードしたサンプルデータを編集した編集済みサンプルデータを前記データベースに保存するサンプルデータローダと、前記ダウンロードしたサンプルデータとその編集結果とをディスプレイに表示できる表示データを生成する情報生成部とを有する編集サーバであって、前記情報生成部にはWWWサーバが接続されており、かつ外部のクライアント装置からアクセスがあった場合に、該クライアント装置に組み込まれているWebブラウザによるログオン要求毎に特定のセッションIDを生成し、該セッションIDに基づいてその後のデータの送受信を実行するセッション管理部を有することを特徴としている。
【0008】
この発明に適用できる生体分子配列には特に限定はないが、例えば、構成単位が線状に連なった構造を有する核酸(DNA、RNA)、ポリペプチド(タンパク質)、糖鎖等の配列を挙げることができる。
【0009】
請求項2に記載の発明は、請求項1の構成に加えて、前記編集サーバには前記データベースからダウンロードしたサンプルデータを保存するサンプルデータ部を有し、該サンプルデータ部には前記セッションIDと対応する特定のディレクトリを作成し、その後の前記クライアント装置からの要求によるサンプルデータに関するデータ処理の結果は前記特定のディレクトリに保存されるようにしたことを特徴としている。
【0010】
請求項3に記載の発明は、請求項1又は2の構成に加えて、前記サンプルデータローダには、前記クライアント装置からの要求によりサンプルデータのダウンロードとアップロードの制御を行うサンプルデータダウン・アップロード部が接続されており、該サンプルデータダウン・アップロード部には前記サンプルデータの読み取り品質予測値を演算するトレース調整部を制御するデータ処理実行部が接続されており、該データ処理実行部は前記トレース調整部で演算された読み取り品質予測値と前記ダウンロードしたサンプルデータとを前記表示情報生成部へ送出することを特徴としている。
【0011】
ここで、品質予測値とは電気泳動波形データを読み、A、T、G、C塩基配列に変換する際の読み取りデータの品質の程度を表す指標であって1〜50の数値が与えられ、数字が大きいほど品質がよいことを示すものである。
【0012】
請求項4に記載の発明は、前記データ処理実行部には前記逐次処理サーバのデータベースを常時監視する新規データ検出部が接続されており、該新規データ検出部は前記逐次処理サーバのデータベースに新たに保存された新規サンプルデータを検出した結果を前記データ処理実行部に送出し、前記新規サンプルデータに対して前記トレース調整部の演算処理を実行するようにしたことを特徴としている。
【0013】
請求項5に記載の発明は、請求項1乃至4のいずれか1つに記載の構成に加えて、特定のサンプルデータについて生体分子配列の各塩基の読み取り品質予測値を前記クライアント装置のWebブラウザ上に棒グラフで表示し、該棒グラフで表示された特定の塩基を前記クライアント装置のWebブラウザ上で指定した場合に、その塩基の種別、読み取り品質予測値、塩基の位置を前記特定の塩基の部分に表示するようにしたことを特徴としている。
【0014】
請求項6に記載の発明は、請求項1乃至4のいずれか1つに記載の構成に加えて、特定のサンプルデータについて生体分子配列のすべての塩基の読み取り品質予測値を集計し、該特定のサンプルデータの読み取り品質予測値の分布がわかる折れ線グラフを前記クライアント装置のWebブラウザ上に表示すると共に、該折れ線グラフ上の特定の箇所を前記クライアント装置のWebブラウザ上で指定した場合に、該特定の箇所に該当する塩基の読み取り品質予測値と塩基の位置を表示するようにしたことを特徴としている。
【0015】
請求項7に記載の発明は、請求項1乃至4のいずれか1つに記載の構成に加えて、前記トレース調整部でデータ処理されたサンプルデータに付加される付加的情報ファイルのヘッダ情報内のトリミング情報と品質予測情報を変更することにより、前記サンプルデータの読み取り品質予測値を編集するようにしたことを特徴としている。
【0016】
【発明の実施の形態】
以下、この発明に係る実施の形態について図面に従って説明する。
【0017】
図1は、この発明の実施の形態に係る生体分子配列情報の編集サーバのブロック図である。
【0018】
図1に示した実施の形態では、ユーザが使用するパーソナルコンピュータ等のクライアント装置1と離れた場所に、生体分子配列情報を保存しているデータベース2を有する逐次処理サーバ3がある場合を示している。
【0019】
逐次処理サーバ3のデータベース2には、蛍光プライマー法や蛍光ジデオキシ法によりDNAの塩基配列を決定する1個又は複数のDNAシーケンサ(例えば、377DNAシーケンサ(ABI社製)、310DNAシーケンサ(ABI社製))等から出力されるサンプルファイル(ab1ファイル)をデータベース化したDNAの塩基配列やサンプルファイル(ab1ファイル)を解析した(後述するトレース調整部Tによるベースコールの実行)フラグメント解析データ(phdファイル)等のサンプルデータが保存されている。
【0020】
逐次処理サーバ3には、編集サーバ4が接続されており、この編集サーバ4にユーザが使用するクライアント装置1がインターネット5又はイントラネット(図示せず、以下同じ。)等を介して接続できるようになっている。クライアント装置1としては、Windows(登録商標)2000のオペレーションシステムが組み込まれたコンピュータであってjavaアプレット(JDK1.1)が動作する、例えば、インターネットエクスプローラ(登録商標)5.5以上のWebブラウザが使用できるものが好ましいが、これに限られるものではない。
【0021】
そして、編集サーバ4がユーザのクライアント装置1からの目的とする生体分子配列に関するサンプルデータの出力要求を受信した場合に、編集サーバ4が出力要求のあったサンプルデータのみを逐次処理サーバ3のデータベース2から抽出してクライアント装置1へ送信したり、編集サーバ4がクライアント装置1で編集された編集済みサンプルデータの保存要求を受信した場合に、逐次処理サーバ3のデータベース2へ編集済みサンプルデータを保存するようになっている。
【0022】
つまり、編集サーバ4には、クライアント装置1とインターネット5又はイントラネット等を介してデータの送受信を行うための接続部となるWWWサーバ6があり、編集サーバ4の逐次処理サーバ3との接続部には逐次処理サーバ3のデータベース2からサンプルデータをダウンロードし、又は編集済みのサンプルデータを逐次処理サーバ3のデータベース2へアップロードするサンプルデータローダ7がある。
【0023】
また、編集サーバ4は、クライアント装置1が編集サーバ4に接続した時点から所定の期間その使用を可能とするセッション情報Sを生成するセッション情報生成部8と、ダウンロード又はアップロードを実行し、ダウンロードしたサンプルデータDをサンプルデータ部9に保存するサンプルデータダウン・アップロード部10と、ダウンロードしたサンプルデータDのベースコール、読み取り品質予測値QVの演算、トリミング処理を行うトレース調整部Tに処理を実行させその処理結果を受け取るデータ処理実行部11とを有している。このデータ処理実行部11でデータ処理されたベースコール結果、読み取り品質予測値QV、トリミング情報を含んだphdデータは、サンプルデータダウン・アップロード部10へ送られる。
【0024】
波形データから塩基文字を決定するベースコールはDNAシーケンサでも行われているが、トレース調整部Tを使用して再度ベースコールを行うのは、塩基文字の決定の精度を高めるためである。つまり、DNAシーケンサの使用機器、試薬及び電気泳動条件の違いにより、電気泳動で現れるピーク特性は著しく変わるため、サンプルデータの正確な読み取り品質を確保するためには実際にサンプルデータを読み取るときの環境を代表するようなトレーニング用データセットを用いてキャリブレーションを行う必要がある。そこで、この発明の実施の形態では、後工程のトリミングやアセンブルツールが最良の結果をもたらすように、本来の性質を忠実に表現したピークモデルを採用することにより電気泳動で現れるピークを再度分析し、サンプルデータのベースコールの実行と読み取り品質予測値QVを演算することのできるトレース調整部Tを採用している。具体的には、トレース調整部Tとして、トレース・チューナ(Trace Tuner(商標)、パラセル社製)というソフトウエアを使用することができる。
【0025】
その他、編集サーバ4は、常時、逐次処理サーバ3を監視していて、逐次処理サーバ3のデータベース2にDNAシーケンサから新規なサンプルデータが保存される度に、その新規サンプルデータを検出してデータ処理実行部11へ送る新規データ検出部12を有している。さらに、編集サーバ4は、トレース調整部Tで演算された読み取り品質予測値QVを逐次処理サーバ3のデータベース2に保存させるための品質予測値アップロード部13を有している。これにより、ユーザは編集サーバ4によって常に読み取り品質予測値QVが付加された最新のサンプルデータを対象に編集作業をすることができる。
【0026】
WWWサーバ6には、主に逐次処理サーバ3のデータベース2からダウンロードしたサンプルデータDと、演算された読み取り品質予測値QVをクライアント装置1のディスプレイ14に表示するために必要な表示データを生成するための情報生成部15が接続されている。
【0027】
情報生成部15は、逐次処理サーバ3のデータベース2からダウンロードしたサンプルデータD、サンプルデータ部9に作成したサンプルデータ(ab1ファイル)とphdデータ(phdファイル)のURL、トレース調整部Tで演算された読み取り品質予測値QVを、クライアント装置1のディスプレイ14に表示するために必要な表示データを生成する表示データ生成部16の他に、クライアント装置1から受信したトレース調整部Tでのデータ処理に必要なコマンドライン中のパラメータの解析を行うパラメータ解析部17と、セッション情報生成部8にて生成されたセッション情報Sを管理するセッション管理部18と、クライアント装置1からサンプルデータDに対して行われた編集作業の編集結果を保存する編集結果保存部19とを有している。
【0028】
他方、クライアント装置1には、編集サーバ4の情報生成部15から送信されてくるサンプルデータ、セッション情報、編集結果等の表示データをディスプレイ14に映し出すインターネットエクスプローラ(登録商標)等のWebブラウザBが組み込まれている。
【0029】
以下、この発明の実施の形態に係る生体分子配列情報の編集サーバ4の使用方法を、クライアント装置1のディスプレイ14に映し出される各種操作画面と共に説明する。
【0030】
図2は、この発明の実施の形態に係る生体分子配列情報の編集サーバの使用方法を説明した流れ図である。
【0031】
まず、ユーザはクライアント装置1のディスプレイ14に映し出されているログオン画面(図示せず)のユーザID欄とパスワード欄にそれぞれユーザIDとパスワードを入力して、ログオンボタンをクリックしてユーザIDとパスワードを送信することで編集サーバ4にログオン要求をする(ステップS11)。すると、インターネット5又はイントラネット等を介して編集サーバ4にそのログオン要求信号が送信される。
【0032】
このログオン要求信号を編集サーバ4が受信すると、編集サーバ4はユーザ認証を行い、セッション情報生成部8にてセッションIDを含むセッション情報Sを生成すると共に、図3に示したようなサンプルデータ一覧21を含むサンプルデータ選択画面22を情報生成部15で生成し、このサンプルデータ選択画面22と共にセッションIDをクライアント装置1へ送信する(ステップS21)。以後のクライアント装置1と編集サーバ4との送受信は、すべてこのセッションIDに基づいて行われる。
【0033】
編集サーバ4から送信されたサンプルデータ一覧21を含むサンプルデータ選択画面22とセッションIDはインターネット5又はイントラネット等を介してクライアント装置1へ届けられ、クライアント装置1のディスプレイ14に表示される。ここで、このセッションIDの元になるセッション情報Sは編集サーバ4が使用できる有効期限を持っており、有効期限が切れると編集サーバ4の操作ができなくするためのものである。セッション情報Sの有効期限は、システム管理者により編集サーバ4側で設定される。
【0034】
編集サーバ4に常時接続されている逐次処理サーバ3では、プロジェクトというディレクトリとサンプルデータというファイルを階層構造で管理している。したがって、図3に示したようなサンプルデータ選択画面22では、左側のプロジェクト一覧フレーム23と右側のサンプルデータ操作フレーム24が表示され、プロジェクト一覧フレーム23で選択したプロジェクトの下位にあるプロジェクトがサンプルデータ操作フレーム24のプロジェクト一覧25として、また、そのサンプルデータがサンプルデータ操作フレーム24のサンプルデータ一覧21に表示されるようになっている。
【0035】
プロジェクト一覧フレーム23には、プロジェクト又はサンプルデータのキーワード検索ができるようにキーワードが入力できる検索ボックス26が設けられている。
【0036】
サンプルデータ操作フレーム24の下方にはab1ファイルダウンロードボタン27、phdファイルダウンロードボタン28、ab1ファイル+phdファイルダウンロードボタン29及びデータ処理実行ボタン30が横一列に並んで表示されている。
【0037】
ここで、ab1ファイルとは逐次処理サーバ3のデータベース2に保存されているサンプルデータのファイル形式をいい、phdファイルとはab1ファイルに編集サーバ4のトレース調整部Tでデータ処理した際に付加される付加的情報のファイル形式をいう。したがって、逐次処理サーバ3のデータベース2に保存されている未だ編集サーバ4にダウンロードされる前の新規なサンプルデータは、ab1ファイルのみである。このab1ファイルが編集サーバ4にダウンロードされ、トレース調整部Tのデータ処理が行われた場合にはサンプルデータにphdファイルが付加されることになる。そして、このトレース調整部Tのデータ処理が行われたサンプルデータはab1ファイルとphdファイルとが一体となっており、このサンプルデータが逐次処理サーバ3のデータベース2にアップロードされることで、元のサンプルデータ(ab1ファイルのみ)が上書き保存されてab1ファイルとphdファイルとからなるサンプルデータに修正される。
【0038】
つまり、逐次処理サーバ3のデータベース2には、未だ編集サーバ4の編集作業が行われていないサンプルデータ(ab1ファイルのみ)と、編集サーバ4により編集作業を行なわれたサンプルデータ(ab1ファイルとphdファイル)とが共存していると考えればよい。
【0039】
そこで、ユーザはクライアント装置1のディスプレイ14に映し出されているサンプルデータ選択画面22の検索ボックス26にキーワードを入力しキーワード検索するか、又はサンプルデータ一覧21を表示させてからその中から必要とするサンプルデータのab1ファイル及び/又はphdファイルをダウンロードすることとなる。この場合、目的とするサンプルデータの先頭にあるチェックボックス31にチェックマークを入れてから、ab1ファイルダウンロードボタン27、phdファイルダウンロードボタン28、ab1ファイル+phdファイルダウンロードボタン29のいずれかをクリックすることで、それぞれのファイルについて編集サーバ4にダウンロード要求をする(ステップS12)。このとき、クライアント装置1から編集サーバ4へセッションIDと特定のサンプルデータIDが送信される。
【0040】
編集サーバ4では、このクライアント装置1からのダウンロード要求を受信すると、受信したセッションIDと対応したディレクトリをサンプルデータ部9に生成し、生成したディレクトリにダウンロード要求のあったサンプルデータを逐次処理サーバ3のデータベース2からダウンロードして、その結果として、図4に示したようなサンプルデータのURL44の表示されたサンプルデータダウンロード画面42を表示情報生成部15で生成し、その生成したサンプルデータダウンロード画面32をセッションIDと共にクライアント装置1に送信し(ステップS22)、クライアント装置1のディスプレイ14にサンプルデータのURL44が表示されたサンプルデータダウンロード画面42を表示させる。
【0041】
ユーザは、クライアント装置1のディスプレイ14に映し出されたサンプルデータダウンロード画面42を見て、必要とするサンプルデータのURL44を指示してダウンロード要求することで(ステップS13)、編集サーバ4からクライアント装置1にそのサンプルデータを読み込む。
【0042】
以上のように、インターネット5又はイントラネット等を介したデータの送受信を行うに当たって、この発明の実施の形態に係る生体分子配列情報の編集サーバ4では、クライアント装置1に組み込まれたWebブラウザBからのログオン要求毎にセッションIDを生成することとし、その後のデータの送受信をすべてこのセッションIDで管理するようにしている。勿論、セッションIDを生成するときは、同一の既存の有効なセッションIDがないことを確認してから、セッションIDを生成するようにしている。
【0043】
つまり、セッションIDのついたディレクトリを編集サーバ4のサンプルデータ部9に作成して、サンプルデータとサンプルデータの読み取り品質予測値QVとをこのディレクトリに置いて公開するようにしている。また、セッションIDはダウンロード要求を行ったユーザのみが知っていることとなり、セッションID自体、ランダムな24文字の英数字で構成され、他人が推測できないようになっている。したがって、ダウンロード要求を行ったユーザのみがサンプルデータ、サンプルデータの読み取り品質予測値QVをダウンロードできるといった安全性が保たれる。
【0044】
なお、同一のクライアント装置1で複数のWebブラウザBを起動して、それぞれがログオン要求を行った場合には、それぞれ別個のWebブラウザBにそれぞれ異なったセッションIDを生成するようにしている。
【0045】
サンプルデータ一覧表21の各サンプルデータの先頭にはチェックボックス31が配置されており、複数のサンプルデータに対する処理を行う場合には、目的とするサンプルデータの先頭のチェックボックス31をクリックしてチェックを入れて指定し、その後ab1ファイルダウンロードボタン27、phdファイルダウンロードボタン28、ab1ファイル+phdファイルダウンロードボタン29及びデータ処理実行ボタン30のいずれかのボタンをクリックすることで目的とする複数ファイルの一括した処理が実行される。
【0046】
次に、逐次処理サーバ3のデータベース2からab1ファイル又はphdファイルをダウンロードする手順を説明する。
【0047】
まず、図3に示したサンプルデータ選択画面22で、プロジェクト一覧フレーム23でダウンロードを行うサンプルデータのあるプロジェクトを選択し、選択されたプロジェクトに含まれるサンプルデータ一覧表21のうちの特定のサンプルデータのab1アンカー32又はphdアンカー33をクリックすると、対象ファイルのURLが表示されるので、そのURLを指定して対象ファイルを逐次処理サーバ3のデータベース2よりダウンロードして編集サーバ4に保存を指示します。
【0048】
次に、逐次処理サーバ3のデータベース2のサンプルデータに対するトレース調整部Tによるデータ処理を行う手順について説明する。
【0049】
まず、図3に示したサンプルデータ選択画面22で、プロジェクト一覧フレーム23でダウンロードを行うサンプルデータのあるプロジェクトを選択し、選択されたプロジェクトに含まれるサンプルデータ一覧表21のうちからデータ処理を実行するサンプルデータのデータ処理アンカー34をクリックすると、パラメータ設定画面(図示せず)が表示されるので、この画面上で目的とするパラメータを設定し実行ボタンをクリックすると、図5に示したような実行結果ファイルのURL50が表示される。そこで、ユーザはWebブラウザの機能を使用して表示されたURL50に対して対象ファイルの保存を選択することで、この表示されたURL50から逐次処理サーバ3のデータベース2のサンプルデータに対してトレース調整部Tによるデータ処理が実行された対象ファイル(処理結果)のダウンロードをすることができる。この場合、トレース調整部Tによるデータ処理結果は、サンプルデータダウン・アップロード部10により、同時に逐次処理サーバ3のデータベース2にアップロードされるようになっている。
【0050】
なお、パラメータはサンプルデータ毎に指定しても又は複数のサンプルデータのパラメータを1つのグループ(これを、パラメータセットという。)として一度に指定することもできる。当然に、パラメータセットを指定してデータ処理を実行すれば、ユーザが毎回、1つ1つパラメータの確認及び入力作業を行う手間が省けるので都合がよい。
【0051】
次に、この発明の実施の形態に係る生体分子配列情報の編集サーバを使用した編集作業について説明する。
【0052】
図6は、この発明の実施の形態に係る生体分子配列情報の編集サーバの編集画面である。図7は、この発明の実施の形態に係る生体分子配列情報の編集サーバによる編集作業の手順を示した流れ図である。
【0053】
編集画面35の最上部にはコントロールパネル36が表示されており、このコントロールパネル36には、必要とする画面を選択することのできる画面切り替えコンボボックス37と、セットオプションボタン38と、アップデートボタン39とが配置されている。
【0054】
画面切り替えコンボボックス37に表示される表示内容を選択することにより、波形データ、読み取り品質予測値QVを表示する波形データ画面と、ab1ファイルに格納されている情報を一覧形式で表示する注釈画面と、読み取り品質予測値QVのヒストグラムの先端部を結んだ折れ線グラフを表示する品質予測値ヒストグラム画面と、編集している塩基をfasta形式で表示するシーケンス画面のうちから、必要とする画面を選択することができるようになっている。
【0055】
編集サーバ4へのログオン操作から編集サーバ4に対して編集要求をする直前までの操作は、サンプルデータのダウンロード操作で説明した内容(ステップS11→ステップS21→ステップS21→ステップS12)と同じである。
【0056】
サンプルデータのダウンロードの場合には、その後、編集サーバ4に対してダウンロード要求を行うが、編集作業の場合には、編集サーバ4に対して編集要求を行うことになる。
【0057】
つまり、図3に示したサンプルデータ選択画面22で、プロジェクト一覧フレーム23でダウンロードを行うサンプルデータのあるプロジェクトを選択し、選択されたプロジェクトに含まれるサンプルデータ一覧表21のうちから編集対象とするサンプルデータの編集アンカー40をクリックして編集サーバ4に編集要求を行う。ここで、編集要求を行うには、サンプルデータがトレース調整部Tによるデータ処理が行われたphdファイルが付与されていることが条件となる。
【0058】
編集サーバ4では、このクライアント装置1からの編集要求を受信すると、受信したセッションIDと対応したディレクトリをサンプルデータ部9に生成し、生成したディレクトリにサンプルデータを逐次処理サーバ3のデータベース2からダウンロードして、その結果として、図6に示したような編集画面35を情報生成部15で生成し、その生成した編集画面35をセッションIDと共にクライアント装置1に送信し(ステップS23)、クライアント装置1のディスプレイ14に編集画面35を表示させる。
【0059】
そこで、ユーザのクライアント装置1のディスプレイ14には、図6のような編集画面35が表示されるので、コントロールパネル36を塩基変更パネルに切り替えて、塩基配列H上の具体的に編集を行う塩基41を選択して、その塩基41に対して追加、変更、削除のいずれかの操作を指定し編集作業を完了する(ステップS14)。このとき、指定した塩基41の読み取り品質予測値QVの棒グラフを見ることで基準値Kと編集対象としている塩基41の読み取り品質予測値QVとの相違の程度を感覚的に把握できるだけでなく、編集対象としている塩基41の下にその塩基41の塩基の種類、読み取り品質予測値QV、塩基の位置等の値が表示されるようになっているので、塩基情報に関する具体的な数値を知ることができる。
【0060】
その後、アップデートボタン39をクリックして編集結果の保存要求を指示すると、セッションIDと編集結果のphdファイルが編集サーバ4に送信される。
【0061】
編集サーバ4では、クライアント装置1から受信したセッションIDと編集結果のphdファイルに基づいてCGIパラメータの解析が実行され、編集結果のphdファイルをサンプルデータ部9に保存すると共に逐次処理サーバ3のデータベース2にアップロードし、当初のサンプルデータのphdファイルを上書き保存する(ステップS24)。その後、クライアント装置1に対しては、編集結果の保存処理終了コードを送信することで、ユーザに保存処理終了を通知する。
【0062】
図8は、この発明の実施の形態に係る生体分子配列情報の編集サーバにおける読み取り品質予測値QVのヒストグラムの先端部を結んだ折れ線グラフを表示する品質予測値ヒストグラム画面である。
【0063】
品質予測値ヒストグラム画面43に示された折れ線グラフ45aは編集前のサンプルデータの読み取り品質予測値QVを示し、折れ線グラフ45bはトリミングした編集後のサンプルデータの読み取り品質予測値QVを示している。この折れ線グラフの形から、サンプルデータの品質、傾向を推測することが可能となる。また、トリミング前とトリミング後の折れ線グラフを同時に表示することにより、トリミングの効果を確認することができる。
【0064】
次に、読み取り品質予測値QVの変更作業について説明する。
【0065】
図9は、読み取り品質予測値QVの変更作業の手順を示した流れ図である。図10は、phdファイルのデータフォーマット例を示したリストである。
【0066】
サンプルデータの品質予測データ(アルファベットと数字とからなる配列)として、最初に、逐次処理サーバ3のデータベース2からダウンロードしたサンプルデータのphdファイルのヘッダ情報H、読み取り品質予測情報Y、フッタ情報Fをクライアント装置1のメモリに格納する(ステップS31)。次に、格納したメモリ上にあるphdファイルの品質予測情報Yとヘッダ情報Hにあるトリミング情報Mを変更する(ステップS32)。次に、格納したメモリ上にある変更されたphdファイルの読み取り品質予測情報Yとヘッダ情報H及び変更のないフッタ情報Fとから新たなphdファイルを作成する(ステップS33)。この新たに作成されたphdファイルを編集サーバ4のサンプルデータ部9にアップロードすることにより(ステップS34)、元のサンプルデータのphdファイルが上書き保存される。
【0067】
塩基配列の編集作業は、図6に示した波形データWや読み取り品質予測値QVの棒グラフKを見ながら行われ、その場合の塩基の変更の都度、クライアント装置1のメモリ上にあるphdファイルの品質予測情報Yとヘッダ情報Hにあるトリミング情報Mが変更される。
【0068】
以上に記載したとおり、この発明の実施の形態に係る生体分子配列情報の編集サーバ4によれば、クライアント装置1に組み込まれたWebブラウザBからのログオン要求毎にセッションIDを生成することとし、その後のデータの送受信をすべてこのセッションIDで管理するようにしたことで、ダウンロード要求を行ったユーザのみがサンプルデータと、サンプルデータの読み取り品質予測値QVをダウンロード又はアップロードができるといった安全性が保たれるため、インターネット5又はイントラネット等上でサンプルデータが他に流出するようなことのない堅固な安全性を実現することができるようになった。
【0069】
そのため、インターネット5又はイントラネット等上での安全なサンプルデータの取り扱いが可能となり、WebブラウザB上でサンプルデータの編集作業を行えるようになり、生体分子配列情報の編集作業の容易性と迅速性が向上された。
【0070】
【発明の効果】
以上説明したように、請求項1に記載の発明によれば、情報生成部にはWWWサーバが接続されており、かつ外部のクライアント装置からアクセスがあった場合に、該クライアント装置に組み込まれているWebブラウザによるログオン要求毎に特定のセッションIDを生成し、該セッションIDに基づいてその後のデータの送受信を実行するセッション管理部を有するので、ダウンロード要求を行ったユーザの使用する特定のWebブラウザのみがサンプルデータと、サンプルデータの読み取り品質予測値をダウンロード又はアップロードができるといった安全性が保たれるため、インターネット又はイントラネット等上でサンプルデータが他に流出するようなことのない堅固な安全性を実現することができるようになった。
【0071】
請求項2に記載の発明によれば、編集サーバには逐次処理サーバのデータベースからダウンロードしたサンプルデータを保存するサンプルデータ部を有し、該サンプルデータ部にはセッションIDと対応する特定のディレクトリを作成し、その後のクライアント装置からの要求によるサンプルデータに関するデータ処理の結果はこの特定のディレクトリに保存されるようにしたので、編集サーバが生成したセッションID毎に別個のディレクトリによってデータが管理されることとなるため、請求項1の効果に加えて、一層データの安全性が確保できる。
【0072】
請求項3に記載の発明によれば、サンプルデータローダには、クライアント装置からの要求によりサンプルデータのダウンロードとアップロードの制御を行うサンプルデータダウン・アップロード部が接続されており、該サンプルデータダウン・アップロード部にはサンプルデータの読み取り品質予測値を演算するトレース調整部を制御するデータ処理実行部が接続されており、該データ処理実行部はトレース調整部で演算された読み取り品質予測値とダウンロードしたサンプルデータとを表示情報生成部へ送出するので、請求項1又は2の効果に加えて、クライアント装置のWebブラウザ上でサンプルデータの読み取り品質予測値を確認しながら編集作業をすることができる。
【0073】
請求項4に記載の発明によれば、データ処理実行部には逐次処理サーバのデータベースを常時監視する新規データ検出部が接続されており、該新規データ検出部は逐次処理サーバのデータベースに新たに保存された新規サンプルデータを検出した結果をデータ処理実行部に送出し、新規サンプルデータに対してトレース調整部の演算処理を実行するようにしたので、請求項1乃至3のいずれか1つに記載の効果に加えて、最新のサンプルデータのダウンロードとサンプルデータへの読み取り品質予測値の付与及び読み取り品質予測値が付与されたサンプルデータのアップロードを自動で処理するようになっているため、編集作業を行うユーザの負担が大幅に軽減される。
【0074】
請求項5に記載の発明によれば、特定のサンプルデータについて生体分子配列の各塩基の読み取り品質予測値をクライアント装置のWebブラウザ上に棒グラフで表示し、該棒グラフで表示された特定の塩基を前記クライアント装置のWebブラウザ上で指定した場合に、その塩基の種別、読み取り品質予測値、塩基の位置を特定の塩基の部分に表示するようにしたので、請求項1乃至4のいずれか1つに記載の効果に加えて、編集対象の塩基の読み取り品質予測値の基準値との差異が直感的に把握できると共に、その数値的な塩基情報の確認もできるから、サンプルデータの読み取り品質予測値の付加や変更が容易に行えるようになった。
【0075】
請求項6に記載の発明によれば、特定のサンプルデータについて生体分子配列のすべての塩基の読み取り品質予測値を集計し、該特定のサンプルデータの読み取り品質予測値の分布がわかる折れ線グラフを前記クライアント装置のWebブラウザ上に表示すると共に、該折れ線グラフ上の特定の箇所をクライアント装置のWebブラウザ上で指定した場合に、該特定の箇所に該当する塩基の読み取り品質予測値と塩基の位置を表示するようにしたので、請求項1乃至4のいずれか1つに記載の効果に加えて、折れ線グラフの形から、サンプルデータの品質、傾向を推測することが可能となり、トリミング前とトリミング後の折れ線グラフを同時に表示することにより、トリミングの効果を確認することができる。
【0076】
請求項7に記載の発明によれば、トレース調整部でデータ処理されたサンプルデータに付加される付加的情報ファイルのヘッダ情報内のトリミング情報を変更することにより、サンプルデータの読み取り品質予測値を編集するようにしたので、請求項1乃至4のいずれか1つに記載の効果に加えて、サンプルデータの読み取り品質予測値の付加や変更が容易に行えるようになった。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る生体分子配列情報の編集サーバのブロック図である。
【図2】この発明の実施の形態に係る生体分子配列情報の編集サーバの使用方法を説明した流れ図である。
【図3】同生体分子配列情報の編集サーバのサンプルデータ選択画面である。
【図4】同生体分子配列情報の編集サーバのサンプルデータダウンロード画面である。
【図5】同生体分子配列情報の編集サーバの実行結果画面である。
【図6】同生体分子配列情報の編集サーバの編集画面である。
【図7】同生体分子配列情報の編集サーバによる編集作業の手順を示した流れ図である。
【図8】同生体分子配列情報の編集サーバにおける読み取り品質予測値のヒストグラムの先端部を結んだ折れ線グラフを表示する品質予測値ヒストグラム画面である。
【図9】読み取り品質予測値の変更作業の手順を示した流れ図である。
【図10】サンプルデータに付加される付加的情報ファイルのデータフォーマット例を示したリストである。
【符号の説明】
1 クライアント装置
2 データベース
3 逐次処理サーバ
4 編集サーバ
5 インターネット
6 WWWサーバ
7 サンプルデータローダ
8 セッション情報生成部
9 サンプルデータ部
10 サンプルデータダウン・アップロード部
11 データ処理実行部
12 新規データ検出部
13 品質予測値アップロード部
14 ディスプレイ
15 情報生成部
18 セッション情報管理部
19 編集結果保存部
D サンプルデータ
S セッション情報
T トレース調整部
QV 読み取り品質予測値

Claims (7)

  1. 核酸配列やタンパク質アミノ酸配列等の生体分子配列のサンプルデータが多数蓄積されているデータベースを有する逐次処理サーバに接続され、前記データベースに保存されているサンプルデータから所望のサンプルデータをダウンロードし、かつ該ダウンロードしたサンプルデータを編集した編集済みサンプルデータを前記データベースに保存するサンプルデータローダと、前記ダウンロードしたサンプルデータとその編集結果とをディスプレイに表示できる表示データを生成する情報生成部とを有する編集サーバであって、 前記情報生成部にはWWWサーバが接続されており、かつ外部のクライアント装置からアクセスがあった場合に、該クライアント装置に組み込まれているWebブラウザによるログオン要求毎に特定のセッションIDを生成し、該セッションIDに基づいてその後のデータの送受信を実行するセッション管理部を有することを特徴とする生体分子配列情報の編集サーバ。
  2. 前記編集サーバには前記データベースからダウンロードしたサンプルデータを保存するサンプルデータ部を有し、該サンプルデータ部には前記セッションIDと対応する特定のディレクトリを作成し、その後の前記クライアント装置からの要求によるサンプルデータに関するデータ処理の結果は前記特定のディレクトリに保存されるようにしたことを特徴とする請求項1に記載の生体分子配列情報の編集サーバ。
  3. 前記サンプルデータローダには、前記クライアント装置からの要求によりサンプルデータのダウンロードとアップロードの制御を行うサンプルデータダウン・アップロード部が接続されており、該サンプルデータダウン・アップロード部には前記サンプルデータの読み取り品質予測値を演算するトレース調整部を制御するデータ処理実行部が接続されており、該データ処理実行部は前記トレース調整部で演算された読み取り品質予測値と前記ダウンロードしたサンプルデータとを前記表示情報生成部へ送出することを特徴とする請求項1又は2に記載の生体分子配列情報の編集サーバ。
  4. 前記データ処理実行部には前記逐次処理サーバのデータベースを常時監視する新規データ検出部が接続されており、該新規データ検出部は前記逐次処理サーバのデータベースに新たに保存された新規サンプルデータを検出した結果を前記データ処理実行部に送出し、前記新規サンプルデータに対して前記トレース調整部の演算処理を実行するようにしたことを特徴とする請求項1乃至3のいずれか1つに記載の生体分子配列情報の編集サーバ。
  5. 特定のサンプルデータについて生体分子配列の各塩基の読み取り品質予測値を前記クライアント装置のWebブラウザ上に棒グラフで表示し、該棒グラフで表示された特定の塩基を前記クライアント装置のWebブラウザ上で指定した場合に、その塩基の種別、読み取り品質予測値、塩基の位置を前記特定の塩基の部分に表示するようにしたことを特徴とする請求項1乃至4のいずれか1つに記載の生体分子配列情報の編集サーバ。
  6. 特定のサンプルデータについて生体分子配列のすべての塩基の読み取り品質予測値を集計し、該特定のサンプルデータの読み取り品質予測値の分布がわかる折れ線グラフを前記クライアント装置のWebブラウザ上に表示すると共に、該折れ線グラフ上の特定の箇所を前記クライアント装置のWebブラウザ上で指定した場合に、該特定の箇所に該当する塩基の読み取り品質予測値と塩基の位置を表示するようにしたことを特徴とする請求項1乃至4のいずれか1つに記載の生体分子配列情報の編集サーバ。
  7. 前記トレース調整部でデータ処理されたサンプルデータに付加される付加的情報ファイルのヘッダ情報内のトリミング情報と品質予測情報を変更することにより、前記サンプルデータの読み取り品質予測値を編集するようにしたことを特徴とする請求項1乃至4のいずれか1つに記載の生体分子配列情報の編集サーバ。
JP2002214124A 2002-07-23 2002-07-23 生体分子配列情報の編集サーバ Pending JP2004054775A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002214124A JP2004054775A (ja) 2002-07-23 2002-07-23 生体分子配列情報の編集サーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002214124A JP2004054775A (ja) 2002-07-23 2002-07-23 生体分子配列情報の編集サーバ

Publications (1)

Publication Number Publication Date
JP2004054775A true JP2004054775A (ja) 2004-02-19

Family

ID=31936534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002214124A Pending JP2004054775A (ja) 2002-07-23 2002-07-23 生体分子配列情報の編集サーバ

Country Status (1)

Country Link
JP (1) JP2004054775A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015515042A (ja) * 2012-02-28 2015-05-21 コーニンクレッカ フィリップス エヌ ヴェ コンパクトな次世代シーケンシングデータセット及び該データセットを使用した効率的な配列の処理

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015515042A (ja) * 2012-02-28 2015-05-21 コーニンクレッカ フィリップス エヌ ヴェ コンパクトな次世代シーケンシングデータセット及び該データセットを使用した効率的な配列の処理

Similar Documents

Publication Publication Date Title
CA2594633C (en) Computer-implemented method and computer-based system for validating dna sequencing data
AU2005315448A1 (en) Information collection system
CN111009289B (zh) 一种基于云计算的RNA-seq在线报告流程分析方法及系统
US20010011275A1 (en) Distributive web page management system
CN110544508A (zh) 一种单基因遗传病基因的分析方法、装置及电子设备
US20010054044A1 (en) Method for monitoring and browsing database of test system
CN114067986A (zh) 医疗设备配置方法、系统、计算机设备以及存储介质
JP2004054775A (ja) 生体分子配列情報の編集サーバ
CN116110598A (zh) 基于本地化的数据分析可视化交互系统及方法
CN111798021A (zh) 作业工时预测系统以及生产计划制定辅助系统
CN117278649A (zh) 磁共振系统、磁共振设备的扫描方法和计算机设备
JP2002005940A (ja) 分析機器用データ管理装置
WO2002025436A2 (en) Remote computer configuration scanning
EP1706800B1 (en) Method and apparatus for the development of a control process for an instrument
JP2003256606A (ja) サービス品質評価指標選定装置、方法、プログラム及びプログラム記録媒体
JP4430908B2 (ja) マルチウィンドウ表示制御装置およびこれを使用するコンピュータシステム
US20080262671A1 (en) Vehicle Quality Analyzing System and Plural Data Management Method
US20240211621A1 (en) Information processing method, server apparatus, client apparatus, and system
CN116304263A (zh) 一种应用于电子档案系统的四性检测方法及系统
US20220147573A1 (en) Search condition presentation apparatus, search condition presentation method, and recording medium
EP4390949A1 (en) Computer program, server apparatus, client apparatus, system, method implemented by server apparatus, and method implemented by client apparatus
JP3631556B2 (ja) 電子制御装置用のデータ更新装置
JP2003099457A (ja) コンテンツ表示方法及びその表示システム並びにその表示プログラム
CA2598636A1 (en) Vehicle quality analyzing system and program file management method
JP2679765B2 (ja) タンパク質二次構造シミュレーションシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081224