JP2005250615A - 遺伝子解析支援システム - Google Patents

遺伝子解析支援システム Download PDF

Info

Publication number
JP2005250615A
JP2005250615A JP2004057116A JP2004057116A JP2005250615A JP 2005250615 A JP2005250615 A JP 2005250615A JP 2004057116 A JP2004057116 A JP 2004057116A JP 2004057116 A JP2004057116 A JP 2004057116A JP 2005250615 A JP2005250615 A JP 2005250615A
Authority
JP
Japan
Prior art keywords
peak
gene
data
information
base sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004057116A
Other languages
English (en)
Inventor
Masumi Abe
真澄 安倍
Naoichi Sasaki
直一 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MESSENGERSCAPE KK
National Institute of Radiological Sciences
Original Assignee
MESSENGERSCAPE KK
National Institute of Radiological Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MESSENGERSCAPE KK, National Institute of Radiological Sciences filed Critical MESSENGERSCAPE KK
Priority to JP2004057116A priority Critical patent/JP2005250615A/ja
Publication of JP2005250615A publication Critical patent/JP2005250615A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 解析における手作業の軽減やデータの蓄積、整理及び検索の簡便化を達成するための、遺伝子発現プロファイルの解析方法における作業結果の処理及びその保存に最適なシステムを提供する。
【解決手段】 本発明の遺伝子解析支援システム1において、サーバー2上に置かれているピークデータベース管理手段3は、波形データ記憶手段31、塩基配列記憶手段32、ピーク情報記憶手段33を含む。これらの記憶手段に記憶させるデータは、クライアントマシン等の入力端末4を使用して、入力支援ソフトなどを介することなどにより入力することができる。そして、これらのデータが管理されているピークデータベース管理手段3のデータベースの内容は、入力端末4から入力された要求にしたがって、その内容を出力装置5から出力することができるように構成されている。
【選択図】 図1

Description

本発明は、遺伝子解析により得られるデータに関するコンピュータやネットワーク上でのデータベースの構築とその利用を通じて遺伝子解析を支援するためのシステムに関するものであり、特に、国際公開第02/48352号パンフレットに開示されているような高カバー率遺伝子発現プロファイル解析法(HiCEP法)により得られる波形データを解析する際に有用な遺伝子解析支援システムに関する。
生体内でどの遺伝子がどの程度発現しているかを解明すること、所謂遺伝子発現ネットワークの解明は、オーダーメイド治療等を開発するために欠くことのできない重要な技術事項である。この遺伝子ネットワークの解明には、ある時点において生体内でどの遺伝子がどの程度発現しているかを示す遺伝子発現プロファイルの作製が必須である。これまで、遺伝子発現プロファイルの作製方法として、ディファレンシャルディスプレイ法、遺伝子発現の逐次分析法(SAGE)、DNAマイクロアレイまたはDNAチップを用いる方法、及び上記のHiCEP法などが開発・実用化されている。これらのうちHiCEP法は、特に未知の遺伝子を含む広範囲の遺伝子をカバーする遺伝子発現プロファイルを簡便に作製することができる点で優れた方法である。
従来、HiCEP法を利用して遺伝子の発現頻度を解析する場合、2〜5個のHiCEP法による測定結果を、測定器に付属するソフトウェア等を使用して研究者が手作業で解析していた。しかしながら、このような測定器付属のソフトウェアは、本来HiCEP法による解析以外の分析を目的として設計されたものであり、その機能が極めて限られたものであった。その結果、HiCEP法による測定結果の比較対照のために波形データを解析するたびに解析するデータを手動で選んで呼び出す必要が生じ、その上でさらに解析結果を書き写すかあるいは結果を表示したコンピュータ画面のコピー等を保存しておく必要があった。このような作業は、1回の測定で256から512個の波形データが出力されるHiCEPの場合、多大なる労力を要するものとなる。測定対象であるサンプルの発現頻度解析をより厳密に行なうという観点からは、サンプル数は可能な限り多いのが望ましいが、5個以上のサンプルについて上記のような作業を行うことは、非現実的である。
HiCEP法により得られた波形データから発現を示している遺伝子を同定するには、まず波形を形成しているcDNA断片を1つずつ取り出し、各断片についてその塩基配列を決定する必要がある。次いで、決定された塩基配列を、NCBI(米国立医学図書館(NLM: National Libray of Medicine)の生物工学情報センター(NCBI: National Center for Biotechnology Information) )などが提供するWEBシステムで公共データベース上の塩基配列と照合(ホモロジー検索)する必要があるが、従来このホモロジー検索は逐一手作業により行われていた。さらに、従来法では、ホモロジー検索により得られた結果を手作業で写し取るかコンピューターのコピー・アンド・ペースト機能を利用して記録し、Excel(登録商標)などの市販ソフトを用いてまとめていた。しかしながら、1つのサンプルから得られる塩基配列の種類は、マウス培養細胞では約40,000種もあるため、これらを逐一手作業で処理するのは著しく困難である。また、このようにして蓄積した遺伝子情報を、他のサンプルのHiCEP法による解析から得られた波形データに適用する場合、従来法では研究者の記憶や実験ノート等の履歴をたどって該当データを抜き出したり、コンピュータの例えば日付順に作成されたファイルに書き込まれた各データを検索して該当データをプリントアウトしたりして検討するなどのほか手段がなかった。
国際公開第02/48352号パンフレット
したがって、従来の遺伝子発現プロファイルの解析方法における作業結果の処理及びその保存のシステムをできる限り好ましい形で提供し、手作業の軽減やデータの蓄積、整理及び検索の簡便化を図ることは、膨大な情報を扱うこの領域において必要不可欠である。
特に、HiCEP法の場合、この方法自体が、そのサンプルに発現している遺伝子の70%以上を検出しているという特徴を備えているため、上記のような要請を充足することによりサンプルのコレクションを増やすことができれば、生体に発現している遺伝子のカタログ化を行うことが現実的に可能となる。例えば、マウスの各臓器細胞をサンプルとした場合、マウスのそれぞれの臓器でどのような遺伝子が発現しているかを網羅的に示すことができると考えられる。
また、HiCEP法を利用する場合、それ自体データ上で複数のサンプルを比較することが可能な方法であることから、同法により得られた遺伝子の発現頻度(発現プロファイリング)のデータをサンプルごとに蓄積しておき、蓄積しておいたデータ同士、あるいは蓄積しておいたデータと新たに取得したデータとを効率よく比較することを可能とするシステムを確立することができれば、特に有用である。このようなデータ比較の具体例として、同一のマウスの肝臓細胞につき、病気の時のプロファイリングデータを取得し、過去に蓄積されていた正常な時のプロファイリングのデータと比較して、発現している遺伝子は同じである一方その量的な変動が観察されることに着目し、効果の期待できる治療薬を投与した後に新たに取得したデータを蓄積されているデータと再度比較して、その効果を認証することが考えられる。
上記システムの他の利点として、次のようなことが考えられる。すなわち、2つ以上の異なるサンプルについてHiCEP法により得られた波形データを解析する際、そこに発現している遺伝子が同一であるか否かを判断するためには、厳密には、波形を形成している各々のcDNA断片を取り出して、それらの塩基配列を比較する必要がある。一方、同一個体の同一細胞由来のものであって刺激が異なるような、相互に近い関係にあるサンプルの場合には、同一ピーク位置(HiCEP法に於いては、対応する波形ファイルに於けるピーク位置)に出現する波形は同一遺伝子に由来するものと類推することができる。このような場合に、あらかじめ一度取得した各ピークに於けるcDNA断片の塩基配列とそのピーク位置についてのデータを蓄積しておき、必要が生じたときにその蓄積されたデータを迅速に検索し、対応する波形部分あるいは遺伝子に関する情報が見つかればそれを出力することを可能とするシステムが確立されていれば、そのようなシステムを利用することにより遺伝子予測を簡便に行うことができるため、新しく研究テーマを得るたびに新たにcDNA断片を取り出してその塩基配列を比較するという作業が不要となる。
さらに、同一種のマウスの異個体同一臓器由来のサンプルのように遠い関係にあるサンプル間の比較を行う場合においても、上記のようなシステムによれば、同一位置に出現する波形は同一遺伝子由来であると仮定することにより、新たに取得したデータにおいて観察された波形の変動が、既に蓄積されているデータにおいて確認されている変動の範囲内であるか否かを即座に判断し、その範囲内であれば当該データについてさらなる解析を行うことは不要であると直ちに判定することが可能となる。
なお、上記においては遺伝子発現プロファイルの作製方法としてHiCEP法を採用した場合について専ら記載したが、上記システムは、ディファレンシャルディスプレイ法に代表される他の遺伝子発現プロファイル作製方法により得られるデータに適用することも可能である。
すなわち、本発明は、遺伝子解析により得られる波形データを記憶する、波形データ記憶手段、前記波形データに含まれるピークについて決定された塩基配列を記憶する、塩基配列記憶手段、前記塩基配列が決定されたピークについての情報を記憶する、ピーク情報記憶手段、前記塩基配列及び該塩基配列に対応する前記ピークについての情報を含むデータベースを出力する、データベース出力手段を含む、遺伝子解析支援システムを提供する。
前記遺伝子解析により得られる波形データは、HiCEP法により得られる波形データであるのが好ましい。
また、前記ピークに対応する塩基配列は、ダイレクトシーケンス法及び/またはショットガンシーケンス法により得られる塩基配列であるのが望ましい。
本発明は、さらに、前記塩基配列を用いたホモロジー検索により得られる遺伝子情報を記憶する、遺伝子情報記憶手段を含み、前記データベース出力手段により該遺伝子情報が出力される、上記遺伝子解析支援システムを提供する。
本発明の遺伝子解析支援システムにおいて、前記波形データが、該波形データに含まれるピークについての発現頻度データを含むようにすることも可能である。
本発明によれば、遺伝子発現プロファイルの解析方法における作業結果の処理及びその保存に最適なシステムが提供されることにより、解析における手作業の軽減やデータの蓄積、整理及び検索の簡便化が達成される。
以下に、本発明の実施の形態を説明する。
図1は、本発明の遺伝子解析支援システムの適用を示すブロック図である。
本発明の遺伝子解析支援システム1において、サーバー2上に置かれているピークデータベース管理手段3は、波形データ記憶手段31、塩基配列記憶手段32、ピーク情報記憶手段33を含む。これらの記憶手段に記憶させるデータは、クライアントマシン等の入力端末4を使用して、入力支援ソフトなどを介することなどにより入力することができる。そして、これらのデータが管理されているピークデータベース管理手段3のデータベースの内容は、入力端末4から入力された要求にしたがって、その内容を出力装置5から出力することができるように構成されている。
波形データ記憶手段31には、HiCEP法などにより得られる波形のイメージデータ及びその波形に含まれるピークの位置についての情報が記憶されている。また、波形データ記憶手段31には、HiCEP法などの解析の際に使用した酵素順や末端セレクションなどの条件についてのデータ、及び着目したピークに付されたピーク番号や波形ファイル名などのファイル管理のためのデータを記憶させておくことができる。さらに、波形データ記憶手段31には、HiCEP法などにより位置を特定したピークについてのピーク高さ及びピーク面積などの波形数値情報を記憶させておくことができる。
なお、波形データ記憶手段は、得られた波形データをイメージデータとして記憶する他、ベクトルデータ、あるいは他のデータ形式で記憶することもでき、また一つのデータベースを多数のファイルに分割して記憶してもよい。
塩基配列記憶手段32及びピーク情報記憶手段33には、それぞれ波形データに含まれるピークについて決定された塩基配列、及び塩基配列が決定されたピークについての情報が記憶されている。これら塩基配列及びピークについての情報は、次のような手法により獲得される。
塩基配列記憶手段32に記憶させる塩基配列は、遺伝子解析により得られる波形データとしてHiCEP法により得られる波形データを採用した場合、まずHiCEP産物をライブラリにしてショットガンシーケンスを行い、得られた配列をクラスタリングして代表配列を決定する、所謂ショットガンシーケンス法を利用するか、あるいはHiCEP産物をPAGEなどのゲルに展開し、バンドを打ち抜き、シーケンスする、所謂ダイレクトシーケンス法を利用するか、あるいはこれらを併用して、HiCEP産物ライブラリーのできるだけ多数のcDNA断片、望ましくは全てのcDNA断片について、塩基配列を決定することにより獲得する。
次に、ピーク情報記憶手段33に記憶させるピークについての情報は、得られたcDNA断片について、再度、HiCEP法を行なった時と同じ駆動条件の下での電気泳動を行い、各cDNA断片がどの位置に出現するかを確認することにより獲得する。HiCEP法などにより位置を特定したピークについてこのような確認作業を行なう理由は、DNAの塩基配列数(鎖長)から計算によって求めた電気泳動の出現位置が、実際の電気泳動の出現位置とは大きく異なる場合があるとの知見に基づくものである。例えば、塩基配列数が100塩基のDNAであるにもかかわらず、電気泳動ではそのDNAに由来するピークが102塩基の位置に出現することが観察される場合がある。したがって、DNAの塩基配列から計算される電気泳動の出現位置をピークの情報として採用すると、後にHiCEPから得られた波形データのピークをそのピークの塩基配列と対応させる際に、誤った対応を引き起こす原因になる。このような誤りを防止するため、本発明の遺伝子解析支援システムでは、再電気泳動を行うことにより確認されたピークについての情報をピーク情報記憶手段33に記憶させることとしている。
なお、ピーク情報記憶手段には、上記再電気泳動により特定されたピーク位置に加えてピーク高さ、ピーク面積などを記憶させておくことができる。この場合において、これらピーク位置、ピーク高さ及びピーク面積などのデータを、再電気泳動の結果を解析する際に全て一緒に記憶させてもよく、あるいはピーク情報が必要とされるピークの位置のみを最初に記憶させておき、そのピーク位置に関する他の情報を追記していく方法によりピークについての情報を記憶させることもできる。
なお、入力端末4は、キーボードなどのサーバ2にデータを入力する手段を含む。また、出力装置5は、サーバ2に記憶されたデータの一部あるいは全部を、モニターに出力する手段、あるいはプリントアウトする手段を含む。
本発明の遺伝子解析支援システム1は、さらに、ピークデータベース管理手段3の塩基配列記憶手段32に記憶されている塩基配列を用いて、ネットワーク接続手段6、インターネット7、外部のネットワーク接続手段8及びサーバ9を会して、公共データベースあるいはAssEST(登録商標、株式会社メイズ製)に代表されるような公共データを編集した市販(私的)データベースであるデータベース10に対してホモロジー検索を行うことにより得られる遺伝子情報を、サーバー2上に設けられた遺伝子カタログ管理手段11に含まれる遺伝子情報記憶手段111に記憶させるものとすることができる。具体的には、遺伝子カタログ管理手段11に含まれる遺伝子情報記憶手段111には、ピークデータベース管理手段3の塩基配列記憶手段32に記憶されている塩基配列について、データベース10、例えば、GenBankなどの大規模なデータベースに対して、BLASTなどのホモロジー検索ソフトを使用して検索を行い、得られた検索結果を、ホモロジー検索ソフトへ投入する塩基配列(Query)と検索結果の一致度などに応じて例えばピーク番号をインデックスとして整理して記憶させる。遺伝子カタログ管理手段11の内容は、入力端末4から入力された要求にしたがって、その内容を出力装置5から出力することができるように構成されている。遺伝子カタログ管理手段11に含まれる遺伝子情報記憶手段111の内容に関するデータ項目には、塩基配列のほかLOCUS、DEFINITION、Accession No.等が含まれる。
ピークデータベース管理手段3に含まれる波形データ記憶手段31に記憶された波形データの多数のピークの内で、ピーク情報記憶手段にピーク情報が記憶されているピークに対しインデックスを付けることができる。
そしてそのインデックスを付けたピークを、ピークデータベース管理手段3に含まれるピーク情報記憶手段33に記憶された対応するピーク情報と互いにリンクさせること事ができる。
すなわち、波形データのインデックス付きピークをマウスなどでポイントすると、対応するピーク情報が表示される、あるいは波形データのピーク値軸を多数に分割しておき(HiCEP方を使用するとそのようになる)、その一分割範囲をポイントすると、その範囲に含まれるピーク情報の記憶部が表示されるようになどもできる。あらかじめそのようにしておくと、波形データの所定のピークからそのピーク情報が即時に知りたいとき、あるいはピーク情報からその前後の波形の状況を知りたいときなどに便利である。
本発明の遺伝子解析支援システム1を有効に使用するために、さらに次のようなデータベースを構築することが望ましい。すなわち、この目的のために構築する発現プロファイリングデータベースは、HiCEP法などにより得られる波形データのほか、サンプル名、由来、状態、条件、日付けなどのサンプル情報、HiCEP解析場所、研究者名、酵素順、末端セレクション配列等についての情報を記憶している。発現プロファイリングデータベースはさらに、上記波形データから得られたピークについての情報を記憶している。この発現プロファイルデータベースも、サーバー2上に設けられた管理手段に含まれる記憶手段に記憶させるのが好ましい。
さらに、比較検索ソフトウエアを利用して、ピークデータベース管理手段3に含まれる波形データ記憶手段31、塩基配列記憶手段32、ピーク情報記憶手段33、遺伝子カタログ管理手段11に含まれる遺伝子情報記憶手段111、及び上記発現プロファイリングデータベースに記憶されているデータを検索することにより、遺伝子発現プロファイルの解析を迅速かつ簡便に行うことが可能となる。なお、上記比較検索ソフトウエアも、サーバー2上に設けることができる。
以下、本発明の実施例について図に基づいて説明する。
[ピークデータベースの構築]
図2は、本発明の遺伝子解析支援システムにおいて、HiCEP法により得られるデータからピークデータベースを構築する手順を示す説明図である。
まず、HiCEPピークを、波形ファイル名(この場合030613-2F05FAM)で分類し、図3に示すようなイメージファイルとして記憶した。
次に、HiCEP法により得られるPCR産物は、遺伝子転写産物(mRNA)をcDNA化したDNA断片であり、そのDNA断片がピークを形成するため、ピークデータベースを作成するに当たっては、そのcDNA断片の種類と個々の完全な塩基配列を求める必要がある。この作業に応用できる技術としてショットガンシーケンス法とダイレクトシーケンス法があり、本実施例においては、先ずショットガンシーケンス法を用い大部分のcDNAを決定し、不足した部分をダイレクトシーケンス法にて補った。しかしながら、cDNA配列を決定する為に用いられる方法はこれらに限定されるものではなく、また、これらの併用の順序も限定されるものではない。
(A)ショットガン法 − プラスミドライブラリにして分取する方法:
HiCEPのPCR産物は、既に、HiCEP工程で用いられたセレクションプライマー毎のcDNAライブラリーに分けられており、具体的には、PCR産物の入ったよう容器ごとに、AA-AAなどの場合分け(セレクションPCR)がなされている。これらのセレクションPCR 産物の末端には、シーケンサーで検出する為に蛍光標識がなされており、このままではプラスミドへクローニングできない。そこで、これらセレクションPCR産物を、蛍光標識がなされていないHiCEPプライマーを用いて、再度PCR増幅する(セレクティブcDNAライブラリー)。
セレクティブcDNAライブラリーを市販されているシーケンスベクターにライゲーションし、大腸菌へ形質転換した(工程(i))。
得られた大腸菌コロニーを、セレクション当たり平均500個程度拾い上げた(工程(ii))。
これを、さらにPCRやTempliPhi DNA Amplification Kit(アマシャムバイオサイエンス株式会社製)により、シーケンスプライマー配列部分を含む形でcDNA(インサート部分)を増幅し、増幅されたインサートをシーケンス反応に掛け、シーケンスし、塩基配列の決定を行なった(工程(iii))。
上記工程内での歩留まりにより、一つのセレクティブcDNAライブラリー当たり、平均400個のcDNA配列が得られ、512セレクションで約204,800個の塩基配列が得られた。これらの塩基配列は、セレクション毎にクラスタリング処理され、得られたクラスターの結果から各クラスター代表配列を決定した(工程(iv))。
次に、HiCEP法の解析結果(HiCEPピーク)に対して、この代表配列を割り当てる為に、各クラスター代表配列に相当する上述の増幅されたインサートの一部をHiCEPと同じ条件の電気泳動に供し、ピークの出現する位置を確認した(工程(v))。これにより、正確にHiCEPピークと各クラスター代表配列を結びつけることができると同時に、ショットガン法で解析できなかったHiCEPピークを確認できた。この解析できなかったピークは次のダイレクトシーケンスで補われた。
(B)ダイレクトシーケンス法 − 電気泳動で分離し、ゲルを切り出して分取する方法:
HiCEPのPCR産物を20x40cmのPAGEゲルで電気泳動した。HiCEPのPCR産物には既に蛍光標識がなされているため、電気泳動したPAGEゲルを市販の蛍光イメジャーなどで測定するとHiCEP-ピークに対応したバンドイメージが得られた。
ショットガン法で解析できなかったピークとバンドを確認し、このバンドを切り取った。
切り取ったバンドをTEバッファーに浸し、ゲル中のcDNAを溶出した。溶出したcDNAをPCRにて増幅し、シーケンス反応、シーケンス解析をし、塩基配列を決定した。
約50%のバンドは、他のバンドからのcDNAのコンタミネーションによりシーケンス解析が行なえない現象があったため、これらについては、シーケンスベクターにライゲーションし、大腸菌へ形質転換した。得られた、大腸菌コロニーを30個程度拾い上げ、さらにPCRやTempliPhi DNA Amplification Kitにより、シーケンスプライマー配列部分を含む形でcDNA(インサート部分)を増幅した。増幅されたインサートをシーケンス反応に掛け、シーケンスし、塩基配列の決定を行なった。先に塩基配列を決定した物と大腸菌から増幅した物は、共に、HiCEPと同じ条件の電気泳動に供し、ピークの出現する位置を確認し、正確にHiCEPピークと結びつけた。
(C)ピークデータベースへの記憶
イメージファイル中の各HiCEPピークについて名前を付け、そのピークに対するHiCEP測定結果情報である、酵素順、末端セレクション、波形ファイル名、ピーク位置を記憶し、更に、ショットガン法あるいはダイレクト法により解析した塩基配列情報を割り当てて記憶し、ピークデータベースのテーブルを構築した。波形ファイルについては、そのイメージファイルにリンクを貼った。例えば、図3中に示されているピークp1(ピーク番号 MuES-PEAGGG40000)及びピークp2(ピーク番号MuES-PEAGGG43305)を有する波形データの場合には、下記表1に示すように情報が記憶される。









Figure 2005250615
[遺伝子カタログの構築]
ピークデータベースに記憶されているSequence3'-5'の塩基配列を米国National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/)のWebサイトにてBLASTサーチをし、相同する遺伝子情報を得た。得られた結果を図4に示す。この結果から、タイトル 、LOCUS 、DEFINITION 、ACCESSION、ORIGINの情報を取得し、整理番号に対応して遺伝子カタログに記憶した。例えば、上記図3中に示されているピークp1(ピーク番号 MuES-PEAGGG40000)の場合は、下記表2に示すように情報が記憶される。
Figure 2005250615
[発現プロファイリングデータベースの構築]
HiCEP測定を行なう毎に、HiCEP波形データと各ピークの値(ピーク面積、ピーク位置、ピーク高さなど)を記憶する。ある一つのサンプルのHiCEP測定を行なうと1個あるいは最大512個の波形ファイルが得られる。波形ファイルをサンプル情報とリンクする為に、下記表3に示すようなファイル管理リストを構築する。
Figure 2005250615
データとして記憶する波形ファイルの形式は、TIF、GIFなどの一般的なイメージファイル形式で良いが、望ましくは、再解析をすることを可能にする為に、電気泳動波形解析ソフトであるアプライドバイオシステムズ社製GeneScan(登録商標)のファイル形式などで保存することが望ましい。例えば、表3中の波形ファイル名030718-L1-1A01FAMは、図5に示すような波形ファイルである。
このような波形ファイルはイメージファイルであり、このファイルから予めGeneScan(登録商標)等で解析した数値情報、すなわちピークの位置を示すピーク位置、ピークの高さ情報であるピーク高さ、ピークの面積情報であるピーク面積等の数値情報を記憶する。例えば、図5に示されている波形ファイル030718-L1-1A01FAMから求めたピーク数値情報については、下記表4のようなリストを構築してファイル管理リストと波形ファイル名で結びつけて記憶する。ファイル管理リストと波形数値情報リストとを併せたものを、発現プロファイリングデータベースと呼ぶ。
Figure 2005250615
[比較検索ソフトウエアによる解析]
新たにHiCEP測定をしたデータあるいは発現プロファイリングデータベース中のデータをピークデータベース、遺伝子カタログあるいは発現プロファイリングデータベース中の別のデータと比較する比較検索ソフトウエアを構築した。
サンプルのサンプル情報と制限酵素順をキーワードにし、発現プロファイリングデータベース中のデータを検索し、サンプルのイメージデータと検索された発現プロファイリングデータベース中のイメージデータとを比較した。すなわち、新たに測定された7GyのX線照射後3時間経過したマウス胎児細胞のHiCEP測定データを、上述の発現プロファイリングデータベースへ記憶した。記憶した7GyのX線照射後3時間経過したマウス胎児細胞のHiCEP測定データと、発現プロファイリングデータベース中のデータに記憶されていたマウス胎児正常細胞のイメージデータとを、それぞれ比較検索ソフトウエア上に呼び出し比較した場合、図6の様に比較された。
比較上の興味のある矢印の示すピークをコンピュータ画面上で指定すると、発現プロファイリングデータベース中の波形数値情報リストから数値情報が検索され表示されるようにした。加えて、その数字情報の末端セレクション情報とピーク位置をキーとして遺伝子カタログから遺伝子情報を検索できるようにした。例えば、上述のX線照射後と正常の比較では、末端セレクションAG-GGでピーク位置400.00を指定するとピーク番号MuLIVES-PEAGGG40000が表示された。更に、ピーク番号MuES-PEAGGG40000を指定すると、遺伝子カタログより、ピーク番号MuES-PEAGGG40000の遺伝子情報が、下記表5のように表示された。










Figure 2005250615
本発明の遺伝子解析支援システムは、新たに解析データを得た場合に、その結果を上述の各データベースと容易に照らし合わせることのできるシステムであって、例えば、ピークデータベースと遺伝子カタログへ照会した場合には、新たに行なった解析結果の各ピークの遺伝子を推測でき、発現プロファイリングデータベースへ照会した場合には、新たに行なった解析結果の波形を過去の解析結果と比較検討できる。
更には、これら各データベースに対して、有機的な比較参照を掛けると、新たに行なった解析に用いたサンプルで、どのような遺伝子が、どんな細胞や臓器で、どんな状態で、似たような(あるいは似ていない)挙動を示すかを観察し、推測することができる。
更には、解析に好ましい形で解析データを保存できるので、再利用可能な解析データを効率よく蓄積することができる。
以上の特徴から、サンプルに発現している遺伝子の70%以上を検出するという特徴を備えている、HiCEP解析結果から生まれる膨大な情報の解析及び整理に、特に好適である。
本発明の遺伝子解析支援システムの適用を示すブロック図である。 本発明の遺伝子解析支援システムにおいてピークデータベースを構築する手順を示す説明図である。 HiCEPピークのイメージファイルを示す図である。 本発明の遺伝子解析支援システムによるホモロジー検索の結果を示す図である。 電気泳動波形解析ソフトによる波形ファイルを示す図である。 遺伝子発現解析システムにより比較された結果を示す図である。
符号の説明
1 遺伝子解析支援システム
2 サーバー
3 ピークデータベース管理手段
4 入力端末
5 出力装置
6 ネットワーク接続手段
7 インターネット
8 外部ネットワーク接続手段
9 外部サーバ
10 外部データベース
11 遺伝子カタログ管理手段
31 波形データ記憶手段
32 塩基配列記憶手段
33 ピーク情報記憶手段
111 遺伝子情報記憶手段

Claims (5)

  1. 遺伝子解析により得られる波形データを記憶する、波形データ記憶手段、
    前記波形データに含まれるピークについて決定された塩基配列を記憶する、塩基配列記憶手段、
    前記塩基配列が決定されたピークについての情報を記憶する、ピーク情報記憶手段、
    前記塩基配列及び該塩基配列に対応する前記ピークについての情報を含むデータベースを出力する、データベース出力手段
    を含む、遺伝子解析支援システム。
  2. 前記遺伝子解析により得られる波形データが、HiCEP法により得られる波形データである、請求項1記載の遺伝子解析支援システム。
  3. 前記ピークに対応する塩基配列が、ダイレクトシーケンス法及び/またはショットガンシーケンス法により得られる塩基配列である、請求項1または2に記載の遺伝子解析支援システム。
  4. さらに、
    前記塩基配列を用いたホモロジー検索により得られる遺伝子情報を記憶する、遺伝子情報記憶手段
    を含み、前記データベース出力手段により該遺伝子情報が出力される、請求項1〜3のいずれか1項に記載の遺伝子解析支援システム。
  5. 前記波形データが、該波形データに含まれるピークについての発現頻度データを含む、請求項1〜4のいずれか1項に記載の遺伝子解析支援システム。
JP2004057116A 2004-03-02 2004-03-02 遺伝子解析支援システム Pending JP2005250615A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004057116A JP2005250615A (ja) 2004-03-02 2004-03-02 遺伝子解析支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004057116A JP2005250615A (ja) 2004-03-02 2004-03-02 遺伝子解析支援システム

Publications (1)

Publication Number Publication Date
JP2005250615A true JP2005250615A (ja) 2005-09-15

Family

ID=35031064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004057116A Pending JP2005250615A (ja) 2004-03-02 2004-03-02 遺伝子解析支援システム

Country Status (1)

Country Link
JP (1) JP2005250615A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008226095A (ja) * 2007-03-15 2008-09-25 Natl Inst Of Radiological Sciences 遺伝子発現変動解析方法及びシステム、並びにプログラム
JP2009193273A (ja) * 2008-02-13 2009-08-27 Natl Inst Of Radiological Sciences 遺伝子発現解析方法、遺伝子発現解析装置、および遺伝子発現解析プログラム
WO2012157778A1 (ja) * 2011-05-19 2012-11-22 独立行政法人放射線医学総合研究所 網羅的フラグメント解析における遺伝子同定方法および発現解析方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008226095A (ja) * 2007-03-15 2008-09-25 Natl Inst Of Radiological Sciences 遺伝子発現変動解析方法及びシステム、並びにプログラム
JP2009193273A (ja) * 2008-02-13 2009-08-27 Natl Inst Of Radiological Sciences 遺伝子発現解析方法、遺伝子発現解析装置、および遺伝子発現解析プログラム
WO2012157778A1 (ja) * 2011-05-19 2012-11-22 独立行政法人放射線医学総合研究所 網羅的フラグメント解析における遺伝子同定方法および発現解析方法
JP2012239430A (ja) * 2011-05-19 2012-12-10 Natl Inst Of Radiological Sciences 網羅的フラグメント解析における遺伝子同定方法および発現解析方法

Similar Documents

Publication Publication Date Title
Han et al. Advanced applications of RNA sequencing and challenges
Reinert et al. Alignment of next-generation sequencing reads
Turatsinze et al. Using RSAT to scan genome sequences for transcription factor binding sites and cis-regulatory modules
CN106068330B (zh) 将已知等位基因用于读数映射中的系统和方法
Glynn et al. Genome-wide mapping of the cohesin complex in the yeast Saccharomyces cerevisiae
Balwierz et al. Methods for analyzing deep sequencing expression data: constructing the human and mouse promoterome with deepCAGE data
US8417459B2 (en) Methods of selection, reporting and analysis of genetic markers using broad-based genetic profiling applications
Clima et al. HmtDB 2016: data update, a better performing query system and human mitochondrial DNA haplogroup predictor
Goodman Biological data becomes computer literate: new advances in bioinformatics
Cary et al. EchinoBase: tools for echinoderm genome analyses
Hou et al. MagicViewer: integrated solution for next-generation sequencing data visualization and genetic variation detection and annotation
Zhan et al. SEQMINER: An R‐package to facilitate the functional interpretation of sequence‐based associations
Zhang et al. Genome-by-genome approach for fast bacterial genealogical relationship evaluation
Baek et al. Quantitative analysis of genome-wide chromatin remodeling
Okoniewski et al. Comprehensive analysis of affymetrix exon arrays using BioConductor
Hoffman et al. Estimating the neutral rate of nucleotide substitution using introns
Farrell et al. RefSeq functional elements as experimentally assayed nongenic reference standards and functional interactions in human and mouse
Castrignano et al. CSTminer: a web tool for the identification of coding and noncoding conserved sequence tags through cross-species genome comparison
JP2005250615A (ja) 遺伝子解析支援システム
Levy et al. Xlandscape: the graphical display of word frequencies in sequences.
US7031843B1 (en) Computer methods and systems for displaying information relating to gene expression data
Abugessaisa et al. Genome annotation
JP2005284964A (ja) 遺伝子発現解析システムにおけるデータ処理及び表示方法、及び、遺伝子発現解析システム
CA2685160A1 (en) Broad-based disease association from a gene transcript test
Suzuki et al. Long-read data revealed structural diversity in human centromere sequences

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100308