JP2003242154A - 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 - Google Patents

遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体

Info

Publication number
JP2003242154A
JP2003242154A JP2002040746A JP2002040746A JP2003242154A JP 2003242154 A JP2003242154 A JP 2003242154A JP 2002040746 A JP2002040746 A JP 2002040746A JP 2002040746 A JP2002040746 A JP 2002040746A JP 2003242154 A JP2003242154 A JP 2003242154A
Authority
JP
Japan
Prior art keywords
gene
expression
information
sequence
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002040746A
Other languages
English (en)
Other versions
JP3880417B2 (ja
Inventor
Yasuhisa Kamimura
泰央 上村
Hirofumi Doi
洋文 土居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2002040746A priority Critical patent/JP3880417B2/ja
Priority to US10/504,956 priority patent/US20050107961A1/en
Priority to PCT/JP2003/001708 priority patent/WO2003081471A1/ja
Priority to EP03705276A priority patent/EP1477910A4/en
Publication of JP2003242154A publication Critical patent/JP2003242154A/ja
Application granted granted Critical
Publication of JP3880417B2 publication Critical patent/JP3880417B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 各種の遺伝子発現実験により取得した画像情
報および遺伝子情報を統括的に管理し漏れなく知見を抽
出する装置等を提供することを課題とする。 【解決手段】 図3に示すように、まず、本発明は、i
n situハイブリダイゼーション結果の画像データ
と対応する発現遺伝子(cDNA)の塩基配列データを
格納し、当該画像データに対するアノテーション情報
(採取した組織に関する情報、採取した組織の発育段階
または加齢段階に関する情報、遺伝子の発現が見られる
か否かに関する情報、および、発現が見られる細胞など
の部位に関する情報など)を利用者に入力させる。ま
た、本発明は、これらのアノテーション情報について各
種の画像解析技術を用いて画像データから自動的に認識
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、遺伝子発現情報管
理装置、遺伝子発現情報管理方法、プログラム、およ
び、記録媒体に関し、特に、発現画像を管理する遺伝子
発現情報管理装置、遺伝子発現情報管理方法、プログラ
ム、および、記録媒体に関する。
【0002】
【従来の技術】従来より、破砕していない細胞や組織に
特定遺伝子のプローブを直接ハイブリダイズさせ、DN
AやmRNAなどの核酸あるいはタンパク質の細胞また
は組織内の分布や局在を光学顕微鏡や電子顕微鏡により
調べるin situハイブリダイゼーションを用い
て、遺伝子の発現場所などの同定を行う実験手法が広く
行われている。
【0003】また、科学技術振興事業団土居バイオアシ
ンメトリプロジェクトの小宮透らにより、臓器などの切
片を用いた高速in situハイブリダイゼーション
の手法が開発されている(小宮透「96ウェルで行う切
片のin situハイブリダイゼーション」細胞工学
18、405 1999年 など)。
【0004】この高速in situハイブリダイゼー
ション法の概要について図1を参照して説明する。図1
に示すように、まず、臓器などの組織からmRNAを精
製し、NotIオリゴ(dT)を用いてmRNAからc
DNAを合成してcDNAライブラリーを作製する(ス
テップSA−1)。そして、cDNAライブラリーの均
一化を行い均一化ライブラリーを作製する(ステップS
A−2)。本手法においては、cDNAの均一化ライブ
ラリーを用いることにより、微量な遺伝子の発現につい
ても同定することができる。
【0005】そして、ベクタへのライゲーションを行
い、大腸菌へのトランスフォームを行う(ステップSA
−3)。そして、トランスフォームされた大腸菌のコロ
ニーを作製する(ステップSA−4)。そして、コロニ
ーをランダムにピックアップし、ベクタの配列を使って
PCRにより内部のcDNAを直線化し増幅する。その
際にはベクタ由来のRNAポリメラーゼのプロモーター
配列が付加される。増幅されたcDNAをガラスパウダ
ー法を用いて96ウェルプレートのフォーマットで精製
し、これをマスターライブラリーとして保存する(ステ
ップSA−5)。
【0006】そして、精製フラグメントを使って96ウ
ェルプレートでハプテンであるDIG(digoxig
enin)ラベルの転写反応を行う(ステップSA−
6)。そして、出来上がったプローブをエタノール沈殿
し、希釈して、96ウェルプレートの底にポリエステル
ワックスなどで貼り付けた臓器などの組織の切片に対し
て、in situハイブリダイゼーションを行う(ス
テップSA−7)。なお、ハイブリダイズ、酵素ラベル
された抗DIG抗体反応後の洗浄はELISA洗浄器を
用いてシステマチックに行う。
【0007】そして、酵素抗体法による発色後、倒立顕
微鏡で観察し、画像をCCDカメラで取り込む。ここ
で、図2は、取り込まれた画像の一例を示す図である。
図2に示すように、発色(図中の黒色で示す部分)があ
る場所などの興味のある発現を示す像が得られた場合に
は、マスターライブラリーの対応するクローンの塩基配
列を決定することで、遺伝子の発現像と塩基配列とを対
応させて情報を得ることができる(ステップSA−
8)。
【0008】
【発明が解決しようとする課題】しかしながら、従来の
手法によると、in situハイブリダイゼーション
により発現像を得て、プローブとして用いたcDNAの
塩基配列の情報とのマッチングやその情報を用いた生物
的知見の発見は人手により行っているため、取得した情
報を統括的に管理し漏れなく知見を抽出することが困難
であるという問題点を有していた。以下、この問題点の
内容について、一層具体的に説明する。
【0009】上述した高速in situハイブリダイ
ゼーションでは、得られた大量の発現像の解析やその遺
伝子配列のホモロジー検索などによる解析が人手により
行われる。すなわち、実験者は、発現したcDNAクロ
ーンの塩基配列に基づいて、既存のcDNAデータベー
ス(たとえば、ESTデータベースや完全長cDNAデ
ータベースなど)に対してBLASTなどのホモロジー
検索プログラムにより類似配列の検索を行い、発現した
遺伝子(mRNA)の特定などを行う必要がある。ま
た、cDNAライブラリーに含まれる複数のcDNAク
ローンにつき同一のmRNAに由来するものを抽出して
クラスタリングを行ったり、同一のクラスタに含まれる
cDNAクローンの発現画像の分類作業を行ったり、さ
らに、その画像から読取れる知見について抽出を行った
りする必要がある。
【0010】また、このような高速in situハイ
ブリダイゼーション実験を一つの組織について行うと少
なくとも数百から数千の画像が取得され、さらに近年の
トランスクリプトーム解析やプロテオーム解析の進展に
伴い、高速in situハイブリダイゼーションなど
による発現解析のための実験データは膨大になることが
予想される。従って、人手による作業には自ずと限界が
生ずるため、これらの作業につき統合的に管理すること
ができるデータベースシステムの開発が望まれている。
【0011】また、in situハイブリダイゼーシ
ョンに関する実験データを一元管理するデータベースシ
ステムを導入してデータマイニング手法を駆使すること
により、従来の人手による解析によっては発見すること
ができなかった知見についてコンピュータシステム上で
発見することができることが期待される。
【0012】なお、これまで説明した従来の技術および
発明が解決しようとする課題は、上述した高速in s
ituハイブリダイゼーションによる実験データを収集
する場合に限られず、他の手法により遺伝子の発現情報
を解析する全ての実験手法を用いる場合において、同様
に考えることができる。
【0013】本発明は上記問題点に鑑みてなされたもの
で、各種の遺伝子発現実験により取得した画像情報およ
び遺伝子情報を統括的に管理し漏れなく知見を抽出する
ことのできる、遺伝子発現情報管理装置、遺伝子発現情
報管理方法、プログラム、および、記録媒体を提供する
ことを目的としている。
【0014】
【課題を解決するための手段】このような目的を達成す
るため、請求項1に記載の遺伝子発現情報管理装置は、
遺伝子の発現に関する画像データを入力する画像データ
入力手段と、上記発現した上記遺伝子の塩基配列を入力
する塩基配列入力手段と、上記塩基配列入力手段により
入力された上記塩基配列に対してホモロジー検索を行い
類似塩基配列を抽出するホモロジー検索手段と、上記画
像データと対応する上記塩基配列とその上記類似塩基配
列とを表示する表示手段とを備えたことを特徴とする。
【0015】この装置によれば、遺伝子の発現に関する
画像データを入力し、発現した遺伝子の塩基配列(例え
ば、cDNAクローンの塩基配列など)を入力し、入力
された塩基配列に対してホモロジー検索を行い類似塩基
配列を抽出し、画像データと対応する塩基配列とその類
似塩基配列とを表示するので、画像データにおいて発現
した遺伝子を容易に特定することができるようになる。
【0016】すなわち、例えばin situハイブリ
ダイゼーションなどの遺伝子発現実験において撮影され
た画像データに対応する、プローブとして用いたcDN
Aの塩基配列について、塩基配列データベース(EST
データベースや完全長cDNAデータベースなど)に格
納された既知の塩基配列とホモロジー検索(例えば、F
astA、Blastなど)を行い、類似性の高い塩基
配列を表示することにより、当該cDNAを特定し、当
該cDNAと画像データとを併記して分かり易く表示す
ることができるようになる。
【0017】また、類似塩基配列と一緒に当該塩基配列
と類似塩基配列との間の類似度(例えば、ホモロジー検
索のスコアなど)を表示してもよい。これにより、最も
類似する塩基配列を表示したり、ホモロジースコアの高
い順にソートして類似配列を表示したりすることができ
るようになる。
【0018】さらに、類似配列に付属する情報として、
遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子
が取得されている生物種、当該遺伝子が取得された臓器
名や組織名、当該遺伝子のGenBankデータベース
でのID、当該遺伝子の産物タンパク質のGenBan
kデータベースでのID、当該cDNAの塩基配列が当
該遺伝子配列にどのくらいの長さでどのくらい一致した
か、または、当該遺伝子の存在の証拠に関する情報のう
ち少なくとも一つを類似配列と併記して表示してもよ
い。
【0019】また、請求項2に記載の装置は、請求項1
に記載の遺伝子発現情報管理装置において、上記ホモロ
ジー検索手段は、(1)既に同じあるいは別の生物で既
知となっている遺伝子、(2)未知の遺伝子であるが同
じcDNAが既に取得されている遺伝子、(3)未知の
遺伝子であるが対応するゲノムDNA断片が既に取得さ
れている遺伝子、(4)染色体上での位置がわかってい
る遺伝子、(5)既に特許が取得されている遺伝子、の
うち少なくとも一つの遺伝子の塩基配列を対象としてホ
モロジー検索を行うことを特徴とする。
【0020】これはホモロジー検索の一例を一層具体的
に示すものである。この装置によれば、ホモロジー検索
は、(1)既に同じあるいは別の生物で既知となってい
る遺伝子、(2)未知の遺伝子であるが同じcDNAが
既に取得されている遺伝子、(3)未知の遺伝子である
が対応するゲノムDNA断片が既に取得されている遺伝
子、(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子のうち少なくと
も一つの遺伝子の塩基配列を対象としてホモロジー検索
を行うので、画像データの持つ生物学的な重要度などを
容易に特定することができるようになる。
【0021】すなわち、(1)から(5)の各カテゴリ
の塩基配列を格納した各塩基情報データベースを対象と
してホモロジー検索を行うことができるようになるの
で、各カテゴリで最も類似度の高い塩基配列を個別に特
定することができるようになる。
【0022】また、請求項3に記載の装置は、遺伝子の
発現に関する画像データを入力する画像データ入力手段
と、上記発現した上記遺伝子の塩基配列を入力する塩基
配列入力手段と、上記塩基配列入力手段により入力され
た上記塩基配列に対してクラスタリングを行い、上記塩
基配列を特定のクラスタに分類するクラスタリング手段
と、上記クラスタ毎に上記画像データと対応する上記塩
基配列とを表示する表示手段とを備えたことを特徴とす
る。
【0023】この装置によれば、遺伝子の発現に関する
画像データを入力し、発現した遺伝子の塩基配列(例え
ば、cDNAクローンの塩基配列など)を入力し、入力
された塩基配列に対してクラスタリングを行い、塩基配
列を特定のクラスタに分類し、クラスタ毎に画像データ
と対応する塩基配列とを表示するので、例えば同じmR
NAに由来するcDNA(EST配列)を同じクラスタ
に分類すること等により、同一の性質を持つ塩基配列を
集めて特定のクラスタに分類することができるようにな
る。
【0024】これにより、cDNAライブラリーからラ
ンダムに抽出したcDNAクローンの重複を排除するこ
と等ができるようになり、さらに、実験結果のまとめ作
業を効率化することができるようになる。
【0025】また、請求項4に記載の装置は、請求項3
に記載の遺伝子発現情報管理装置において、上記クラス
タリング手段により同一の上記クラスタに分類された上
記塩基配列からクラスタ配列を決定するクラスタ配列決
定手段をさらに備え、上記表示手段は、上記クラスタ毎
に上記クラスタ配列と上記画像データと対応する上記塩
基配列とを表示することを特徴とする。
【0026】この装置によれば、同一のクラスタに分類
された塩基配列からクラスタ配列を決定し、クラスタ毎
にクラスタ配列と画像データと対応する塩基配列とを表
示するので、例えば、クラスタのメンバーの塩基配列を
組み合わせて作成した塩基配列(例えば、完全長cDN
Aなど)をクラスタ配列として決定し、表示することが
できるようになる。
【0027】これにより、部分的なcDNA配列(ES
T配列)を用いた実験から、完全長cDNA(mRNA
配列)などの遺伝子配列を容易に予想することができる
ようになる。
【0028】また、請求項5に記載の装置は、請求項3
または4に記載の遺伝子発現情報管理装置において、上
記クラスタリング手段は、上記塩基配列を用いて共通配
列のアセンブルを行い、同一の上記共通配列を構成した
上記塩基配列を同一の上記クラスタに分類し、上記クラ
スタ配列決定手段は、上記クラスタの上記共通配列を上
記クラスタ配列として決定することを特徴とする。
【0029】この装置によれば、塩基配列を用いて共通
配列のアセンブルを行い、同一の共通配列を構成した塩
基配列を同一のクラスタに分類し、クラスタの共通配列
をクラスタ配列として決定するので、アセンブル技術
(短い断片配列から長い配列を作成する技術をいう。例
えば、断片配列間の配列の重なりをマルチプルアライン
メントなどの手法を用いて探索し、重なりを持つ断片配
列同士を合成することにより長い配列を生成する。)に
より部分的なcDNA配列からより完全長に近いcDN
A配列を作成することができるようになる。
【0030】また、請求項6に記載の装置は、請求項4
または5に記載の遺伝子発現情報管理装置において、上
記クラスタ配列決定手段により決定された上記クラスタ
配列に対してホモロジー検索を行い類似塩基配列を抽出
するクラスタ配列ホモロジー検索手段をさらに備え、上
記表示手段は、上記クラスタ毎に上記クラスタ配列とそ
の類似配列と上記画像データと対応する上記塩基配列と
を表示することを特徴とする。
【0031】この装置によれば、決定されたクラスタ配
列に対してホモロジー検索を行い類似塩基配列を抽出
し、クラスタ毎にクラスタ配列とその類似配列と画像デ
ータと対応する塩基配列とを表示するので、画像データ
において発現した遺伝子を容易に特定することができる
ようになる。
【0032】すなわち、プローブに用いたcDNAの塩
基配列からアセンブルなどを実行することより合成した
クラスタ配列について、塩基配列データベース(EST
データベースや完全長cDNAデータベースなど)に格
納された既知の塩基配列とホモロジー検索(例えば、F
astA、Blastなど)を行い、類似性の高い塩基
配列を表示することにより、発現した遺伝子を容易に特
定することができるようになる。
【0033】また、類似塩基配列と一緒に当該クラスタ
配列と類似塩基配列との間の類似度(例えば、ホモロジ
ースコアなど)を表示してもよい。これにより、クラス
タ配列に最も類似する塩基配列を表示したり、ホモロジ
ースコアの高い順にソートして類似配列を表示したりす
ることができるようになる。
【0034】さらに、類似配列に付属する情報として、
遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子
が取得されている生物種、当該遺伝子が取得された臓器
名や組織名、当該遺伝子のGenBankデータベース
でのID、当該遺伝子の産物タンパク質のGenBan
kデータベースでのID、当該クラスタ配列が当該遺伝
子配列にどのくらいの長さでどのくらい一致したか、ま
たは、当該遺伝子の存在の証拠に関する情報のうち少な
くとも一つを類似配列と一緒に表示してもよい。
【0035】さらに、任意の遺伝子配列を入力すること
により、入力された遺伝子について登録されたcDNA
クローン配列とクラスタリングを行い、同一のクラスタ
に属するクラスタ配列に関する情報(画像データなど)
を表示することが可能になる。
【0036】また、請求項7に記載の装置は、請求項6
に記載の遺伝子発現情報管理装置において、上記クラス
タ配列ホモロジー検索手段は、(1)既に同じあるいは
別の生物で既知となっている遺伝子、(2)未知の遺伝
子であるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片
が既に取得されている遺伝子、(4)染色体上での位置
がわかっている遺伝子、(5)既に特許が取得されてい
る遺伝子、のうち少なくとも一つの遺伝子の塩基配列を
対象としてホモロジー検索を行うことを特徴とする。
【0037】これはクラスタ配列に対するホモロジー検
索の一例を一層具体的に示すものである。この装置によ
れば、ホモロジー検索は、(1)既に同じあるいは別の
生物で既知となっている遺伝子、(2)未知の遺伝子で
あるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片
が既に取得されている遺伝子、(4)染色体上での位置
がわかっている遺伝子、(5)既に特許が取得されてい
る遺伝子のうち少なくとも一つの遺伝子の塩基配列を対
象としてホモロジー検索を行うので、画像データの持つ
生物学的な重要度などを容易に特定することができるよ
うになる。
【0038】すなわち、(1)から(5)の各カテゴリ
の塩基配列を格納した各塩基情報データベースを対象と
してホモロジー検索を行うことができるようになるの
で、各カテゴリで最も類似度の高い塩基配列を個別に特
定することができるようになる。
【0039】また、請求項8に記載の装置は、請求項1
から7のいずれか一つに記載の遺伝子発現情報管理装置
において、上記画像データに対して、採取した組織に関
する情報、採取した組織の発育段階または加齢段階に関
する情報、遺伝子の発現が見られるか否かに関する情
報、および、発現が見られる部位に関する情報のうち少
なくとも一つを対応付けて格納するアノテーション情報
格納手段をさらに備え、上記表示手段は、上記画像デー
タに対して、上記採取した組織に関する情報、上記採取
した組織の発育段階または加齢段階に関する情報、上記
遺伝子の発現が見られるか否かに関する情報、および、
上記発現が見られる部位に関する情報のうち少なくとも
一つを対応付けて表示することを特徴とする。
【0040】これは画像データに対するアノテーション
情報の一例を一層具体的に示すものである。この装置に
よれば、画像データに対して、採取した組織に関する情
報、採取した組織の発育段階または加齢段階に関する情
報、遺伝子の発現が見られるか否かに関する情報、およ
び、発現が見られる部位に関する情報のうち少なくとも
一つを対応付けて格納し、画像データに対して、採取し
た組織に関する情報、採取した組織の発育段階または加
齢段階に関する情報、遺伝子の発現が見られるか否かに
関する情報、および、発現が見られる部位に関する情報
のうち少なくとも一つを対応付けて表示することができ
るようになる。
【0041】また、請求項9に記載の装置は、請求項1
から8のいずれか一つに記載の遺伝子発現情報管理装置
において、上記画像データおよび/または上記塩基配列
に基づいて、上記画像データ中の遺伝子の発現量を推定
する発現量推定手段をさらに備えたことを特徴とする。
【0042】この装置によれば、画像データおよび/ま
たは塩基配列に基づいて、画像データ中の遺伝子の発現
量を推定するので、発現パターン(均一に発現、偏って
発現など)などを容易に特定することができるようにな
る。
【0043】ここで、画像データ中の蛍光色素などの発
光量や発光面積を既知の画像解析手法などにより求める
ことにより、発現量を推定してもよい。また、画像デー
タだけでなく塩基配列の情報も利用すれば、例えば、塩
基配列にリピート配列が含まれている場合にはクロスハ
イブリダイズ(同じリピートを持つ当該mRNA以外の
mRNAに対してもハイブリダイゼーション反応が起こ
る)の可能性が高いため推定された発現量に対する信用
性は低い、などの評価を自動的にできるようになる。
【0044】また、例えば、同じ組織切片に対してプロ
ーブを発光させたものと発光させないものを撮影した
り、別の種類の蛍光色素などで染色したものを撮影した
りすることにより、画像解析処理を簡単に実行すること
ができるようになる(その2枚の画像の差分をとること
により発現量を推定する等)。
【0045】また、請求項10に記載の装置は、請求項
9に記載の遺伝子発現情報管理装置において、上記発現
量推定手段により推定された上記発現量に従って、上記
画像データの表示順番をソートする発現量順ソート手段
をさらに備えたことを特徴とする。
【0046】この装置によれば、推定された発現量に従
って、画像データの表示順番をソートするので、効率的
に実験結果を確認できるようになる。
【0047】また、請求項11に記載の装置は、請求項
1から10のいずれか一つに記載の遺伝子発現情報管理
装置において、上記画像データ、上記塩基配列、上記発
現量、上記採取した組織に関する情報、上記採取した組
織の発育段階または加齢段階に関する情報、上記遺伝子
の発現が見られるか否かに関する情報、および、上記発
現が見られる部位に関する情報のうち少なくとも一つに
基づいて、2つ以上の上記画像データを比較する画像比
較手段と、上記画像比較手段の比較結果に基づいて、2
つ以上の上記画像データの相違点を抽出する相違点抽出
手段とをさらに備えたことを特徴とする。
【0048】この装置によれば、画像データ、塩基配
列、発現量、採取した組織に関する情報、採取した組織
の発育段階または加齢段階に関する情報、遺伝子の発現
が見られるか否かに関する情報、および、発現が見られ
る部位に関する情報のうち少なくとも一つに基づいて、
2つ以上の画像データを比較し、比較結果に基づいて、
2つ以上の画像データの相違点を抽出するので、画像間
の差異を効率的に抽出することができるようになる。
【0049】これにより、画像認識あるいは手作業によ
ってそれぞれの組織での発現パターンについてアノテー
ションを行ない、そのアノテーションを自動で比較し、
相違がみられるものについて抽出して表示することがで
きるようになる。
【0050】また、例えば、正常細胞と疾患細胞との比
較や、発育段階または加齢段階の時系列での比較や、薬
剤投与前と投与後の比較などを効率的に実行することが
できるようになる。
【0051】また、請求項12に記載の装置は、請求項
1から11のいずれか一つに記載の遺伝子発現情報管理
装置において、2つ以上の上記画像データから3次元画
像を作成する3次元画像作成手段と、上記画像データの
上記発現量から上記3次元画像における発現量をシミュ
レーションする発現量シミュレーション手段とをさらに
備えたことを特徴とする。
【0052】この装置によれば、2つ以上の画像データ
から3次元画像を作成し、画像データの発現量から3次
元画像における発現量をシミュレーションするので、一
つの配列で臓器の全スライスをテストした場合、その画
像をつなぐことにより臓器の3次元画像をシミュレーシ
ョンし、各画像を画像解析して求めたmRNAの発現量
を3次元的に補正し表示することができるようになる。
【0053】また、請求項13に記載の装置は、請求項
3から12のいずれか一つに記載の遺伝子発現情報管理
装置において、同一の上記クラスタに属する上記塩基配
列の中から、上記画像データ、上記塩基配列、上記発現
量、上記採取した組織に関する情報、上記採取した組織
の発育段階または加齢段階に関する情報、上記遺伝子の
発現が見られるか否かに関する情報、および、上記発現
が見られる部位に関する情報のうち少なくとも一つに基
づいて、代表クローンを決定する代表クローン決定手段
をさらに備えたことを特徴とする。
【0054】この装置によれば、同一のクラスタに属す
る塩基配列の中から、画像データ、塩基配列、発現量、
採取した組織に関する情報、採取した組織の発育段階ま
たは加齢段階に関する情報、遺伝子の発現が見られるか
否かに関する情報、および、発現が見られる部位に関す
る情報のうち少なくとも一つに基づいて、代表クローン
を決定するので、例えば、同じmRNAに由来するクロ
ーン群のうち最もよい実験データがとれるクローンを一
つ選んで代表クローンとして抽出することができるよう
になる。また、同じmRNA由来と思われるESTは同
じクラスタに分類し、代表クローンのみを実験すること
によって、その後の実験回数を減らすことができる。つ
まり、クラスタリングによって、それまではEST数の
実験が必要だったのに対し、代表クローン(クラスタ数
存在する)についてのみ実験を行うことで足りるように
なる。
【0055】ここで、同一mRNAに由来するcDNA
クローンであっても切断箇所により配列が少しずつ異な
る。in situハイブリダイゼーションを実施した
ときにそのcDNA配列によってきれいに発現シグナル
がでるものとそうでないものがあるため、画像データを
みてきれいにシグナルが出ているクローンを代表クロー
ンとしてもよい。
【0056】また、cDNAクローンの塩基配列は、リ
ピート配列を持たないものや、実験に適した配列長のも
のを代表クローンとしてもよい。
【0057】また、請求項14に記載の装置は、請求項
3から13のいずれか一つに記載の遺伝子発現情報管理
装置において、上記クラスタ配列のホモロジー検索結
果、上記画像データ、上記塩基配列、上記発現量、上記
採取した組織に関する情報、上記採取した組織の発育段
階または加齢段階に関する情報、上記遺伝子の発現が見
られるか否かに関する情報、および、上記発現が見られ
る部位に関する情報のうち少なくとも一つに基づいて、
クラスタ重要度を決定するクラスタ重要度決定手段をさ
らに備えたことを特徴とする。
【0058】この装置によれば、クラスタ配列のホモロ
ジー検索結果、画像データ、塩基配列、発現量、採取し
た組織に関する情報、採取した組織の発育段階または加
齢段階に関する情報、遺伝子の発現が見られるか否かに
関する情報、および、発現が見られる部位に関する情報
のうち少なくとも一つに基づいてクラスタ重要度を決定
するので、これらの情報に基づいてクラスタの重要度を
任意に決定し、利用者が注目するクラスタを容易に発見
することができるようになる。
【0059】例えば、発現量と組織に関する情報に基づ
いて特定の発育段階または加齢段階の組織で高い発現を
示すクローンについて重要度を高く決定してもよく、さ
らに、その塩基配列に対するホモロジー検索結果により
既存の遺伝子配列DBにヒットしない(すなわち、既知
の類似配列が存在しない)ものであれば、さらに重要度
を高く決定してもよい。
【0060】また、請求項15に記載の装置は、請求項
1から14のいずれか一つに記載の遺伝子発現情報管理
装置において、上記塩基配列の存在する染色体上の遺伝
子座を特定する遺伝子座特定手段と、上記染色体の上記
遺伝子座に上記塩基配列に関する情報をマッピングする
ことにより染色体マップを作成する染色体マップ作成手
段と、上記染色体マップ作成ステップにて作成した上記
染色体マップを表示する染色体マップ表示ステップとを
さらに備えたことを特徴とする。
【0061】この装置によれば、塩基配列の存在する染
色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配
列に関する情報(例えば、画像データ、塩基配列、発現
量、採取した組織に関する情報、採取した組織の発育段
階または加齢段階に関する情報、遺伝子の発現が見られ
るか否かに関する情報、および、発現が見られる部位に
関する情報など)をマッピングすることにより染色体マ
ップを作成することができるようになる。
【0062】また、当該染色体マップの遺伝子座に対応
する部分(特定のマークなどを表示しても良い)を選択
すると、その詳細な塩基配列に関する情報を表示するよ
うにしてもよい。
【0063】また、本発明は遺伝子発現情報管理方法に
関するものであり、請求項16に記載の遺伝子発現情報
管理方法は、遺伝子の発現に関する画像データを入力す
る画像データ入力ステップと、上記発現した上記遺伝子
の塩基配列を入力する塩基配列入力ステップと、上記塩
基配列入力ステップにより入力された上記塩基配列に対
してホモロジー検索を行い類似塩基配列を抽出するホモ
ロジー検索ステップと、上記画像データと対応する上記
塩基配列とその上記類似塩基配列とを表示する表示ステ
ップとを含むことを特徴とする。
【0064】この方法によれば、遺伝子の発現に関する
画像データを入力し、発現した遺伝子の塩基配列(例え
ば、cDNAクローンの塩基配列など)を入力し、入力
された塩基配列に対してホモロジー検索を行い類似塩基
配列を抽出し、画像データと対応する塩基配列とその類
似塩基配列とを表示するので、画像データにおいて発現
した遺伝子を容易に特定することができるようになる。
【0065】すなわち、例えばin situハイブリ
ダイゼーションなどの遺伝子発現実験において撮影され
た画像データに対応する、プローブとして用いたcDN
Aの塩基配列について、塩基配列データベース(EST
データベースや完全長cDNAデータベースなど)に格
納された既知の塩基配列とホモロジー検索(例えば、F
astA、Blastなど)を行い、類似性の高い塩基
配列を表示することにより、当該cDNAを特定し、当
該cDNAと画像データとを併記して分かり易く表示す
ることができるようになる。
【0066】また、類似塩基配列と一緒に当該塩基配列
と類似塩基配列との間の類似度(例えば、ホモロジー検
索のスコアなど)を表示してもよい。これにより、最も
類似する塩基配列を表示したり、ホモロジースコアの高
い順にソートして類似配列を表示したりすることができ
るようになる。
【0067】さらに、類似配列に付属する情報として、
遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子
が取得されている生物種、当該遺伝子が取得された臓器
名や組織名、当該遺伝子のGenBankデータベース
でのID、当該遺伝子の産物タンパク質のGenBan
kデータベースでのID、当該cDNAの塩基配列が当
該遺伝子配列にどのくらいの長さでどのくらい一致した
か、または、当該遺伝子の存在の証拠に関する情報のう
ち少なくとも一つを類似配列と併記して表示してもよ
い。
【0068】また、請求項17に記載の方法は、請求項
16に記載の遺伝子発現情報管理方法において、上記ホ
モロジー検索ステップは、(1)既に同じあるいは別の
生物で既知となっている遺伝子、(2)未知の遺伝子で
あるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片
が既に取得されている遺伝子、(4)染色体上での位置
がわかっている遺伝子、(5)既に特許が取得されてい
る遺伝子、のうち少なくとも一つの遺伝子の塩基配列を
対象としてホモロジー検索を行うことを特徴とする。
【0069】これはホモロジー検索の一例を一層具体的
に示すものである。この方法によれば、ホモロジー検索
は、(1)既に同じあるいは別の生物で既知となってい
る遺伝子、(2)未知の遺伝子であるが同じcDNAが
既に取得されている遺伝子、(3)未知の遺伝子である
が対応するゲノムDNA断片が既に取得されている遺伝
子、(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子のうち少なくと
も一つの遺伝子の塩基配列を対象としてホモロジー検索
を行うので、画像データの持つ生物学的な重要度などを
容易に特定することができるようになる。
【0070】すなわち、(1)から(5)の各カテゴリ
の塩基配列を格納した各塩基情報データベースを対象と
してホモロジー検索を行うことができるようになるの
で、各カテゴリで最も類似度の高い塩基配列を個別に特
定することができるようになる。
【0071】また、請求項18に記載の方法は、遺伝子
の発現に関する画像データを入力する画像データ入力ス
テップと、上記発現した上記遺伝子の塩基配列を入力す
る塩基配列入力ステップと、上記塩基配列入力ステップ
により入力された上記塩基配列に対してクラスタリング
を行い、上記塩基配列を特定のクラスタに分類するクラ
スタリングステップと、上記クラスタ毎に上記画像デー
タと対応する上記塩基配列とを表示する表示ステップと
を含むことを特徴とする。
【0072】この方法によれば、遺伝子の発現に関する
画像データを入力し、発現した遺伝子の塩基配列(例え
ば、cDNAクローンの塩基配列など)を入力し、入力
された塩基配列に対してクラスタリングを行い、塩基配
列を特定のクラスタに分類し、クラスタ毎に画像データ
と対応する塩基配列とを表示するので、例えば同じmR
NAに由来するcDNA(EST配列)を同じクラスタ
に分類すること等により、同一の性質を持つ塩基配列を
集めて特定のクラスタに分類することができるようにな
る。
【0073】これにより、cDNAライブラリーからラ
ンダムに抽出したcDNAクローンの重複を排除するこ
と等ができるようになり、さらに、実験結果のまとめ作
業を効率化することができるようになる。
【0074】また、請求項19に記載の方法は、請求項
18に記載の遺伝子発現情報管理方法において、上記ク
ラスタリングステップにより同一の上記クラスタに分類
された上記塩基配列からクラスタ配列を決定するクラス
タ配列決定ステップをさらに含み、上記表示ステップ
は、上記クラスタ毎に上記クラスタ配列と上記画像デー
タと対応する上記塩基配列とを表示することを特徴とす
る。
【0075】この方法によれば、同一のクラスタに分類
された塩基配列からクラスタ配列を決定し、クラスタ毎
にクラスタ配列と画像データと対応する塩基配列とを表
示するので、例えば、クラスタのメンバーの塩基配列を
組み合わせて作成した塩基配列(例えば、完全長cDN
Aなど)をクラスタ配列として決定し、表示することが
できるようになる。
【0076】これにより、部分的なcDNA配列(ES
T配列)を用いた実験から、完全長cDNA(mRNA
配列)などの遺伝子配列を容易に予想することができる
ようになる。
【0077】また、請求項20に記載の方法は、請求項
18または19に記載の遺伝子発現情報管理方法におい
て、上記クラスタリングステップは、上記塩基配列を用
いて共通配列のアセンブルを行い、同一の上記共通配列
を構成した上記塩基配列を同一の上記クラスタに分類
し、上記クラスタ配列決定ステップは、上記クラスタの
上記共通配列を上記クラスタ配列として決定することを
特徴とする。
【0078】この方法によれば、塩基配列を用いて共通
配列のアセンブルを行い、同一の共通配列を構成した塩
基配列を同一のクラスタに分類し、クラスタの共通配列
をクラスタ配列として決定するので、アセンブル技術
(短い断片配列から長い配列を作成する技術をいう。例
えば、断片配列間の配列の重なりをマルチプルアライン
メントなどの手法を用いて探索し、重なりを持つ断片配
列同士を合成することにより長い配列を生成する。)に
より部分的なcDNA配列からより完全長に近いcDN
A配列を作成することができるようになる。
【0079】また、請求項21に記載の方法は、請求項
19または20に記載の遺伝子発現情報管理方法におい
て、上記クラスタ配列決定ステップにより決定された上
記クラスタ配列に対してホモロジー検索を行い類似塩基
配列を抽出するクラスタ配列ホモロジー検索ステップを
さらに含み、上記表示ステップは、上記クラスタ毎に上
記クラスタ配列とその類似配列と上記画像データと対応
する上記塩基配列とを表示することを特徴とする。
【0080】この方法によれば、決定されたクラスタ配
列に対してホモロジー検索を行い類似塩基配列を抽出
し、クラスタ毎にクラスタ配列とその類似配列と画像デ
ータと対応する塩基配列とを表示するので、画像データ
において発現した遺伝子を容易に特定することができる
ようになる。
【0081】すなわち、プローブに用いたcDNAの塩
基配列からアセンブルなどを実行することより合成した
クラスタ配列について、塩基配列データベース(EST
データベースや完全長cDNAデータベースなど)に格
納された既知の塩基配列とホモロジー検索(例えば、F
astA、Blastなど)を行い、類似性の高い塩基
配列を表示することにより、発現した遺伝子を容易に特
定することができるようになる。
【0082】また、類似塩基配列と一緒に当該クラスタ
配列と類似塩基配列との間の類似度(例えば、ホモロジ
ースコアなど)を表示してもよい。これにより、クラス
タ配列に最も類似する塩基配列を表示したり、ホモロジ
ースコアの高い順にソートして類似配列を表示したりす
ることができるようになる。
【0083】さらに、類似配列に付属する情報として、
遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子
が取得されている生物種、当該遺伝子が取得された臓器
名や組織名、当該遺伝子のGenBankデータベース
でのID、当該遺伝子の産物タンパク質のGenBan
kデータベースでのID、当該クラスタ配列が当該遺伝
子配列にどのくらいの長さでどのくらい一致したか、ま
たは、当該遺伝子の存在の証拠に関する情報のうち少な
くとも一つを類似配列と一緒に表示してもよい。
【0084】さらに、任意の遺伝子配列を入力すること
により、入力された遺伝子について登録されたcDNA
クローン配列とクラスタリングを行い、同一のクラスタ
に属するクラスタ配列に関する情報(画像データなど)
を表示することが可能になる。
【0085】また、請求項22に記載の方法は、請求項
21に記載の遺伝子発現情報管理方法において、上記ク
ラスタ配列ホモロジー検索ステップは、(1)既に同じ
あるいは別の生物で既知となっている遺伝子、(2)未
知の遺伝子であるが同じcDNAが既に取得されている
遺伝子、(3)未知の遺伝子であるが対応するゲノムD
NA断片が既に取得されている遺伝子、(4)染色体上
での位置がわかっている遺伝子、(5)既に特許が取得
されている遺伝子、のうち少なくとも一つの遺伝子の塩
基配列を対象としてホモロジー検索を行うことを特徴と
する。
【0086】これはクラスタ配列に対するホモロジー検
索の一例を一層具体的に示すものである。この方法によ
れば、ホモロジー検索は、(1)既に同じあるいは別の
生物で既知となっている遺伝子、(2)未知の遺伝子で
あるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片
が既に取得されている遺伝子、(4)染色体上での位置
がわかっている遺伝子、(5)既に特許が取得されてい
る遺伝子のうち少なくとも一つの遺伝子の塩基配列を対
象としてホモロジー検索を行うので、画像データの持つ
生物学的な重要度などを容易に特定することができるよ
うになる。
【0087】すなわち、(1)から(5)の各カテゴリ
の塩基配列を格納した各塩基情報データベースを対象と
してホモロジー検索を行うことができるようになるの
で、各カテゴリで最も類似度の高い塩基配列を個別に特
定することができるようになる。
【0088】また、請求項23に記載の方法は、請求項
16から22のいずれか一つに記載の遺伝子発現情報管
理方法において、上記画像データに対して、採取した組
織に関する情報、採取した組織の発育段階または加齢段
階に関する情報、遺伝子の発現が見られるか否かに関す
る情報、および、発現が見られる部位に関する情報のう
ち少なくとも一つを対応付けて格納するアノテーション
情報格納ステップをさらに含み、上記表示ステップは、
上記画像データに対して、上記採取した組織に関する情
報、上記採取した組織の発育段階または加齢段階に関す
る情報、上記遺伝子の発現が見られるか否かに関する情
報、および、上記発現が見られる部位に関する情報のう
ち少なくとも一つを対応付けて表示することを特徴とす
る。
【0089】これは画像データに対するアノテーション
情報の一例を一層具体的に示すものである。この方法に
よれば、画像データに対して、採取した組織に関する情
報、採取した組織の発育段階または加齢段階に関する情
報、遺伝子の発現が見られるか否かに関する情報、およ
び、発現が見られる部位に関する情報のうち少なくとも
一つを対応付けて格納し、画像データに対して、採取し
た組織に関する情報、採取した組織の発育段階または加
齢段階に関する情報、遺伝子の発現が見られるか否かに
関する情報、および、発現が見られる部位に関する情報
のうち少なくとも一つを対応付けて表示することができ
るようになる。
【0090】また、請求項24に記載の方法は、請求項
16から23のいずれか一つに記載の遺伝子発現情報管
理方法において、上記画像データおよび/または上記塩
基配列に基づいて、上記画像データ中の遺伝子の発現量
を推定する発現量推定ステップをさらに含むことを特徴
とする。
【0091】この方法によれば、画像データおよび/ま
たは塩基配列に基づいて、画像データ中の遺伝子の発現
量を推定するので、発現パターン(均一に発現、偏って
発現など)などを容易に特定することができるようにな
る。
【0092】ここで、画像データ中の蛍光色素などの発
光量や発光面積を既知の画像解析手法などにより求める
ことにより、発現量を推定してもよい。また、画像デー
タだけでなく塩基配列の情報も利用すれば、例えば、塩
基配列にリピート配列が含まれている場合にはクロスハ
イブリダイズ(同じリピートを持つ当該mRNA以外の
mRNAに対してもハイブリダイゼーション反応が起こ
る)の可能性が高いため推定された発現量に対する信用
性は低い、などの評価を自動的にできるようになる。
【0093】また、例えば、同じ組織切片に対してプロ
ーブを発光させたものと発光させないものを撮影した
り、別の種類の蛍光色素などで染色したものを撮影した
りすることにより、画像解析処理を簡単に実行すること
ができるようになる(その2枚の画像の差分をとること
により発現量を推定する等)。
【0094】また、請求項25に記載の方法は、請求項
24に記載の遺伝子発現情報管理方法において、上記発
現量推定ステップにより推定された上記発現量に従っ
て、上記画像データの表示順番をソートする発現量順ソ
ートステップをさらに含むことを特徴とする。
【0095】この方法によれば、推定された発現量に従
って、画像データの表示順番をソートするので、効率的
に実験結果を確認できるようになる。
【0096】また、請求項26に記載の方法は、請求項
16から25のいずれか一つに記載の遺伝子発現情報管
理方法において、上記画像データ、上記塩基配列、上記
発現量、上記採取した組織に関する情報、上記採取した
組織の発育段階または加齢段階に関する情報、上記遺伝
子の発現が見られるか否かに関する情報、および、上記
発現が見られる部位に関する情報のうち少なくとも一つ
に基づいて、2つ以上の上記画像データを比較する画像
比較ステップと、上記画像比較ステップの比較結果に基
づいて、2つ以上の上記画像データの相違点を抽出する
相違点抽出ステップとをさらに含むことを特徴とする。
【0097】この方法によれば、画像データ、塩基配
列、発現量、採取した組織に関する情報、採取した組織
の発育段階または加齢段階に関する情報、遺伝子の発現
が見られるか否かに関する情報、および、発現が見られ
る部位に関する情報のうち少なくとも一つに基づいて、
2つ以上の画像データを比較し、比較結果に基づいて、
2つ以上の画像データの相違点を抽出するので、画像間
の差異を効率的に抽出することができるようになる。
【0098】これにより、画像認識あるいは手作業によ
ってそれぞれの組織での発現パターンについてアノテー
ションを行ない、そのアノテーションを自動で比較し、
相違がみられるものについて抽出して表示することがで
きるようになる。
【0099】また、例えば、正常細胞と疾患細胞との比
較や、発育段階または加齢段階の時系列での比較や、薬
剤投与前と投与後の比較などを効率的に実行することが
できるようになる。
【0100】また、請求項27に記載の方法は、請求項
16から26のいずれか一つに記載の遺伝子発現情報管
理方法において、2つ以上の上記画像データから3次元
画像を作成する3次元画像作成ステップと、上記画像デ
ータの上記発現量から上記3次元画像における発現量を
シミュレーションする発現量シミュレーションステップ
とをさらに含むことを特徴とする。
【0101】この方法によれば、2つ以上の画像データ
から3次元画像を作成し、画像データの発現量から3次
元画像における発現量をシミュレーションするので、一
つの配列で臓器の全スライスをテストした場合、その画
像をつなぐことにより臓器の3次元画像をシミュレーシ
ョンし、各画像を画像解析して求めたmRNAの発現量
を3次元的に補正し表示することができるようになる。
【0102】また、請求項28に記載の方法は、請求項
18から27のいずれか一つに記載の遺伝子発現情報管
理方法において、同一の上記クラスタに属する上記塩基
配列の中から、上記画像データ、上記塩基配列、上記発
現量、上記採取した組織に関する情報、上記採取した組
織の発育段階または加齢段階に関する情報、上記遺伝子
の発現が見られるか否かに関する情報、および、上記発
現が見られる部位に関する情報のうち少なくとも一つに
基づいて、代表クローンを決定する代表クローン決定ス
テップをさらに含むことを特徴とする。
【0103】この方法によれば、同一のクラスタに属す
る塩基配列の中から、画像データ、塩基配列、発現量、
採取した組織に関する情報、採取した組織の発育段階ま
たは加齢段階に関する情報、遺伝子の発現が見られるか
否かに関する情報、および、発現が見られる部位に関す
る情報のうち少なくとも一つに基づいて、代表クローン
を決定するので、例えば、同じmRNAに由来するクロ
ーン群のうち最もよい実験データがとれるクローンを一
つ選んで代表クローンとして抽出することができるよう
になる。また、同じmRNA由来と思われるESTは同
じクラスタに分類し、代表クローンのみを実験すること
によって、その後の実験回数を減らすことができる。つ
まり、クラスタリングによって、それまではEST数の
実験が必要だったのに対し、代表クローン(クラスタ数
存在する)についてのみ実験を行うことで足りるように
なる。
【0104】ここで、同一mRNAに由来するcDNA
クローンであっても切断箇所により配列が少しずつ異な
る。in situハイブリダイゼーションを実施した
ときにそのcDNA配列によってきれいに発現シグナル
がでるものとそうでないものがあるため、画像データを
みてきれいにシグナルが出ているクローンを代表クロー
ンとしてもよい。
【0105】また、cDNAクローンの塩基配列は、リ
ピート配列を持たないものや、実験に適した配列長のも
のを代表クローンとしてもよい。
【0106】また、請求項29に記載の方法は、請求項
18から28のいずれか一つに記載の遺伝子発現情報管
理方法において、上記クラスタ配列のホモロジー検索結
果、上記画像データ、上記塩基配列、上記発現量、上記
採取した組織に関する情報、上記採取した組織の発育段
階または加齢段階に関する情報、上記遺伝子の発現が見
られるか否かに関する情報、および、上記発現が見られ
る部位に関する情報のうち少なくとも一つに基づいて、
クラスタ重要度を決定するクラスタ重要度決定ステップ
をさらに含むことを特徴とする。
【0107】この方法によれば、クラスタ配列のホモロ
ジー検索結果、画像データ、塩基配列、発現量、採取し
た組織に関する情報、採取した組織の発育段階または加
齢段階に関する情報、遺伝子の発現が見られるか否かに
関する情報、および、発現が見られる部位に関する情報
のうち少なくとも一つに基づいてクラスタ重要度を決定
するので、これらの情報に基づいてクラスタの重要度を
任意に決定し、利用者が注目するクラスタを容易に発見
することができるようになる。
【0108】例えば、発現量と組織に関する情報に基づ
いて特定の発育段階または加齢段階の組織で高い発現を
示すクローンについて重要度を高く決定してもよく、さ
らに、その塩基配列に対するホモロジー検索結果により
既存の遺伝子配列DBにヒットしない(すなわち、既知
の類似配列が存在しない)ものであれば、さらに重要度
を高く決定してもよい。
【0109】また、請求項30に記載の方法は、請求項
16から29のいずれか一つに記載の遺伝子発現情報管
理方法において、上記塩基配列の存在する染色体上の遺
伝子座を特定する遺伝子座特定ステップと、上記染色体
の上記遺伝子座に上記塩基配列に関する情報をマッピン
グすることにより染色体マップを作成する染色体マップ
作成ステップと、上記染色体マップ作成ステップにて作
成した上記染色体マップを表示する染色体マップ表示ス
テップとをさらに含むことを特徴とする。
【0110】この方法によれば、塩基配列の存在する染
色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配
列に関する情報(例えば、画像データ、塩基配列、発現
量、採取した組織に関する情報、採取した組織の発育段
階または加齢段階に関する情報、遺伝子の発現が見られ
るか否かに関する情報、および、発現が見られる部位に
関する情報など)をマッピングすることにより染色体マ
ップを作成することができるようになる。
【0111】また、当該染色体マップの遺伝子座に対応
する部分(特定のマークなどを表示しても良い)を選択
すると、その詳細な塩基配列に関する情報を表示するよ
うにしてもよい。
【0112】また、本発明はプログラムに関するもので
あり、請求項31に記載のプログラムは、遺伝子の発現
に関する画像データを入力する画像データ入力ステップ
と、上記発現した上記遺伝子の塩基配列を入力する塩基
配列入力ステップと、上記塩基配列入力ステップにより
入力された上記塩基配列に対してホモロジー検索を行い
類似塩基配列を抽出するホモロジー検索ステップと、上
記画像データと対応する上記塩基配列とその上記類似塩
基配列とを表示する表示ステップとを含むことを特徴と
する。
【0113】このプログラムによれば、遺伝子の発現に
関する画像データを入力し、発現した遺伝子の塩基配列
(例えば、cDNAクローンの塩基配列など)を入力
し、入力された塩基配列に対してホモロジー検索を行い
類似塩基配列を抽出し、画像データと対応する塩基配列
とその類似塩基配列とを表示するので、画像データにお
いて発現した遺伝子を容易に特定することができるよう
になる。
【0114】すなわち、例えばin situハイブリ
ダイゼーションなどの遺伝子発現実験において撮影され
た画像データに対応する、プローブとして用いたcDN
Aの塩基配列について、塩基配列データベース(EST
データベースや完全長cDNAデータベースなど)に格
納された既知の塩基配列とホモロジー検索(例えば、F
astA、Blastなど)を行い、類似性の高い塩基
配列を表示することにより、当該cDNAを特定し、当
該cDNAと画像データとを併記して分かり易く表示す
ることができるようになる。
【0115】また、類似塩基配列と一緒に当該塩基配列
と類似塩基配列との間の類似度(例えば、ホモロジー検
索のスコアなど)を表示してもよい。これにより、最も
類似する塩基配列を表示したり、ホモロジースコアの高
い順にソートして類似配列を表示したりすることができ
るようになる。
【0116】さらに、類似配列に付属する情報として、
遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子
が取得されている生物種、当該遺伝子が取得された臓器
名や組織名、当該遺伝子のGenBankデータベース
でのID、当該遺伝子の産物タンパク質のGenBan
kデータベースでのID、当該cDNAの塩基配列が当
該遺伝子配列にどのくらいの長さでどのくらい一致した
か、または、当該遺伝子の存在の証拠に関する情報のう
ち少なくとも一つを類似配列と併記して表示してもよ
い。
【0117】また、請求項32に記載のプログラムは、
請求項31に記載のプログラムにおいて、上記ホモロジ
ー検索ステップは、(1)既に同じあるいは別の生物で
既知となっている遺伝子、(2)未知の遺伝子であるが
同じcDNAが既に取得されている遺伝子、(3)未知
の遺伝子であるが対応するゲノムDNA断片が既に取得
されている遺伝子、(4)染色体上での位置がわかって
いる遺伝子、(5)既に特許が取得されている遺伝子、
のうち少なくとも一つの遺伝子の塩基配列を対象として
ホモロジー検索を行うことを特徴とする。
【0118】これはホモロジー検索の一例を一層具体的
に示すものである。このプログラムによれば、ホモロジ
ー検索は、(1)既に同じあるいは別の生物で既知とな
っている遺伝子、(2)未知の遺伝子であるが同じcD
NAが既に取得されている遺伝子、(3)未知の遺伝子
であるが対応するゲノムDNA断片が既に取得されてい
る遺伝子、(4)染色体上での位置がわかっている遺伝
子、(5)既に特許が取得されている遺伝子のうち少な
くとも一つの遺伝子の塩基配列を対象としてホモロジー
検索を行うので、画像データの持つ生物学的な重要度な
どを容易に特定することができるようになる。
【0119】すなわち、(1)から(5)の各カテゴリ
の塩基配列を格納した各塩基情報データベースを対象と
してホモロジー検索を行うことができるようになるの
で、各カテゴリで最も類似度の高い塩基配列を個別に特
定することができるようになる。
【0120】また、請求項33に記載のプログラムは、
遺伝子の発現に関する画像データを入力する画像データ
入力ステップと、上記発現した上記遺伝子の塩基配列を
入力する塩基配列入力ステップと、上記塩基配列入力ス
テップにより入力された上記塩基配列に対してクラスタ
リングを行い、上記塩基配列を特定のクラスタに分類す
るクラスタリングステップと、上記クラスタ毎に上記画
像データと対応する上記塩基配列とを表示する表示ステ
ップとを含むことを特徴とする。
【0121】このプログラムによれば、遺伝子の発現に
関する画像データを入力し、発現した遺伝子の塩基配列
(例えば、cDNAクローンの塩基配列など)を入力
し、入力された塩基配列に対してクラスタリングを行
い、塩基配列を特定のクラスタに分類し、クラスタ毎に
画像データと対応する塩基配列とを表示するので、例え
ば同じmRNAに由来するcDNA(EST配列)を同
じクラスタに分類すること等により、同一の性質を持つ
塩基配列を集めて特定のクラスタに分類することができ
るようになる。
【0122】これにより、cDNAライブラリーからラ
ンダムに抽出したcDNAクローンの重複を排除するこ
と等ができるようになり、さらに、実験結果のまとめ作
業を効率化することができるようになる。
【0123】また、請求項34に記載のプログラムは、
請求項33に記載のプログラムにおいて、上記クラスタ
リングステップにより同一の上記クラスタに分類された
上記塩基配列からクラスタ配列を決定するクラスタ配列
決定ステップをさらに含み、上記表示ステップは、上記
クラスタ毎に上記クラスタ配列と上記画像データと対応
する上記塩基配列とを表示することを特徴とする。
【0124】このプログラムによれば、同一のクラスタ
に分類された塩基配列からクラスタ配列を決定し、クラ
スタ毎にクラスタ配列と画像データと対応する塩基配列
とを表示するので、例えば、クラスタのメンバーの塩基
配列を組み合わせて作成した塩基配列(例えば、完全長
cDNAなど)をクラスタ配列として決定し、表示する
ことができるようになる。
【0125】これにより、部分的なcDNA配列(ES
T配列)を用いた実験から、完全長cDNA(mRNA
配列)などの遺伝子配列を容易に予想することができる
ようになる。
【0126】また、請求項35に記載のプログラムは、
請求項33または34に記載のプログラムにおいて、上
記クラスタリングステップは、上記塩基配列を用いて共
通配列のアセンブルを行い、同一の上記共通配列を構成
した上記塩基配列を同一の上記クラスタに分類し、上記
クラスタ配列決定ステップは、上記クラスタの上記共通
配列を上記クラスタ配列として決定することを特徴とす
る。
【0127】このプログラムによれば、塩基配列を用い
て共通配列のアセンブルを行い、同一の共通配列を構成
した塩基配列を同一のクラスタに分類し、クラスタの共
通配列をクラスタ配列として決定するので、アセンブル
技術(短い断片配列から長い配列を作成する技術をい
う。例えば、断片配列間の配列の重なりをマルチプルア
ラインメントなどの手法を用いて探索し、重なりを持つ
断片配列同士を合成することにより長い配列を生成す
る。)により部分的なcDNA配列からより完全長に近
いcDNA配列を作成することができるようになる。
【0128】また、請求項36に記載のプログラムは、
請求項34または35に記載のプログラムにおいて、上
記クラスタ配列決定ステップにより決定された上記クラ
スタ配列に対してホモロジー検索を行い類似塩基配列を
抽出するクラスタ配列ホモロジー検索ステップをさらに
含み、上記表示ステップは、上記クラスタ毎に上記クラ
スタ配列とその類似配列と上記画像データと対応する上
記塩基配列とを表示することを特徴とする。
【0129】このプログラムによれば、決定されたクラ
スタ配列に対してホモロジー検索を行い類似塩基配列を
抽出し、クラスタ毎にクラスタ配列とその類似配列と画
像データと対応する塩基配列とを表示するので、画像デ
ータにおいて発現した遺伝子を容易に特定することがで
きるようになる。
【0130】すなわち、プローブに用いたcDNAの塩
基配列からアセンブルなどを実行することより合成した
クラスタ配列について、塩基配列データベース(EST
データベースや完全長cDNAデータベースなど)に格
納された既知の塩基配列とホモロジー検索(例えば、F
astA、Blastなど)を行い、類似性の高い塩基
配列を表示することにより、発現した遺伝子を容易に特
定することができるようになる。
【0131】また、類似塩基配列と一緒に当該クラスタ
配列と類似塩基配列との間の類似度(例えば、ホモロジ
ースコアなど)を表示してもよい。これにより、クラス
タ配列に最も類似する塩基配列を表示したり、ホモロジ
ースコアの高い順にソートして類似配列を表示したりす
ることができるようになる。
【0132】さらに、類似配列に付属する情報として、
遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子
が取得されている生物種、当該遺伝子が取得された臓器
名や組織名、当該遺伝子のGenBankデータベース
でのID、当該遺伝子の産物タンパク質のGenBan
kデータベースでのID、当該クラスタ配列が当該遺伝
子配列にどのくらいの長さでどのくらい一致したか、ま
たは、当該遺伝子の存在の証拠に関する情報のうち少な
くとも一つを類似配列と一緒に表示してもよい。
【0133】さらに、任意の遺伝子配列を入力すること
により、入力された遺伝子について登録されたcDNA
クローン配列とクラスタリングを行い、同一のクラスタ
に属するクラスタ配列に関する情報(画像データなど)
を表示することが可能になる。
【0134】また、請求項37に記載のプログラムは、
請求項36に記載のプログラムにおいて、上記クラスタ
配列ホモロジー検索ステップは、(1)既に同じあるい
は別の生物で既知となっている遺伝子、(2)未知の遺
伝子であるが同じcDNAが既に取得されている遺伝
子、(3)未知の遺伝子であるが対応するゲノムDNA
断片が既に取得されている遺伝子、(4)染色体上での
位置がわかっている遺伝子、(5)既に特許が取得され
ている遺伝子、のうち少なくとも一つの遺伝子の塩基配
列を対象としてホモロジー検索を行うことを特徴とす
る。
【0135】これはクラスタ配列に対するホモロジー検
索の一例を一層具体的に示すものである。このプログラ
ムによれば、ホモロジー検索は、(1)既に同じあるい
は別の生物で既知となっている遺伝子、(2)未知の遺
伝子であるが同じcDNAが既に取得されている遺伝
子、(3)未知の遺伝子であるが対応するゲノムDNA
断片が既に取得されている遺伝子、(4)染色体上での
位置がわかっている遺伝子、(5)既に特許が取得され
ている遺伝子のうち少なくとも一つの遺伝子の塩基配列
を対象としてホモロジー検索を行うので、画像データの
持つ生物学的な重要度などを容易に特定することができ
るようになる。
【0136】すなわち、(1)から(5)の各カテゴリ
の塩基配列を格納した各塩基情報データベースを対象と
してホモロジー検索を行うことができるようになるの
で、各カテゴリで最も類似度の高い塩基配列を個別に特
定することができるようになる。
【0137】また、請求項38に記載のプログラムは、
請求項31から37のいずれか一つに記載のプログラム
において、上記画像データに対して、採取した組織に関
する情報、採取した組織の発育段階または加齢段階に関
する情報、遺伝子の発現が見られるか否かに関する情
報、および、発現が見られる部位に関する情報のうち少
なくとも一つを対応付けて格納するアノテーション情報
格納ステップをさらに含み、上記表示ステップは、上記
画像データに対して、上記採取した組織に関する情報、
上記採取した組織の発育段階または加齢段階に関する情
報、上記遺伝子の発現が見られるか否かに関する情報、
および、上記発現が見られる部位に関する情報のうち少
なくとも一つを対応付けて表示することを特徴とする。
【0138】これは画像データに対するアノテーション
情報の一例を一層具体的に示すものである。このプログ
ラムによれば、画像データに対して、採取した組織に関
する情報、採取した組織の発育段階または加齢段階に関
する情報、遺伝子の発現が見られるか否かに関する情
報、および、発現が見られる部位に関する情報のうち少
なくとも一つを対応付けて格納し、画像データに対し
て、採取した組織に関する情報、採取した組織の発育段
階または加齢段階に関する情報、遺伝子の発現が見られ
るか否かに関する情報、および、発現が見られる部位に
関する情報のうち少なくとも一つを対応付けて表示する
ことができるようになる。
【0139】また、請求項39に記載のプログラムは、
請求項31から38のいずれか一つに記載のプログラム
において、上記画像データおよび/または上記塩基配列
に基づいて、上記画像データ中の遺伝子の発現量を推定
する発現量推定ステップをさらに含むことを特徴とす
る。
【0140】このプログラムによれば、画像データおよ
び/または塩基配列に基づいて、画像データ中の遺伝子
の発現量を推定するので、発現パターン(均一に発現、
偏って発現など)などを容易に特定することができるよ
うになる。
【0141】ここで、画像データ中の蛍光色素などの発
光量や発光面積を既知の画像解析手法などにより求める
ことにより、発現量を推定してもよい。また、画像デー
タだけでなく塩基配列の情報も利用すれば、例えば、塩
基配列にリピート配列が含まれている場合にはクロスハ
イブリダイズ(同じリピートを持つ当該mRNA以外の
mRNAに対してもハイブリダイゼーション反応が起こ
る)の可能性が高いため推定された発現量に対する信用
性は低い、などの評価を自動的にできるようになる。
【0142】また、例えば、同じ組織切片に対してプロ
ーブを発光させたものと発光させないものを撮影した
り、別の種類の蛍光色素などで染色したものを撮影した
りすることにより、画像解析処理を簡単に実行すること
ができるようになる(その2枚の画像の差分をとること
により発現量を推定する等)。
【0143】また、請求項40に記載のプログラムは、
請求項39に記載のプログラムにおいて、上記発現量推
定ステップにより推定された上記発現量に従って、上記
画像データの表示順番をソートする発現量順ソートステ
ップをさらに含むことを特徴とする。
【0144】このプログラムによれば、推定された発現
量に従って、画像データの表示順番をソートするので、
効率的に実験結果を確認できるようになる。
【0145】また、請求項41に記載のプログラムは、
請求項31から40のいずれか一つに記載のプログラム
において、上記画像データ、上記塩基配列、上記発現
量、上記採取した組織に関する情報、上記採取した組織
の発育段階または加齢段階に関する情報、上記遺伝子の
発現が見られるか否かに関する情報、および、上記発現
が見られる部位に関する情報のうち少なくとも一つに基
づいて、2つ以上の上記画像データを比較する画像比較
ステップと、上記画像比較ステップの比較結果に基づい
て、2つ以上の上記画像データの相違点を抽出する相違
点抽出ステップとをさらに含むことを特徴とする。
【0146】このプログラムによれば、画像データ、塩
基配列、発現量、採取した組織に関する情報、採取した
組織の発育段階または加齢段階に関する情報、遺伝子の
発現が見られるか否かに関する情報、および、発現が見
られる部位に関する情報のうち少なくとも一つに基づい
て、2つ以上の画像データを比較し、比較結果に基づい
て、2つ以上の画像データの相違点を抽出するので、画
像間の差異を効率的に抽出することができるようにな
る。
【0147】これにより、画像認識あるいは手作業によ
ってそれぞれの組織での発現パターンについてアノテー
ションを行ない、そのアノテーションを自動で比較し、
相違がみられるものについて抽出して表示することがで
きるようになる。
【0148】また、例えば、正常細胞と疾患細胞との比
較や、発育段階または加齢段階の時系列での比較や、薬
剤投与前と投与後の比較などを効率的に実行することが
できるようになる。
【0149】また、請求項42に記載のプログラムは、
請求項31から41のいずれか一つに記載のプログラム
において、2つ以上の上記画像データから3次元画像を
作成する3次元画像作成ステップと、上記画像データの
上記発現量から上記3次元画像における発現量をシミュ
レーションする発現量シミュレーションステップとをさ
らに含むことを特徴とする。
【0150】このプログラムによれば、2つ以上の画像
データから3次元画像を作成し、画像データの発現量か
ら3次元画像における発現量をシミュレーションするの
で、一つの配列で臓器の全スライスをテストした場合、
その画像をつなぐことにより臓器の3次元画像をシミュ
レーションし、各画像を画像解析して求めたmRNAの
発現量を3次元的に補正し表示することができるように
なる。
【0151】また、請求項43に記載のプログラムは、
請求項33から42のいずれか一つに記載のプログラム
において、同一の上記クラスタに属する上記塩基配列の
中から、上記画像データ、上記塩基配列、上記発現量、
上記採取した組織に関する情報、上記採取した組織の発
育段階または加齢段階に関する情報、上記遺伝子の発現
が見られるか否かに関する情報、および、上記発現が見
られる部位に関する情報のうち少なくとも一つに基づい
て、代表クローンを決定する代表クローン決定ステップ
をさらに含むことを特徴とする。
【0152】このプログラムによれば、同一のクラスタ
に属する塩基配列の中から、画像データ、塩基配列、発
現量、採取した組織に関する情報、採取した組織の発育
段階または加齢段階に関する情報、遺伝子の発現が見ら
れるか否かに関する情報、および、発現が見られる部位
に関する情報のうち少なくとも一つに基づいて、代表ク
ローンを決定するので、例えば、同じmRNAに由来す
るクローン群のうち最もよい実験データがとれるクロー
ンを一つ選んで代表クローンとして抽出することができ
るようになる。また、同じmRNA由来と思われるES
Tは同じクラスタに分類し、代表クローンのみを実験す
ることによって、その後の実験回数を減らすことができ
る。つまり、クラスタリングによって、それまではES
T数の実験が必要だったのに対し、代表クローン(クラ
スタ数存在する)についてのみ実験を行うことで足りる
ようになる。
【0153】ここで、同一mRNAに由来するcDNA
クローンであっても切断箇所により配列が少しずつ異な
る。in situハイブリダイゼーションを実施した
ときにそのcDNA配列によってきれいに発現シグナル
がでるものとそうでないものがあるため、画像データを
みてきれいにシグナルが出ているクローンを代表クロー
ンとしてもよい。
【0154】また、cDNAクローンの塩基配列は、リ
ピート配列を持たないものや、実験に適した配列長のも
のを代表クローンとしてもよい。
【0155】また、請求項44に記載のプログラムは、
請求項33から43のいずれか一つに記載のプログラム
において、上記クラスタ配列のホモロジー検索結果、上
記画像データ、上記塩基配列、上記発現量、上記採取し
た組織に関する情報、上記採取した組織の発育段階また
は加齢段階に関する情報、上記遺伝子の発現が見られる
か否かに関する情報、および、上記発現が見られる部位
に関する情報のうち少なくとも一つに基づいて、クラス
タ重要度を決定するクラスタ重要度決定ステップをさら
に含むことを特徴とする。
【0156】このプログラムによれば、クラスタ配列の
ホモロジー検索結果、画像データ、塩基配列、発現量、
採取した組織に関する情報、採取した組織の発育段階ま
たは加齢段階に関する情報、遺伝子の発現が見られるか
否かに関する情報、および、発現が見られる部位に関す
る情報のうち少なくとも一つに基づいてクラスタ重要度
を決定するので、これらの情報に基づいてクラスタの重
要度を任意に決定し、利用者が注目するクラスタを容易
に発見することができるようになる。
【0157】例えば、発現量と組織に関する情報に基づ
いて特定の発育段階または加齢段階の組織で高い発現を
示すクローンについて重要度を高く決定してもよく、さ
らに、その塩基配列に対するホモロジー検索結果により
既存の遺伝子配列DBにヒットしない(すなわち、既知
の類似配列が存在しない)ものであれば、さらに重要度
を高く決定してもよい。
【0158】また、請求項45に記載のプログラムは、
請求項31から44のいずれか一つに記載のプログラム
において、上記塩基配列の存在する染色体上の遺伝子座
を特定する遺伝子座特定ステップと、上記染色体の上記
遺伝子座に上記塩基配列に関する情報をマッピングする
ことにより染色体マップを作成する染色体マップ作成ス
テップと、上記染色体マップ作成ステップにて作成した
上記染色体マップを表示する染色体マップ表示ステップ
とをさらに含むことを特徴とする。
【0159】このプログラムによれば、塩基配列の存在
する染色体上の遺伝子座を特定し、染色体の遺伝子座に
塩基配列に関する情報(例えば、画像データ、塩基配
列、発現量、採取した組織に関する情報、採取した組織
の発育段階または加齢段階に関する情報、遺伝子の発現
が見られるか否かに関する情報、および、発現が見られ
る部位に関する情報など)をマッピングすることにより
染色体マップを作成することができるようになる。
【0160】また、当該染色体マップの遺伝子座に対応
する部分(特定のマークなどを表示しても良い)を選択
すると、その詳細な塩基配列に関する情報を表示するよ
うにしてもよい。
【0161】また、本発明は記録媒体に関するものであ
り、請求項46に記載の記録媒体は、上記請求項31か
ら45のいずれか一つに記載されたプログラムを記録し
たことを特徴とする。
【0162】この記録媒体によれば、当該記録媒体に記
録されたプログラムをコンピュータに読み取らせて実行
することによって、請求項31から45のいずれか一つ
に記載されたプログラムをコンピュータを利用して実現
することができ、これら各方法と同様の効果を得ること
ができる。
【0163】
【発明の実施の形態】以下に、本発明にかかる遺伝子発
現情報管理装置、遺伝子発現情報管理方法、プログラ
ム、および、記録媒体の実施の形態を図面に基づいて詳
細に説明する。なお、この実施の形態によりこの発明が
限定されるものではない。特に、以下の実施の形態にお
いては、本発明を、高速in situハイブリダイゼ
ーションによる実験データを収集する場合に適用した例
について説明するが、この場合に限られず、他の手法に
より遺伝子の発現情報を解析する全ての実験手法を用い
る場合において、同様に適用することができる。
【0164】[本発明の概要]以下、本発明の概要につ
いて説明し、その後、本発明の構成および処理等につい
て詳細に説明する。図3は本発明の基本原理を示す原理
構成図である。
【0165】本発明は、概略的に、以下の基本的特徴を
有する。すなわち、図3に示すように、まず、本発明
は、in situハイブリダイゼーション結果の画像
データと対応する発現遺伝子(cDNA)の塩基配列デ
ータを格納し、当該画像データに対するアノテーション
情報(採取した組織に関する情報、採取した組織の発育
段階または加齢段階に関する情報、遺伝子の発現が見ら
れるか否かに関する情報、および、発現が見られる細胞
などの部位に関する情報など)を利用者に入力させる。
また、本発明は、これらのアノテーション情報について
既知の画像解析技術を用いて画像データから自動的に認
識する。
【0166】そして、本発明は、入力されたcDNAの
塩基配列に対して、塩基配列データベース(ESTデー
タベースや完全長cDNAデータベースなど)に格納さ
れた既知の塩基配列を対象としてホモロジー検索を行
い、その類似塩基配列を抽出し、画像データと対応する
塩基配列、その類似塩基配列、ホモロジースコア等を表
示する。
【0167】また、本発明は、既に同じあるいは別の生
物で既知となっている遺伝子、未知の遺伝子であるが同
じcDNAが既に取得されている遺伝子、未知の遺伝子
であるが対応するゲノムDNA断片が既に取得されてい
る遺伝子、染色体上での位置がわかっている遺伝子、既
に特許が取得されている遺伝子のうち少なくとも一つの
遺伝子の塩基配列を対象として、cDNAクローン塩基
の配列データとホモロジー検索を行う。
【0168】また、本発明は、例えば同じmRNAに由
来するcDNA(EST配列)を同じクラスタに分類す
ること等により、同一の性質を持つ塩基配列を集めて特
定のクラスタに分類する。また、同一のクラスタに分類
された塩基配列からクラスタ配列を決定し、クラスタ毎
にクラスタ配列と画像データと対応する塩基配列とを表
示する。また、塩基配列を用いて共通配列のアセンブル
を行い、同一の共通配列を構成した塩基配列を同一のク
ラスタに分類し、クラスタの共通配列をクラスタ配列と
して決定してもよい。
【0169】また、本発明は、決定されたクラスタ配列
に対してホモロジー検索を行い類似塩基配列を抽出し、
クラスタ毎にクラスタ配列とその類似配列と画像データ
と対応する塩基配列とを表示する。
【0170】また、本発明は、画像データおよび/また
は塩基配列に基づいて、画像データ中の遺伝子の発現量
を推定する。また、推定された発現量に従って、画像デ
ータの表示順番をソートしてもよい。
【0171】また、本発明は、画像データ、塩基配列、
発現量、採取した組織に関する情報、採取した組織の発
育段階または加齢段階に関する情報、遺伝子の発現が見
られるか否かに関する情報、および、発現が見られる部
位に関する情報のうち少なくとも一つに基づいて、2つ
以上の画像データを比較し、比較結果に基づいて、2つ
以上の画像データの相違点を抽出する。
【0172】また、本発明は、2つ以上の画像データか
ら3次元画像を作成し、画像データの発現量から3次元
画像における発現量をシミュレーションする。
【0173】また、本発明は、同一のクラスタに属する
塩基配列の中から、画像データ、塩基配列、発現量、採
取した組織に関する情報、採取した組織の発育段階また
は加齢段階に関する情報、遺伝子の発現が見られるか否
かに関する情報、および、発現が見られる部位に関する
情報のうち少なくとも一つに基づいて、代表クローンを
決定する。
【0174】また、本発明は、クラスタ配列のホモロジ
ー検索結果、画像データ、塩基配列、発現量、採取した
組織に関する情報、採取した組織の発育段階または加齢
段階に関する情報、遺伝子の発現が見られるか否かに関
する情報、および、発現が見られる部位に関する情報の
うち少なくとも一つに基づいてクラスタ重要度を決定す
る。
【0175】さらに、本発明は、塩基配列の存在する染
色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配
列に関する情報(例えば、画像データ、塩基配列、発現
量、採取した組織に関する情報、採取した組織の発育段
階または加齢段階に関する情報、遺伝子の発現が見られ
るか否かに関する情報、および、発現が見られる部位に
関する情報など)をマッピングすることにより染色体マ
ップを作成する。
【0176】[システム構成]まず、本システムの構成
について説明する。図4は、本発明が適用される本シス
テムの構成の一例を示すブロック図であり、該構成のう
ち本発明に関係する部分のみを概念的に示している。本
システムは、概略的に、遺伝子発現情報管理装置100
と、配列情報等に関する外部データベースやホモロジー
検索等の外部プログラム等を提供する外部システム20
0とを、ネットワーク300を介して通信可能に接続し
て構成されている。
【0177】図4においてネットワーク300は、遺伝
子発現情報管理装置100と外部システム200とを相
互に接続する機能を有し、例えば、インターネット等で
ある。
【0178】図4において外部システム200は、ネッ
トワーク300を介して、遺伝子発現情報管理装置10
0と相互に接続され、利用者に対してcDNAなどの配
列情報等に関する外部データベースや、ホモロジー検索
等の外部プログラムを実行するウェブサイトを提供する
機能を有する。
【0179】ここで、外部システム200は、WEBサ
ーバやASPサーバ等として構成してもよく、そのハー
ドウェア構成は、一般に市販されるワークステーショ
ン、パーソナルコンピュータ等の情報処理装置およびそ
の付属装置により構成してもよい。また、外部システム
200の各機能は、外部システム200のハードウェア
構成中のCPU、ディスク装置、メモリ装置、入力装
置、出力装置、通信制御装置等およびそれらを制御する
プログラム等により実現される。
【0180】図4において遺伝子発現情報管理装置10
0は、概略的に、遺伝子発現情報管理装置100の全体
を統括的に制御するCPU等の制御部102、通信回線
等に接続されるルータ等の通信装置(図示せず)に接続
される通信制御インターフェース部104、入力装置1
12や出力装置114に接続される入出力制御インター
フェース部108、および、各種のデータベースやテー
ブルなどを格納する記憶部106を備えて構成されてお
り、これら各部は任意の通信路を介して通信可能に接続
されている。さらに、この遺伝子発現情報管理装置10
0は、ルータ等の通信装置および専用線等の有線または
無線の通信回線を介して、ネットワーク300に通信可
能に接続されている。
【0181】記憶部106に格納される各種のデータベ
ースやテーブル(cDNAクローンデータベース106
a〜核酸配列データベース106h)は、固定ディスク
装置等のストレージ手段であり、各種処理に用いる各種
のプログラムやテーブルやファイルやデータベースやウ
ェブページ用ファイル等を格納する。
【0182】これら記憶部106の各構成要素のうち、
cDNAクローンデータベース106aは、各cDNA
クローンを一意に識別するcDNAクローン識別情報
と、その塩基配列(EST配列)とを対応付けて格納す
る。
【0183】また、クラスタデータベース106bは、
各クラスタを一意に識別するクラスタ識別情報と、クラ
スタを構成するcDNAクローンのcDNAクローン識
別情報と、クラスタ配列を一意に識別するクラスタ配列
識別情報と、代表クローンのcDNAクローン識別情報
とを対応付けて格納する。
【0184】また、ホモロジー検索結果データベース1
06cは、cDNAクローン識別情報と、cDNAクロ
ーンの塩基配列に対して各種の塩基配列データベースに
格納された塩基配列を対象としてホモロジー検索を行っ
た検索結果とを対応付けて格納する。
【0185】また、クラスタ配列データベース106d
は、クラスタ配列識別情報と、クラスタ配列の塩基配列
とを対応付けて格納する。
【0186】また、クラスタ配列ホモロジー検索結果デ
ータベース106eは、クラスタ配列識別情報と、クラ
スタ配列の塩基配列に対して各種の塩基配列データベー
スに格納された塩基配列を対象としてホモロジー検索を
行った検索結果とを対応付けて格納する。
【0187】また、ベクタ配列データベース106f
は、cDNAクローン識別情報と、cDNAクローンを
組み込んだベクタの塩基配列とを対応付けて格納する。
【0188】また、画像データベース106gは、画像
データを一意に識別するための画像識別情報と、cDN
Aクローン識別情報と、アノテーション情報(例えば、
遺伝子の発現量、採取した組織に関する情報、採取した
組織の発育段階または加齢段階に関する情報、遺伝子の
発現が見られるか否かに関する情報、および、発現が見
られる部位に関する情報など)とを対応付けて格納す
る。
【0189】また、核酸配列データベース106hは、
EST配列や完全長cDNA配列などの塩基配列を格納
したデータベースである。核酸配列データベース106
hは、インターネットを経由してアクセスする外部の塩
基配列データベースであってもよく、また、これらのデ
ータベースをコピーしたり、オリジナルの配列情報を格
納したり、さらに独自のアノテーション情報等を付加し
たりして作成したインハウスデータベースであってもよ
い。ここで、核酸配列データベース106hは、(1)
既に同じあるいは別の生物で既知となっている遺伝子、
(2)未知の遺伝子であるが同じcDNAが既に取得さ
れている遺伝子、(3)未知の遺伝子であるが対応する
ゲノムDNA断片が既に取得されている遺伝子、(4)
染色体上での位置がわかっている遺伝子、(5)既に特
許が取得されている遺伝子に関する塩基配列を格納して
もよい。
【0190】また、図4において、通信制御インターフ
ェース部104は、遺伝子発現情報管理装置100とネ
ットワーク300(またはルータ等の通信装置)との間
における通信制御を行う。すなわち、通信制御インター
フェース部104は、他の端末と通信回線を介してデー
タを通信する機能を有する。
【0191】また、図4において、入出力制御インター
フェース部108は、入力装置112や出力装置114
の制御を行う。ここで、出力装置114としては、モニ
タ(家庭用テレビを含む)の他、スピーカを用いること
ができる(なお、以下においては出力装置114をモニ
タとして記載する場合がある)。また、入力装置112
としては、キーボード、マウス、および、マイク等を用
いることができる。また、モニタも、マウスと協働して
ポインティングデバイス機能を実現する。
【0192】また、図4において、制御部102は、O
S(Operating System)等の制御プロ
グラム、各種の処理手順等を規定したプログラム、およ
び所要データを格納するための内部メモリを有し、これ
らのプログラム等により、種々の処理を実行するための
情報処理を行う。制御部102は、機能概念的に、画像
アノテーション情報入力部102a、cDNAクローン
配列ホモロジー検索部102b、cDNAクローンクラ
スタリング部102c、クラスタ配列決定部102d、
クラスタ配列ホモロジー検索部102e、3次元シミュ
レーション部102f、発現量推定部102g、画像比
較部102h、代表クローン決定部102i、クラスタ
重要度決定部102j、外部データベースアクセス部1
02k、染色体マップ作成部102m、および、表示画
面作成部102nを備えて構成されている。
【0193】このうち、画像アノテーション情報入力部
102aは、遺伝子の発現に関する画像データを入力す
る画像データ入力手段、および、発現した遺伝子の塩基
配列を入力する塩基配列入力手段である。また、cDN
Aクローン配列ホモロジー検索部102bは、塩基配列
入力手段により入力された塩基配列に対してホモロジー
検索を行い類似塩基配列を抽出するホモロジー検索手段
である。また、cDNAクローンクラスタリング部10
2cは、塩基配列入力手段により入力された塩基配列に
対してクラスタリングを行い、塩基配列を特定のクラス
タに分類するクラスタリング手段である。
【0194】また、クラスタ配列決定部102dは、ク
ラスタリング手段により同一のクラスタに分類された塩
基配列からクラスタ配列を決定するクラスタ配列決定手
段である。また、クラスタ配列ホモロジー検索部102
eは、クラスタ配列決定手段により決定されたクラスタ
配列に対してホモロジー検索を行い類似塩基配列を抽出
するクラスタ配列ホモロジー検索手段である。また、3
次元シミュレーション部102fは、2つ以上の画像デ
ータから3次元画像を作成する3次元画像作成手段、お
よび、画像データの発現量から3次元画像における発現
量をシミュレーションする発現量シミュレーション手段
である。
【0195】また、発現量推定部102gは、画像デー
タおよび/または塩基配列に基づいて、画像データ中の
遺伝子の発現量を推定する発現量推定手段、および、発
現量推定手段により推定された発現量に従って、画像デ
ータの表示順番をソートする発現量順ソート手段であ
る。また、画像比較部102hは、画像データ、塩基配
列、発現量、採取した組織に関する情報、採取した組織
の発育段階または加齢段階に関する情報、遺伝子の発現
が見られるか否かに関する情報、および、発現が見られ
る部位に関する情報のうち少なくとも一つに基づいて、
2つ以上の画像データを比較する画像比較手段、およ
び、画像比較手段の比較結果に基づいて、2つ以上の画
像データの相違点を抽出する相違点抽出手段である。
【0196】また、代表クローン決定部102iは、同
一の上記クラスタに属する上記塩基配列の中から、画像
データ、塩基配列、発現量、採取した組織に関する情
報、採取した組織の発育段階または加齢段階に関する情
報、遺伝子の発現が見られるか否かに関する情報、およ
び、発現が見られる部位に関する情報のうち少なくとも
一つに基づいて、代表クローンを決定する代表クローン
決定手段である。
【0197】また、クラスタ重要度決定部102jは、
クラスタに対して、クラスタ配列のホモロジー検索結
果、画像データ、塩基配列、発現量、採取した組織に関
する情報、採取した組織の発育段階または加齢段階に関
する情報、遺伝子の発現が見られるか否かに関する情
報、および、発現が見られる部位に関する情報のうち少
なくとも一つに基づいて、クラスタ重要度を決定するク
ラスタ重要度決定手段である。また、外部データベース
アクセス部102kは、ネットワーク300を介して外
部システム200の外部データベースにアクセスする外
部データベースアクセス手段である。
【0198】また、染色体マップ作成部102mは、塩
基配列の存在する染色体上の遺伝子座を特定する遺伝子
座特定手段、染色体の遺伝子座に塩基配列に関する情報
をマッピングすることにより染色体マップを作成する染
色体マップ作成手段、および、染色体マップ作成手段に
て作成した染色体マップを表示する染色体マップ表示手
段である。また、表示画面作成部102nは、画像デー
タと対応する塩基配列とその類似塩基配列とを表示する
表示手段、および、クラスタ毎に画像データと対応する
塩基配列とを表示する表示手段である。なお、これら各
部によって行なわれる処理の詳細については、後述す
る。
【0199】[システムの処理]次に、このように構成
された本実施の形態における本システムの処理の一例に
ついて、以下に図5〜図13を参照して詳細に説明す
る。
【0200】[画像アノテーション情報入力処理]ま
ず、画像アノテーション情報入力処理の詳細について図
5を参照して説明する。図5は、本実施形態における本
システムの画像アノテーション情報入力処理の一例を示
すフローチャートである。
【0201】まず、遺伝子発現情報管理装置100は、
画像アノテーション情報入力部102aの処理により、
アノテーション情報入力画面を出力装置114に表示す
る(ステップSB−1)。
【0202】ここで、図13は、モニタに表示されるア
ノテーション情報入力画面の表示画面の一例を示す図で
ある。この図に示すようにアノテーション情報入力画面
は、例えば、画像識別情報の入力領域(図中の
(1))、cDNAクローン識別情報の入力領域(図中
の(2))、cDNAクローンの塩基配列決定が完了し
ているか否かを示す情報の入力領域(図中の(3))、
切片を採取した組織名の入力領域(図中の(4))、切
片を採取した生物の発育段階または加齢段階の入力領域
(図中の(5))、どの細胞や組織などの部分領域に発
現が見られるかを示す情報の入力領域(図中の(6)〜
(11))、切片上に遺伝子の発現が見られるか否かを
示す情報の入力領域(図中の(12)〜(15))、お
よび、画像データの表示領域(図中の(16))を含ん
で構成されている。
【0203】ついで、ユーザがアノテーション情報入力
画面を確認して各種の情報を入力装置112を介して入
力すると(ステップSB−2)、遺伝子発現情報管理装
置100は、画像アノテーション情報入力部102aの
処理により、記憶部106の所定の記憶領域に入力情報
を格納する(ステップSB−3)。これにて、画像アノ
テーション情報入力処理が終了する。
【0204】[cDNAクローン配列ホモロジー検索処
理]次に、cDNAクローン配列ホモロジー検索処理の
詳細について図6を参照して説明する。図6は、本実施
形態における本システムのcDNAクローン配列ホモロ
ジー検索処理の一例を示すフローチャートである。
【0205】まず、遺伝子発現情報管理装置100は、
cDNAクローン配列ホモロジー検索部102bの処理
により、cDNAクローンデータベース106aにアク
セスしてcDNAクローン配列を取得する(ステップS
C−1)。
【0206】ついで、cDNAクローン配列ホモロジー
検索部102bは、核酸配列データベース106hにア
クセスして、取得したcDNAクローン配列に対するホ
モロジー検索を実行する(ステップSC−2)。cDN
Aクローン配列ホモロジー検索部102bがアクセスす
る核酸配列データベース106hには、例えば、mam
mal(哺乳動物)について既知の遺伝子配列を集めた
データベース、全生物について既知の遺伝子配列を集め
たデータベース、EST配列(cDNAクローンの断片
配列)を集めたデータベース、ゲノム配列決定プロジェ
クトによって決定されつつあるゲノムDNA配列のドラ
フトを集めたデータベース、GSS配列(ゲノムDNA
クローンの断片配列)を集めたデータベース、STS配
列(ゲノム上でマッピングされた配列)を集めたデータ
ベース、既に特許が取得されている遺伝子配列を集めた
データベースを含む。
【0207】ついで、cDNAクローン配列ホモロジー
検索部102bは、ホモロジー検索結果(例えば、類似
配列、ホモロジースコア、遺伝子名、当該遺伝子の産物
タンパク質名、当該遺伝子が取得されている生物種、当
該遺伝子が取得された臓器名や組織名、当該遺伝子のG
enBankデータベースでのID、当該遺伝子の産物
タンパク質のGenBankデータベースでのID、当
該cDNAの塩基配列が当該遺伝子配列にどのくらいの
長さでどのくらい一致したか、または、当該遺伝子の存
在の証拠に関する情報などを含む)をホモロジー検索結
果データベース106cに格納する(ステップSC−
3)。これにて、cDNAクローン配列ホモロジー検索
処理が終了する。
【0208】[アセンブル処理]次に、アセンブル処理
の詳細について図7を参照して説明する。図7は、本実
施形態における本システムのアセンブル処理の一例を示
すフローチャートである。
【0209】まず、遺伝子発現情報管理装置100は、
cDNAクローンクラスタリング部102cの処理によ
り、cDNAクローンデータベース106aにアクセス
して全てのcDNAクローンの塩基配列を取得し、既知
のアセンブラ・ソフトウェアを用いて共通配列のアセン
ブルを行う(ステップSD−1)。
【0210】そして、クラスタ配列決定部102dは、
複数のcDNAクローン配列からつながれた共通配列を
クラスタ配列として決定し、クラスタ配列データベース
106dの所定の記録領域に格納する(ステップSD−
2)。
【0211】そして、cDNAクローンクラスタリング
部102cは、同一のクラスタ配列を構成するcDNA
クローンを同一クラスタに分類し、cDNAクローンデ
ータベース106aにどのcDNAクローンがどのクラ
スタに含まれるか対応付けて記憶する(ステップSD−
3)。これにて、アセンブル処理が終了する。
【0212】[クラスタ配列ホモロジー検索処理]次
に、クラスタ配列ホモロジー検索処理の詳細について図
8を参照して説明する。図8は、本実施形態における本
システムのクラスタ配列ホモロジー検索処理の一例を示
すフローチャートである。
【0213】まず、遺伝子発現情報管理装置100は、
クラスタ配列ホモロジー検索部102eの処理により、
クラスタ配列データベース106dにアクセスしてクラ
スタ配列を取得する(ステップSE−1)。
【0214】ついで、クラスタ配列ホモロジー検索部1
02eは、核酸配列データベース106hにアクセスし
て、取得したクラスタ配列に対するホモロジー検索を実
行する(ステップSE−2)。クラスタ配列ホモロジー
検索部102eがアクセスする核酸配列データベース1
06hには、例えば、mammal(哺乳動物)につい
て既知の遺伝子配列を集めたデータベース、全生物につ
いて既知の遺伝子配列を集めたデータベース、EST配
列(cDNAクローンの断片配列)を集めたデータベー
ス、ゲノム配列決定プロジェクトによって決定されつつ
あるゲノムDNA配列のドラフトを集めたデータベー
ス、GSS配列(ゲノムDNAクローンの断片配列)を
集めたデータベース、STS配列(ゲノム上でマッピン
グされた配列)を集めたデータベース、既に特許が取得
されている遺伝子配列を集めたデータベースを含む。
【0215】ついで、クラスタ配列ホモロジー検索部1
02eは、ホモロジー検索結果(例えば、類似配列、ホ
モロジースコア、遺伝子名、当該遺伝子の産物タンパク
質名、当該遺伝子が取得されている生物種、当該遺伝子
が取得された臓器名や組織名、当該遺伝子のGenBa
nkデータベースでのID、当該遺伝子の産物タンパク
質のGenBankデータベースでのID、当該クラス
タ配列が当該遺伝子配列にどのくらいの長さでどのくら
い一致したか、または、当該遺伝子の存在の証拠に関す
る情報などを含む)をクラスタ配列ホモロジー検索結果
データベース106eに格納する(ステップSE−
3)。これにて、クラスタ配列ホモロジー検索処理が終
了する。
【0216】[3次元シミュレーション処理]次に、3
次元シミュレーション処理の詳細について図9を参照し
て説明する。図9は、本実施形態における本システムの
3次元シミュレーション処理の一例を示すフローチャー
トである。
【0217】一つの配列で臓器の全スライスをテストし
た場合、遺伝子発現情報管理装置100は、3次元シミ
ュレーション部102fの所により、2つ以上の画像デ
ータのセットを画像データベース106gから取得する
(ステップSF−1)。
【0218】そして、3次元シミュレーション部102
fは、画像データセットから既存の3D表示ソフトウェ
アなどを用いて3次元画像を作成する(ステップSF−
2)。
【0219】そして、3次元シミュレーション部102
fは、画像データの発現量から3次元画像における発現
量をシミュレーションし、各画像を画像解析して求めた
発現量を3次元的に補正し表示する(ステップSF−
3)。これにて、3次元シミュレーション処理が終了す
る。
【0220】[発現量推定処理]次に、発現量推定処理
の詳細について図10を参照して説明する。図10は、
本実施形態における本システムの発現量推定処理の一例
を示すフローチャートである。
【0221】まず、遺伝子発現情報管理装置100は、
発現量推定部102gの処理により、画像データベース
106gおよびcDNAクローンデータベース106a
にアクセスして、画像データおよび塩基配列を取得する
(ステップSG−1)。
【0222】ついで、発現量推定部102gは、画像デ
ータおよび/または塩基配列に基づいて、画像データ中
の遺伝子の発現量を推定する。すなわち、発現量推定部
102gは、画像データ中の蛍光色素などの発光量や発
光面積を既知の画像解析手法などにより求めることによ
り(ステップSG−2)、発現量を推定する(ステップ
SG−3)。
【0223】また、画像データだけでなく塩基配列の情
報も利用すれば、例えば、塩基配列にリピート配列が含
まれている場合にはクロスハイブリダイズ(同じリピー
トを持つ当該mRNA以外のmRNAに対してもハイブ
リダイゼーション反応が起こる)の可能性が高いため推
定された発現量に対する信用性は低い、などの評価を自
動的にできるようになる。これにて、発現量推定処理が
終了する。
【0224】[画像比較処理]次に、画像比較処理の詳
細について図11を参照して説明する。図11は、本実
施形態における本システムの画像比較処理の一例を示す
フローチャートである。
【0225】まず、遺伝子発現情報管理装置100は、
例えば、正常細胞と疾患細胞との比較や、発育段階また
は加齢段階の時系列での比較や、薬剤投与前と投与後の
比較などを行う場合に、画像比較部102hの処理によ
り、画像データベース106g等にアクセスして、比較
される画像の組について、画像データ、塩基配列、発現
量、採取した組織に関する情報、採取した組織の発育段
階または加齢段階に関する情報、遺伝子の発現が見られ
るか否かに関する情報、および、発現が見られる部位に
関する情報などを取得する(ステップSH−1)。
【0226】そして、画像比較部102hは、これらの
情報に基づいて、2つ以上の画像データを比較し、比較
結果に基づいて、2つ以上の画像データの相違点を抽出
する(ステップSH−2)。これにて、画像比較処理が
終了する。
【0227】[染色体マップ作成処理]次に、染色体マ
ップ作成処理の詳細について図12を参照して説明す
る。図12は、本実施形態における本システムの染色体
マップ作成処理の一例を示すフローチャートである。
【0228】まず、遺伝子発現情報管理装置100は、
染色体マップ作成部102mの処理により、cDNAク
ローンデータベース106aあるいはクラスタ配列デー
タベース106d、および、核酸配列データベース10
6hにアクセスすることにより、核酸配列データベース
106hに登録された遺伝子座の特定されている塩基配
列情報をもとに、当該cDNAクローンあるいは当該ク
ラスタの遺伝子座を特定する(ステップSJ−1)。
【0229】ついで、染色体マップ作成部102mは、
染色体の遺伝子座に塩基配列に関する情報(例えば、画
像データ、塩基配列、発現量、採取した組織に関する情
報、採取した組織の発育段階または加齢段階に関する情
報、遺伝子の発現が見られるか否かに関する情報、およ
び、発現が見られる部位に関する情報など)を染色体マ
ップ上に配置(例えば、リンク情報を設定するなど)し
てマッピングする(ステップSJ−2)。
【0230】ついで、染色体マップ作成部102mは、
塩基配列に関する情報を追加して、当該染色体マップの
遺伝子座に対応する部分(特定のマークなどを表示して
も良い)を選択すると、その詳細な塩基配列に関する情
報を表示するようにする(ステップSJ−3)。これに
て、染色体マップ作成処理が終了する。
【0231】[実施例]次に、このように構成された本
発明の実施例について、以下に図14〜図19を参照し
て詳細に説明する。
【0232】1.cDNAクローンごとのデータ閲覧 cDNAクローンごとのデータを閲覧する場合に表示さ
れる一覧レポート画面を図14に示す。図14に示すよ
うに、一覧レポート画面では、1行に1つのcDNAク
ローンについての情報が表示される。各列に表示される
情報はそれぞれ以下の情報(1)〜(13)を表わす
(図14中の(1)〜(13)を示す)。
【0233】(1) cDNAクローンIDを表示す
る。
【0234】(2) 当該cDNAクローンのGona
dに対するin situ ハイブリダイゼーション画
像が何枚存在するかを表示する。
【0235】(3) 当該cDNAクローンの生後1週
のマウス精巣に対するin situハイブリダイゼー
ション画像が何枚存在するかを表示する。
【0236】(4) 当該cDNAクローンの生後2週
のマウス精巣に対するin situハイブリダイゼー
ション画像が何枚存在するかを表示する。
【0237】(5) 当該cDNAクローンの生後3週
のマウス精巣に対するin situハイブリダイゼー
ション画像が何枚存在するかを表示する。
【0238】(6) 当該cDNAクローンのAdul
tのマウス精巣に対するin situ ハイブリダイ
ゼーション画像が何枚存在するかを表示する。
【0239】(7) 当該cDNAクローンのin s
itu ハイブリダイゼーション画像が全部で何枚存在
するかを表示する。
【0240】(8) 当該cDNAクローンが所属クラ
スタの代表cDNAクローンである場合はYES、そう
でない場合はNOを表示する。
【0241】(9) 当該cDNAクローンが属するク
ラスタのIDを表示する。
【0242】(10) 当該cDNAクローンのEST
配列をnr(無冗長核酸配列データベース)に対してb
last検索した結果のtop hit scoreを
表示する。
【0243】(11) 当該cDNAクローンのEST
配列をdbest(EST配列データベース)に対して
blast検索した結果のtop hit score
を表示する。
【0244】(12) 当該cDNAクローンのEST
配列の長さ(塩基数)を表示する。
【0245】(13) 当該cDNAクローンのEST
配列にベクタの配列が含まれている場合は「YES」、
そうでない場合は「NO」を表示する。
【0246】次に詳細レポート画面について説明する。
cDNAクローンごとのデータを閲覧する場合に表示さ
れる詳細レポート画面を図15に示す。図15に示すよ
うに、詳細レポート画面では、1つのcDNAクローン
についての情報が1画面に表示される。図15中の各項
目(1)〜(26)で表示される情報を以下に示す。
【0247】(1) cDNAクローンIDを表示す
る。
【0248】(2) 当該cDNAクローンが属するク
ラスタのIDを表示する。
【0249】(3) 当該cDNAクローンが所属クラ
スタの代表cDNAクローンである場合は「YES」、
そうでない場合は「NO」を表示する。
【0250】(4) 当該cDNAクローンのEST配
列にベクタの配列が含まれている場合は「YES」、そ
うでない場合は「NO」を表示する。
【0251】(5)、(8)、(11)、(14)、
(17) 当該cDNAクローンがinsitu ハイ
ブリダイゼーション実験によって、それぞれGona
d、生後1週マウス精巣、生後2週マウス精巣、生後3
週マウス精巣、Adultマウス精巣においてどの細胞
に発現がみられたかを表示する。ここでG、 C、
R、E、 L、 Sはそれぞれ、「Gonia細胞」、
「Spermatocyte細胞」、「Round
spermatid細胞」、「Elongatedsp
ermatid細胞」、「Leydig細胞」、「Se
rtoli細胞」を表わす。
【0252】(6)、(9)、(12)、(15)、
(18) 当該cDNAクローンのGonad、生後1
週マウス精巣、生後2週マウス精巣、生後3週マウス精
巣、Adultマウス精巣に対するin situ ハ
イブリダイゼーション画像がそれぞれ何枚存在するかを
表示する。
【0253】(7)、(10)、(13)、(16)、
(19) 当該cDNAクローンのGonad、生後1
週マウス精巣、生後2週マウス精巣、生後3週マウス精
巣、Adultマウス精巣に対するin situ ハ
イブリダイゼーション画像をそれぞれ表示する。画像は
画像IDと共に表示される。
【0254】(20) 当該cDNAクローンのEST
配列をnrに対してblast検索した結果を表示す
る。
【0255】(21) 当該cDNAクローンのEST
配列をnrに対してblast検索した結果のtop
hit scoreを表示する。
【0256】(22) 当該cDNAクローンのEST
配列をblast検索した対象nrデータのバージョン
情報を表示する。
【0257】(23) 当該cDNAクローンのEST
配列をdbestに対してblast検索した結果を表
示する。
【0258】(24) 当該cDNAクローンのEST
配列をdbestに対してblast検索した結果のt
op hit scoreを表示する。
【0259】(25) 当該cDNAクローンのEST
配列をblast検索した対象dbestデータのバー
ジョン情報を表示する。
【0260】(26) 当該cDNAクローンのEST
配列を表示する。
【0261】また、cDNAクローンごとのデータを閲
覧する場合に表示される詳細レポート画面の別の一例を
図16に示す。図16中の各項目(1)〜(17)で表
示される情報を以下に示す。
【0262】(1)〜(5) 各発育段階または加齢段
階での画像の右上にそれぞれ、“Y”、“N”、
“?”、“Nd”というチェックボックスによって表示
されている部分である、発現情報フィールドを表示す
る。これは画像から遺伝子の発現がみられるかどうかを
入力するためのフィールドであり、「Y」は発現がみら
れること、「N」は発現がみられないこと、「?」はど
ちらとも判定できないこと、「Nd(No dat
a)」は画像データが存在しないことを示す。
【0263】(6) 当該cDNAクローンの重要度を
表示する。
【0264】(7) 既存のデータベースに掲載された
ものであるか否かを表示する。
【0265】(8) 当該cDNAクローンのEST配
列をホモロジー検索した結果のトップスコアをデータベ
ース分類別に表示する。これにより当該クローンが未知
のものであるか既知のものであるかどうかが概観でき
る。ここで、「mammal」は哺乳動物について既知
の遺伝子配列を集めたデータベース、「NT」は全生物
について既知の遺伝子配列を集めたデータベース、「E
ST」はEST 配列(cDNA クローンの断片配
列)を集めたデータベース、「HTG」はゲノム配列決
定プロジェクトによって決定されつつあるゲノムDNA
配列のドラフトを集めたデータベース、「GSS」は
GSS 配列(ゲノムDNA クローンの断片配列)を
集めたデータベース、「STS」はSTS 配列(ゲノ
ム上でマッピングされた配列)を集めたデータベース、
「PAT」は既に特許が取得されている遺伝子配列を集
めたデータベースを示す。この結果を見ることによっ
て、当該cDNAクローンが、既に同じあるいは別の生
物で既知となっている遺伝子(mammal、NT
)、未知の遺伝子であるが同じcDNA が既に取得
されている遺伝子(EST)、未知の遺伝子であるが対
応するゲノムDNA 断片が既に取得されている遺伝子
(HTG、GSS)、染色体上での位置がわかっている
遺伝子(STS)、既に特許が取得されている遺伝子
(PAT)であるかを確認することができる。
【0266】(9)〜(17) 当該cDNAクローン
が既知の遺伝子である場合、各フィールドにその既知遺
伝子に関する情報が表示される。ここで、「Gene」
は遺伝子名、「Product」は当該遺伝子の産物タ
ンパク質名、「Organism」は当該遺伝子が取得
されている生物種、「Tissue」は当該遺伝子が取
得された臓器または組織、「Locus ID」は当該
遺伝子のGenBankデータベースでのID、「Pr
otein ID」は当該遺伝子の産物タンパク質のG
enBank データベースでのID、「Hit le
ngth、Hit Identity」は、当該cDN
Aの塩基配列が当該遺伝子配列にどのくらいの長さでど
のくらい一致したか、「Evidence」は当該遺伝
子の存在の証拠に関する情報(mRNA、DNA な
ど;mRNA:mRNA の存在が確認されている、D
NA:DNA 配列から予測されたもの)を表示する。
【0267】2.クラスタごとのデータ閲覧 クラスタごとのデータを閲覧する場合に表示される一覧
レポート画面を図17に示す。図17に示すように、一
覧レポート画面では、1行に1つのクラスタについての
情報が表示される。図17の各列はそれぞれ以下の情報
(1)〜(13)を表わす。
【0268】(1) クラスタIDを表示する。
【0269】(2) 当該クラスタに属するすべてのc
DNAクローンのGonadに対するin situハ
イブリダイゼーション画像が合計何枚存在するかを表示
する。
【0270】(3) 当該クラスタに属するすべてのc
DNAクローンの生後1週のマウス精巣に対するin
situ ハイブリダイゼーション画像が合計何枚存在
するかを表示する。
【0271】(4) 当該クラスタに属するすべてのc
DNAクローンの生後2週のマウス精巣に対するin
situ ハイブリダイゼーション画像が合計何枚存在
するかを表示する。
【0272】(5) 当該クラスタに属するすべてのc
DNAクローンの生後3週のマウス精巣に対するin
situ ハイブリダイゼーション画像が合計何枚存在
するかを表示する。
【0273】(6) 当該クラスタに属するすべてのc
DNAクローンのAdultのマウス精巣に対するin
situ ハイブリダイゼーション画像が合計何枚存
在するかを表示する。
【0274】(7) 当該クラスタに属するすべてのc
DNAクローンのin situ ハイブリダイゼーシ
ョン画像が全部で何枚存在するかを表示する。
【0275】(8) 当該クラスタに属するcDNAク
ローンの数を表示する。
【0276】(9) 当該クラスタの代表cDNAクロ
ーンのIDを表示する。
【0277】(10) 当該クラスタの配列をnrに対
してblast検索した結果のtophit scor
eを表示する。
【0278】(11) 当該クラスタの配列をdbes
tに対してblast検索した結果のtop hit
scoreを表示する。
【0279】(12) 当該クラスタの重要度を表示す
る。重要度の高いものからAAA、AA、A、B、…
のようにランク付けされている。
【0280】(13) 当該クラスタに属するいずれか
のcDNAクローンのEST配列にベクタの配列が含ま
れている場合はYES、そうでない場合はNOを表示す
る。
【0281】クラスタごとのデータを閲覧する場合に表
示される詳細レポート画面を図18に示す。図18に示
すように、詳細レポート画面では、1つのクラスタにつ
いての情報が1画面に表示される。図中の各項目(1)
〜(29)に表示される情報は以下の通りである。
【0282】(1) クラスタIDを表示する。
【0283】(2) 当該クラスタの代表cDNAクロ
ーンのIDを表示する。
【0284】(3) 当該クラスタの重要度を表示す
る。重要度の高いものからAAA、AA、A、B、…
のようにランク付けされている。
【0285】(4) 当該クラスタの配列および、所属
cDNAクローンのEST配列について公開してもよい
と思われるものにはYES、そうでないものにはNOを
表示する。
【0286】(5) 当該クラスタに属するいずれかの
cDNAクローンのEST配列にベクタの配列が含まれ
ている場合はYES、そうでない場合はNOを表示す
る。
【0287】(6)、(9)、(12)、(15)、
(18) 当該クラスタに属するcDNAクローンがi
n situハイブリダイゼーション実験によって、そ
れぞれGonad、生後1週マウス精巣、生後2週マウ
ス精巣、生後3週マウス精巣、Adultマウス精巣に
おいてどの細胞に発現がみられたかを表示する。ここで
G、 C、R、E、L、Sはそれぞれ、Gonia、S
permatocyte、Round spermat
id、Elongated spermatid、Le
ydig cell、Sertoli cellを表わ
す。
【0288】(7)、(10)、(13)、(16)、
(19) 当該クラスタに属するcDNAクローンのG
onad、生後1週マウス精巣、生後2週マウス精巣、
生後3週マウス精巣、Adultマウス精巣に対するi
n situ ハイブリダイゼーション画像がそれぞれ
合計何枚存在するかを表示する。
【0289】(8)、(11)、(14)、(17)、
(20) 当該クラスタに属するcDNAクローンのG
onad、生後1週マウス精巣、生後2週マウス精巣、
生後3週マウス精巣、Adultマウス精巣に対するi
n situ ハイブリダイゼーション画像をそれぞれ
表示する。画像は画像IDと共に表示される。
【0290】(21) 当該クラスタに属するcDNA
クローンの数を表示する。
【0291】(22) 当該クラスタに属するすべての
cDNAクローンのIDを表示する。各cDNAクロー
ンはcDNAクローンIDとEST配列長(塩基数)が
表示される。
【0292】(23) 当該クラスタの配列をnrに対
してblast検索した結果を表示する。
【0293】(24) 当該クラスタの配列をnrに対
してblast検索した結果のtophit scor
eを表示する。
【0294】(25) 当該クラスタの配列をblas
t検索した対象nrデータのバージョン情報を表示す
る。
【0295】(26) 当該クラスタの配列をdbes
tに対してblast検索した結果を表示する。
【0296】(27) 当該クラスタの配列をdbes
tに対してblast検索した結果のtop hit
scoreを表示する。
【0297】(28) 当該クラスタの配列をblas
t検索した対象dbestデータのバージョン情報を表
示する。
【0298】(29) 当該クラスタの配列を表示す
る。
【0299】3.染色体マップの閲覧 染色体マップを閲覧する場合に表示される染色体マップ
表示画面を図19に示す。図19に示すように、遺伝子
座が特定されたcDNAクローン(またはクラスタ)が
染色体マップ上に配置される。そして、そのcDNAク
ローンの発現量を時系列に一覧表示する。
【0300】また、各cDNAクローン(またはクラス
タ名)をクリックなどすることにより選択すると、対応
するcDNAクローンまたはクラスタの詳細レポート画
面が表示される。
【0301】[他の実施の形態]さて、これまで本発明
の実施の形態について説明したが、本発明は、上述した
実施の形態以外にも、上記特許請求の範囲に記載した技
術的思想の範囲内において種々の異なる実施の形態にて
実施されてよいものである。
【0302】例えば、遺伝子発現情報管理装置100が
スタンドアローンの形態で処理を行う場合を一例に説明
したが、遺伝子発現情報管理装置100とは別筐体で構
成されるクライアント端末からの要求に応じて処理を行
い、その処理結果を当該クライアント端末に返却するよ
うに構成してもよい。
【0303】また、実施形態において説明した各処理の
うち、自動的に行なわれるものとして説明した処理の全
部または一部を手動的に行うこともでき、あるいは、手
動的に行なわれるものとして説明した処理の全部または
一部を公知の方法で自動的に行うこともできる。この
他、上記文書中や図面中で示した処理手順、制御手順、
具体的名称、各種の登録データや検索条件等のパラメー
タを含む情報、画面例、データベース構成については、
特記する場合を除いて任意に変更することができる。
【0304】また、遺伝子発現情報管理装置100に関
して、図示の各構成要素は機能概念的なものであり、必
ずしも物理的に図示の如く構成されていることを要しな
い。例えば、遺伝子発現情報管理装置100の各部また
は各装置が備える処理機能、特に制御部102にて行な
われる各処理機能については、その全部または任意の一
部を、CPU(Central Processing
Unit)および当該CPUにて解釈実行されるプロ
グラムにて実現することができ、あるいは、ワイヤード
ロジックによるハードウェアとして実現することも可能
である。なお、プログラムは、後述する記録媒体に記録
されており、必要に応じて遺伝子発現情報管理装置10
0に機械的に読み取られる。
【0305】すなわち、ROMまたはHDなどの記憶部
106などには、OS(Operating Syst
em)と協働してCPUに命令を与え、各種処理を行う
ためのコンピュータプログラムが記録されている。この
コンピュータプログラムは、RAM等にロードされるこ
とによって実行され、CPUと協働して制御部102を
構成する。また、このコンピュータプログラムは、遺伝
子発現情報管理装置100に対して任意のネットワーク
300を介して接続されたアプリケーションプログラム
サーバに記録されてもよく、必要に応じてその全部また
は一部をダウンロードすることも可能である。
【0306】また、本発明にかかるプログラムを、コン
ピュータ読み取り可能な記録媒体に格納することもでき
る。ここで、この「記録媒体」とは、フレキシブルディ
スク、光磁気ディスク、ROM、EPROM、EEPR
OM、CD−ROM、MO、DVD等の任意の「可搬用
の物理媒体」や、各種コンピュータシステムに内蔵され
るROM、RAM、HD等の任意の「固定用の物理媒
体」、あるいは、LAN、WAN、インターネットに代
表されるネットワークを介してプログラムを送信する場
合の通信回線や搬送波のように、短期にプログラムを保
持する「通信媒体」を含むものとする。
【0307】また、「プログラム」とは、任意の言語や
記述方法にて記述されたデータ処理方法であり、ソース
コードやバイナリコード等の形式を問わない。なお、
「プログラム」は必ずしも単一的に構成されるものに限
られず、複数のモジュールやライブラリとして分散構成
されるものや、OS(Operating Syste
m)に代表される別個のプログラムと協働してその機能
を達成するものをも含む。なお、実施の形態に示した各
装置において記録媒体を読み取るための具体的な構成、
読み取り手順、あるいは、読み取り後のインストール手
順等については、周知の構成や手順を用いることができ
る。
【0308】記憶部106に格納される各種のデータベ
ース等(cDNAクローンデータベース106a〜核酸
配列データベース106h)は、RAM、ROM等のメ
モリ装置、ハードディスク等の固定ディスク装置、フレ
キシブルディスク、光ディスク等のストレージ手段であ
り、各種処理やウェブサイト提供に用いる各種のプログ
ラムやテーブルやファイルやデータベースやウェブペー
ジ用ファイル等を格納する。
【0309】また、遺伝子発現情報管理装置100は、
既知のパーソナルコンピュータ、ワークステーション等
の情報処理端末等の情報処理装置にプリンタやモニタや
イメージスキャナ等の周辺装置を接続し、該情報処理装
置に本発明の方法を実現させるソフトウェア(プログラ
ム、データ等を含む)を実装することにより実現しても
よい。
【0310】さらに、遺伝子発現情報管理装置100の
分散・統合の具体的形態は図示のものに限られず、その
全部または一部を、各種の負荷等に応じた任意の単位
で、機能的または物理的に分散・統合して構成すること
ができる。例えば、各データベースを独立したデータベ
ース装置として独立に構成してもよく、また、処理の一
部をCGI(Common Gateway Inte
rface)を用いて実現してもよい。
【0311】また、ネットワーク300は、遺伝子発現
情報管理装置100と外部システム200とを相互に接
続する機能を有し、例えば、インターネットや、イント
ラネットや、LAN(有線/無線の双方を含む)や、V
ANや、パソコン通信網や、公衆電話網(アナログ/デ
ジタルの双方を含む)や、専用回線網(アナログ/デジ
タルの双方を含む)や、CATV網や、IMT2000
方式、GSM方式またはPDC/PDC―P方式等の携
帯回線交換網/携帯パケット交換網や、無線呼出網や、
Bluetooth等の局所無線網や、PHS網や、C
S、BSまたはISDB等の衛星通信網等のうちいずれ
かを含んでもよい。すなわち、本システムは、有線・無
線を問わず任意のネットワークを介して、各種データを
送受信することができる。
【0312】
【発明の効果】以上詳細に説明したように、本発明によ
れば、遺伝子の発現に関する画像データを入力し、発現
した遺伝子の塩基配列(例えば、cDNAクローンの塩
基配列など)を入力し、入力された塩基配列に対してホ
モロジー検索を行い類似塩基配列を抽出し、画像データ
と対応する塩基配列とその類似塩基配列とを表示するの
で、画像データにおいて発現した遺伝子を容易に特定す
ることができる遺伝子発現情報管理装置、遺伝子発現情
報管理方法、プログラム、および、記録媒体を提供する
ことができる。
【0313】また、本発明によれば、ホモロジー検索
は、(1)既に同じあるいは別の生物で既知となってい
る遺伝子、(2)未知の遺伝子であるが同じcDNAが
既に取得されている遺伝子、(3)未知の遺伝子である
が対応するゲノムDNA断片が既に取得されている遺伝
子、(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子のうち少なくと
も一つの遺伝子の塩基配列を対象としてホモロジー検索
を行うので、画像データの持つ生物学的な重要度などを
容易に特定することができる遺伝子発現情報管理装置、
遺伝子発現情報管理方法、プログラム、および、記録媒
体を提供することができる。
【0314】また、本発明によれば、遺伝子の発現に関
する画像データを入力し、発現した遺伝子の塩基配列
(例えば、cDNAクローンの塩基配列など)を入力
し、入力された塩基配列に対してクラスタリングを行
い、塩基配列を特定のクラスタに分類し、クラスタ毎に
画像データと対応する塩基配列とを表示するので、例え
ば同じmRNAに由来するcDNA(EST配列)を同
じクラスタに分類すること等により、同一の性質を持つ
塩基配列を集めて特定のクラスタに分類することができ
る遺伝子発現情報管理装置、遺伝子発現情報管理方法、
プログラム、および、記録媒体を提供することができ
る。
【0315】また、本発明によれば、同一のクラスタに
分類された塩基配列からクラスタ配列を決定し、クラス
タ毎にクラスタ配列と画像データと対応する塩基配列と
を表示するので、例えば、クラスタのメンバーの塩基配
列を組み合わせて作成した塩基配列(例えば、完全長c
DNAなど)をクラスタ配列として決定し、表示するこ
とができる遺伝子発現情報管理装置、遺伝子発現情報管
理方法、プログラム、および、記録媒体を提供すること
ができる。
【0316】また、本発明によれば、塩基配列を用いて
共通配列のアセンブルを行い、同一の共通配列を構成し
た塩基配列を同一のクラスタに分類し、クラスタの共通
配列をクラスタ配列として決定するので、アセンブル技
術(短い断片配列から長い配列を作成する技術をいう。
例えば、断片配列間の配列の重なりをマルチプルアライ
ンメントなどの手法を用いて探索し、重なりを持つ断片
配列同士を合成することにより長い配列を生成する。)
により部分的なcDNA配列からより完全長に近いcD
NA配列を作成することができる遺伝子発現情報管理装
置、遺伝子発現情報管理方法、プログラム、および、記
録媒体を提供することができる。
【0317】また、本発明によれば、決定されたクラス
タ配列に対してホモロジー検索を行い類似塩基配列を抽
出し、クラスタ毎にクラスタ配列とその類似配列と画像
データと対応する塩基配列とを表示するので、画像デー
タにおいて発現した遺伝子を容易に特定することができ
る遺伝子発現情報管理装置、遺伝子発現情報管理方法、
プログラム、および、記録媒体を提供することができ
る。
【0318】また、本発明によれば、画像データに対し
て、採取した組織に関する情報、採取した組織の発育段
階または加齢段階に関する情報、遺伝子の発現が見られ
るか否かに関する情報、および、発現が見られる部位に
関する情報のうち少なくとも一つを対応付けて格納し、
画像データに対して、採取した組織に関する情報、採取
した組織の発育段階または加齢段階に関する情報、遺伝
子の発現が見られるか否かに関する情報、および、発現
が見られる部位に関する情報のうち少なくとも一つを対
応付けて表示することができる遺伝子発現情報管理装
置、遺伝子発現情報管理方法、プログラム、および、記
録媒体を提供することができる。
【0319】また、本発明によれば、画像データおよび
/または塩基配列に基づいて、画像データ中の遺伝子の
発現量を推定するので、発現パターン(均一に発現、偏
って発現など)などを容易に特定することができる遺伝
子発現情報管理装置、遺伝子発現情報管理方法、プログ
ラム、および、記録媒体を提供することができる。
【0320】また、本発明によれば、推定された発現量
に従って、画像データの表示順番をソートするので、効
率的に実験結果を確認できる遺伝子発現情報管理装置、
遺伝子発現情報管理方法、プログラム、および、記録媒
体を提供することができる。
【0321】また、本発明によれば、画像データ、塩基
配列、発現量、採取した組織に関する情報、採取した組
織の発育段階または加齢段階に関する情報、遺伝子の発
現が見られるか否かに関する情報、および、発現が見ら
れる部位に関する情報のうち少なくとも一つに基づい
て、2つ以上の画像データを比較し、比較結果に基づい
て、2つ以上の画像データの相違点を抽出するので、画
像間の差異を効率的に抽出することができる遺伝子発現
情報管理装置、遺伝子発現情報管理方法、プログラム、
および、記録媒体を提供することができる。
【0322】また、本発明によれば、2つ以上の画像デ
ータから3次元画像を作成し、画像データの発現量から
3次元画像における発現量をシミュレーションするの
で、一つの配列で臓器の全スライスをテストした場合、
その画像をつなぐことにより臓器の3次元画像をシミュ
レーションし、各画像を画像解析して求めたmRNAの
発現量を3次元的に補正し表示することができる遺伝子
発現情報管理装置、遺伝子発現情報管理方法、プログラ
ム、および、記録媒体を提供することができる。
【0323】また、本発明によれば、同一のクラスタに
属する塩基配列の中から、画像データ、塩基配列、発現
量、採取した組織に関する情報、採取した組織の発育段
階または加齢段階に関する情報、遺伝子の発現が見られ
るか否かに関する情報、および、発現が見られる部位に
関する情報のうち少なくとも一つに基づいて、代表クロ
ーンを決定するので、例えば、同じmRNAに由来する
クローン群のうち最もよい実験データがとれるクローン
を一つ選んで代表クローンとして抽出することができる
遺伝子発現情報管理装置、遺伝子発現情報管理方法、プ
ログラム、および、記録媒体を提供することができる。
【0324】また、本発明によれば、クラスタ配列のホ
モロジー検索結果、画像データ、塩基配列、発現量、採
取した組織に関する情報、採取した組織の発育段階また
は加齢段階に関する情報、遺伝子の発現が見られるか否
かに関する情報、および、発現が見られる部位に関する
情報のうち少なくとも一つに基づいてクラスタ重要度を
決定するので、これらの情報に基づいてクラスタの重要
度を任意に決定し、利用者が注目するクラスタを容易に
発見することができる遺伝子発現情報管理装置、遺伝子
発現情報管理方法、プログラム、および、記録媒体を提
供することができる。
【0325】さらに、本発明によれば、塩基配列の存在
する染色体上の遺伝子座を特定し、染色体の遺伝子座に
塩基配列に関する情報(例えば、画像データ、塩基配
列、発現量、採取した組織に関する情報、採取した組織
の発育段階または加齢段階に関する情報、遺伝子の発現
が見られるか否かに関する情報、および、発現が見られ
る部位に関する情報など)をマッピングすることにより
染色体マップを作成することができる遺伝子発現情報管
理装置、遺伝子発現情報管理方法、プログラム、およ
び、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】高速in situハイブリダイゼーション法
の概要を示す図である。
【図2】取り込まれた画像の一例を示す図である。
【図3】本発明の基本原理を示す原理構成図である。
【図4】本発明が適用される本システムの構成の一例を
示すブロック図である。
【図5】本実施形態における本システムの画像アノテー
ション情報入力処理の一例を示すフローチャートであ
る。
【図6】本実施形態における本システムのcDNAクロ
ーン配列ホモロジー検索処理の一例を示すフローチャー
トである。
【図7】本実施形態における本システムのアセンブル処
理の一例を示すフローチャートである。
【図8】本実施形態における本システムのクラスタ配列
ホモロジー検索処理の一例を示すフローチャートであ
る。
【図9】本実施形態における本システムの3次元シミュ
レーション処理の一例を示すフローチャートである。
【図10】本実施形態における本システムの発現量推定
処理の一例を示すフローチャートである。
【図11】本実施形態における本システムの画像比較処
理の一例を示すフローチャートである。
【図12】本実施形態における本システムの染色体マッ
プ作成処理の一例を示すフローチャートである。
【図13】モニタに表示されるアノテーション情報入力
画面の表示画面の一例を示す図である。
【図14】cDNAクローンごとのデータを閲覧する場
合に表示される一覧レポート画面の一例を示す図であ
る。
【図15】cDNAクローンごとのデータを閲覧する場
合に表示される詳細レポート画面の一例を示す図であ
る。
【図16】cDNAクローンごとのデータを閲覧する場
合に表示される詳細レポート画面の別の一例を示す図で
ある。
【図17】クラスタごとのデータを閲覧する場合に表示
される一覧レポート画面の一例を示す図である。
【図18】クラスタごとのデータを閲覧する場合に表示
される詳細レポート画面の一例を示す図である。
【図19】染色体マップを閲覧する場合に表示される染
色体マップ表示画面の一例を示す図である。
【符号の説明】
100 遺伝子発現情報管理装置 102 制御部 102a 画像アノテーション情報入力部 102b cDNAクローン配列ホモロジー検索部 102c cDNAクローンクラスタリング部 102d クラスタ配列決定部 102e クラスタ配列ホモロジー検索部 102f 3次元シミュレーション部 102g 発現量推定部 102h 画像比較部 102i 代表クローン決定部 102j クラスタ重要度決定部 102k 外部データベースアクセス部 102m 染色体マップ作成部 102n 表示画面作成部 104 通信制御インターフェース部 106 記憶部 106a cDNAクローンデータベース 106b クラスタデータベース 106c ホモロジー検索結果データベース 106d クラスタ配列データベース 106e クラスタ配列ホモロジー検索結果データベー
ス 106f ベクタ配列データベース 106g 画像データベース 106h 核酸配列データベース 108 入出力制御インターフェース部 112 入力装置 114 出力装置 200 外部システム 300 ネットワーク
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成15年4月2日(2003.4.2)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0325
【補正方法】変更
【補正内容】
【0325】さらに、本発明によれば、塩基配列の存在
する染色体上の遺伝子座を特定し、染色体の遺伝子座に
塩基配列に関する情報(例えば、画像データ、塩基配
列、発現量、採取した組織に関する情報、採取した組織
の発育段階または加齢段階に関する情報、遺伝子の発現
が見られるか否かに関する情報、および、発現が見られ
る部位に関する情報など)をマッピングすることにより
染色体マップを作成することができる遺伝子発現情報管
理装置、遺伝子発現情報管理方法、プログラム、およ
び、記録媒体を提供することができる。
【配列表】 SEQUENCE LISTING <110> Celestar Lexico-Sciences,Inc. <120> Gene expression information management apparatus, method, program, and strage medium <130> PCLA-14009 <160> 3 <170> PatentIn version 3.1 <210> 1 <211> 157 <212> DNA <213> Mus testes <220> <221> Inventor:Yasuo, Uemura;Hirofumi, Doi <220> <223> DNA Sequence 1 <400> 1 gttctatctt ctagcctcgt accaacacat gatctargag gctgctgacc tccaacagga 60 atytcaccac ttaaccctct agaagtccca ctacttaata cttcagtact tctatacgtc 120 tccatttatt gatgaggatc ttaaaaaaaa aaaaaaa 157 <210> 2 <211> 218 <212> DNA <213> Mus musculus <220> <221> misc_feature <222> (167)..(167) <223> n stands for any base <220> <221> misc_feature <222> (197)..(197) <223> n stands for any base <220> <221> misc_feature <222> (202)..(202) <223> n stands for any base <220> <223> DNA Sequence 2 <400> 2 atataataga cgaaatcaac aaccccdtat taaccgttaa aaccataggg caccaatgat 60 actgaagcta cgaatatact gactatgaag acctatgctt tgattcatat ataatgtgga 120 tctaaccata gcttatgccc arrgtcctag aaatggttcc acaaaanatt tcgaaaactg 180 arctgcttca ataattnaat tnaaaaaaaa aaaaaaaa 218 <210> 3 <211> 157 <212> DNA <213> Mus testes <220> <223> DNA Sequence 3 <400> 3 gttctatctt ctagcctcgt accaacacat gatctargag gctgctgacc tccaacagga 60 atytcaccac ttaaccctct agaagtccca ctacttaata cttcagtact tctatacgtc 120 tccatttatt gatgaggatc ttaaaaaaaa aaaaaaa 157
───────────────────────────────────────────────────── フロントページの続き (72)発明者 土居 洋文 千葉県千葉市美浜区中瀬1丁目3番地 幕 張テクノガーデンD17 セレスター・レキ シコ・サイエンシズ株式会社内 Fターム(参考) 4B024 AA20 CA04 CA09 HA11 HA19 4B029 AA23 5B075 ND20 UU19

Claims (46)

    【特許請求の範囲】
  1. 【請求項1】 遺伝子の発現に関する画像データを入力
    する画像データ入力手段と、 上記発現した上記遺伝子の塩基配列を入力する塩基配列
    入力手段と、 上記塩基配列入力手段により入力された上記塩基配列に
    対してホモロジー検索を行い類似塩基配列を抽出するホ
    モロジー検索手段と、 上記画像データと対応する上記塩基配列とその上記類似
    塩基配列とを表示する表示手段と、 を備えたことを特徴とする遺伝子発現情報管理装置。
  2. 【請求項2】 上記ホモロジー検索手段は、 (1)既に同じあるいは別の生物で既知となっている遺
    伝子、 (2)未知の遺伝子であるが同じcDNAが既に取得さ
    れている遺伝子、 (3)未知の遺伝子であるが対応するゲノムDNA断片
    が既に取得されている遺伝子、 (4)染色体上での位置がわかっている遺伝子、 (5)既に特許が取得されている遺伝子、 のうち少なくとも一つの遺伝子の塩基配列を対象として
    ホモロジー検索を行うこと、 を特徴とする請求項1に記載の遺伝子発現情報管理装
    置。
  3. 【請求項3】 遺伝子の発現に関する画像データを入力
    する画像データ入力手段と、 上記発現した上記遺伝子の塩基配列を入力する塩基配列
    入力手段と、 上記塩基配列入力手段により入力された上記塩基配列に
    対してクラスタリングを行い、上記塩基配列を特定のク
    ラスタに分類するクラスタリング手段と、 上記クラスタ毎に上記画像データと対応する上記塩基配
    列とを表示する表示手段と、 を備えたことを特徴とする遺伝子発現情報管理装置。
  4. 【請求項4】 上記クラスタリング手段により同一の上
    記クラスタに分類された上記塩基配列からクラスタ配列
    を決定するクラスタ配列決定手段、 をさらに備え、 上記表示手段は、上記クラスタ毎に上記クラスタ配列と
    上記画像データと対応する上記塩基配列とを表示する、 ことを特徴とする請求項3に記載の遺伝子発現情報管理
    装置。
  5. 【請求項5】 上記クラスタリング手段は、上記塩基配
    列を用いて共通配列のアセンブルを行い、同一の上記共
    通配列を構成した上記塩基配列を同一の上記クラスタに
    分類し、 上記クラスタ配列決定手段は、上記クラスタの上記共通
    配列を上記クラスタ配列として決定する、 ことを特徴とする請求項3または4に記載の遺伝子発現
    情報管理装置。
  6. 【請求項6】 上記クラスタ配列決定手段により決定さ
    れた上記クラスタ配列に対してホモロジー検索を行い類
    似塩基配列を抽出するクラスタ配列ホモロジー検索手
    段、 をさらに備え、 上記表示手段は、上記クラスタ毎に上記クラスタ配列と
    その類似配列と上記画像データと対応する上記塩基配列
    とを表示する、 ことを特徴とする請求項4または5に記載の遺伝子発現
    情報管理装置。
  7. 【請求項7】 上記クラスタ配列ホモロジー検索手段
    は、 (1)既に同じあるいは別の生物で既知となっている遺
    伝子、 (2)未知の遺伝子であるが同じcDNAが既に取得さ
    れている遺伝子、 (3)未知の遺伝子であるが対応するゲノムDNA断片
    が既に取得されている遺伝子、 (4)染色体上での位置がわかっている遺伝子、 (5)既に特許が取得されている遺伝子、 のうち少なくとも一つの遺伝子の塩基配列を対象として
    ホモロジー検索を行うことを特徴とする請求項6に記載
    の遺伝子発現情報管理装置。
  8. 【請求項8】 上記画像データに対して、採取した組織
    に関する情報、採取した組織の発育段階または加齢段階
    に関する情報、遺伝子の発現が見られるか否かに関する
    情報、および、発現が見られる部位に関する情報のうち
    少なくとも一つを対応付けて格納するアノテーション情
    報格納手段、 をさらに備え、 上記表示手段は、上記画像データに対して、上記採取し
    た組織に関する情報、上記採取した組織の発育段階また
    は加齢段階に関する情報、上記遺伝子の発現が見られる
    か否かに関する情報、および、上記発現が見られる部位
    に関する情報のうち少なくとも一つを対応付けて表示す
    る、 ことを特徴とする請求項1から7のいずれか一つに記載
    の遺伝子発現情報管理装置。
  9. 【請求項9】 上記画像データおよび/または上記塩基
    配列に基づいて、上記画像データ中の遺伝子の発現量を
    推定する発現量推定手段、 をさらに備えたことを特徴とする請求項1から8のいず
    れか一つに記載の遺伝子発現情報管理装置。
  10. 【請求項10】 上記発現量推定手段により推定された
    上記発現量に従って、上記画像データの表示順番をソー
    トする発現量順ソート手段、 をさらに備えたことを特徴とする請求項9に記載の遺伝
    子発現情報管理装置。
  11. 【請求項11】 上記画像データ、上記塩基配列、上記
    発現量、上記採取した組織に関する情報、上記採取した
    組織の発育段階または加齢段階に関する情報、上記遺伝
    子の発現が見られるか否かに関する情報、および、上記
    発現が見られる部位に関する情報のうち少なくとも一つ
    に基づいて、2つ以上の上記画像データを比較する画像
    比較手段と、 上記画像比較手段の比較結果に基づいて、2つ以上の上
    記画像データの相違点を抽出する相違点抽出手段と、 をさらに備えたことを特徴とする請求項1から10のい
    ずれか一つに記載の遺伝子発現情報管理装置。
  12. 【請求項12】 2つ以上の上記画像データから3次元
    画像を作成する3次元画像作成手段と、 上記画像データの上記発現量から上記3次元画像におけ
    る発現量をシミュレーションする発現量シミュレーショ
    ン手段と、 をさらに備えたことを特徴とする請求項1から11のい
    ずれか一つに記載の遺伝子発現情報管理装置。
  13. 【請求項13】 同一の上記クラスタに属する上記塩基
    配列の中から、上記画像データ、上記塩基配列、上記発
    現量、上記採取した組織に関する情報、上記採取した組
    織の発育段階または加齢段階に関する情報、上記遺伝子
    の発現が見られるか否かに関する情報、および、上記発
    現が見られる部位に関する情報のうち少なくとも一つに
    基づいて、代表クローンを決定する代表クローン決定手
    段、 をさらに備えたことを特徴とする請求項3から12のい
    ずれか一つに記載の遺伝子発現情報管理装置。
  14. 【請求項14】 上記クラスタに対して、上記クラスタ
    配列のホモロジー検索結果、上記画像データ、上記塩基
    配列、上記発現量、上記採取した組織に関する情報、上
    記採取した組織の発育段階または加齢段階に関する情
    報、上記遺伝子の発現が見られるか否かに関する情報、
    および、上記発現が見られる部位に関する情報のうち少
    なくとも一つに基づいて、クラスタ重要度を決定するク
    ラスタ重要度決定手段、 をさらに備えたことを特徴とする請求項3から13のい
    ずれか一つに記載の遺伝子発現情報管理装置。
  15. 【請求項15】 上記塩基配列の存在する染色体上の遺
    伝子座を特定する遺伝子座特定手段と、 上記染色体の上記遺伝子座に上記塩基配列に関する情報
    をマッピングすることにより染色体マップを作成する染
    色体マップ作成手段と、 上記染色体マップ作成手段にて作成した上記染色体マッ
    プを表示する染色体マップ表示手段と、 をさらに備えたことを特徴とする請求項1から14のい
    ずれか一つに記載の遺伝子発現情報管理装置。
  16. 【請求項16】 遺伝子の発現に関する画像データを入
    力する画像データ入力ステップと、 上記発現した上記遺伝子の塩基配列を入力する塩基配列
    入力ステップと、 上記塩基配列入力ステップにより入力された上記塩基配
    列に対してホモロジー検索を行い類似塩基配列を抽出す
    るホモロジー検索ステップと、 上記画像データと対応する上記塩基配列とその上記類似
    塩基配列とを表示する表示ステップと、 を含むことを特徴とする遺伝子発現情報管理方法。
  17. 【請求項17】 上記ホモロジー検索ステップは、 (1)既に同じあるいは別の生物で既知となっている遺
    伝子、 (2)未知の遺伝子であるが同じcDNAが既に取得さ
    れている遺伝子、 (3)未知の遺伝子であるが対応するゲノムDNA断片
    が既に取得されている遺伝子、 (4)染色体上での位置がわかっている遺伝子、 (5)既に特許が取得されている遺伝子、 のうち少なくとも一つの遺伝子の塩基配列を対象として
    ホモロジー検索を行うこと、 を特徴とする請求項16に記載の遺伝子発現情報管理方
    法。
  18. 【請求項18】 遺伝子の発現に関する画像データを入
    力する画像データ入力ステップと、 上記発現した上記遺伝子の塩基配列を入力する塩基配列
    入力ステップと、 上記塩基配列入力ステップにより入力された上記塩基配
    列に対してクラスタリングを行い、上記塩基配列を特定
    のクラスタに分類するクラスタリングステップと、 上記クラスタ毎に上記画像データと対応する上記塩基配
    列とを表示する表示ステップと、 を含むことを特徴とする遺伝子発現情報管理方法。
  19. 【請求項19】 上記クラスタリングステップにより同
    一の上記クラスタに分類された上記塩基配列からクラス
    タ配列を決定するクラスタ配列決定ステップ、 をさらに含み、 上記表示ステップは、上記クラスタ毎に上記クラスタ配
    列と上記画像データと対応する上記塩基配列とを表示す
    る、 ことを特徴とする請求項18に記載の遺伝子発現情報管
    理方法。
  20. 【請求項20】 上記クラスタリングステップは、上記
    塩基配列を用いて共通配列のアセンブルを行い、同一の
    上記共通配列を構成した上記塩基配列を同一の上記クラ
    スタに分類し、 上記クラスタ配列決定ステップは、上記クラスタの上記
    共通配列を上記クラスタ配列として決定する、 ことを特徴とする請求項18または19に記載の遺伝子
    発現情報管理方法。
  21. 【請求項21】 上記クラスタ配列決定ステップにより
    決定された上記クラスタ配列に対してホモロジー検索を
    行い類似塩基配列を抽出するクラスタ配列ホモロジー検
    索ステップ、 をさらに含み、 上記表示ステップは、上記クラスタ毎に上記クラスタ配
    列とその類似配列と上記画像データと対応する上記塩基
    配列とを表示する、 ことを特徴とする請求項19または20に記載の遺伝子
    発現情報管理方法。
  22. 【請求項22】 上記クラスタ配列ホモロジー検索ステ
    ップは、 (1)既に同じあるいは別の生物で既知となっている遺
    伝子、 (2)未知の遺伝子であるが同じcDNAが既に取得さ
    れている遺伝子、 (3)未知の遺伝子であるが対応するゲノムDNA断片
    が既に取得されている遺伝子、 (4)染色体上での位置がわかっている遺伝子、 (5)既に特許が取得されている遺伝子、 のうち少なくとも一つの遺伝子の塩基配列を対象として
    ホモロジー検索を行うことを特徴とする請求項21に記
    載の遺伝子発現情報管理方法。
  23. 【請求項23】 上記画像データに対して、採取した組
    織に関する情報、採取した組織の発育段階または加齢段
    階に関する情報、遺伝子の発現が見られるか否かに関す
    る情報、および、発現が見られる部位に関する情報のう
    ち少なくとも一つを対応付けて格納するアノテーション
    情報格納ステップ、 をさらに含み、 上記表示ステップは、上記画像データに対して、上記採
    取した組織に関する情報、上記採取した組織の発育段階
    または加齢段階に関する情報、上記遺伝子の発現が見ら
    れるか否かに関する情報、および、上記発現が見られる
    部位に関する情報のうち少なくとも一つを対応付けて表
    示する、 ことを特徴とする請求項16から22のいずれか一つに
    記載の遺伝子発現情報管理方法。
  24. 【請求項24】 上記画像データおよび/または上記塩
    基配列に基づいて、上記画像データ中の遺伝子の発現量
    を推定する発現量推定ステップ、 をさらに含むことを特徴とする請求項16から23のい
    ずれか一つに記載の遺伝子発現情報管理方法。
  25. 【請求項25】 上記発現量推定ステップにより推定さ
    れた上記発現量に従って、上記画像データの表示順番を
    ソートする発現量順ソートステップ、 をさらに含むことを特徴とする請求項24に記載の遺伝
    子発現情報管理方法。
  26. 【請求項26】 上記画像データ、上記塩基配列、上記
    発現量、上記採取した組織に関する情報、上記採取した
    組織の発育段階または加齢段階に関する情報、上記遺伝
    子の発現が見られるか否かに関する情報、および、上記
    発現が見られる部位に関する情報のうち少なくとも一つ
    に基づいて、2つ以上の上記画像データを比較する画像
    比較ステップと、 上記画像比較ステップの比較結果に基づいて、2つ以上
    の上記画像データの相違点を抽出する相違点抽出ステッ
    プと、 をさらに含むことを特徴とする請求項16から25のい
    ずれか一つに記載の遺伝子発現情報管理方法。
  27. 【請求項27】 2つ以上の上記画像データから3次元
    画像を作成する3次元画像作成ステップと、 上記画像データの上記発現量から上記3次元画像におけ
    る発現量をシミュレーションする発現量シミュレーショ
    ンステップと、 をさらに含むことを特徴とする請求項16から26のい
    ずれか一つに記載の遺伝子発現情報管理方法。
  28. 【請求項28】 同一の上記クラスタに属する上記塩基
    配列の中から、上記画像データ、上記塩基配列、上記発
    現量、上記採取した組織に関する情報、上記採取した組
    織の発育段階または加齢段階に関する情報、上記遺伝子
    の発現が見られるか否かに関する情報、および、上記発
    現が見られる部位に関する情報のうち少なくとも一つに
    基づいて、代表クローンを決定する代表クローン決定ス
    テップ、 をさらに含むことを特徴とする請求項18から27のい
    ずれか一つに記載の遺伝子発現情報管理方法。
  29. 【請求項29】 上記クラスタに対して、上記クラスタ
    配列のホモロジー検索結果、上記画像データ、上記塩基
    配列、上記発現量、上記採取した組織に関する情報、上
    記採取した組織の発育段階または加齢段階に関する情
    報、上記遺伝子の発現が見られるか否かに関する情報、
    および、上記発現が見られる部位に関する情報のうち少
    なくとも一つに基づいて、クラスタ重要度を決定するク
    ラスタ重要度決定ステップ、 をさらに含むことを特徴とする請求項18から28のい
    ずれか一つに記載の遺伝子発現情報管理方法。
  30. 【請求項30】 上記塩基配列の存在する染色体上の遺
    伝子座を特定する遺伝子座特定ステップと、 上記染色体の上記遺伝子座に上記塩基配列に関する情報
    をマッピングすることにより染色体マップを作成する染
    色体マップ作成ステップと、 上記染色体マップ作成ステップにて作成した上記染色体
    マップを表示する染色体マップ表示ステップと、 をさらに含むことを特徴とする請求項16から29のい
    ずれか一つに記載の遺伝子発現情報管理方法。
  31. 【請求項31】 遺伝子の発現に関する画像データを入
    力する画像データ入力ステップと、 上記発現した上記遺伝子の塩基配列を入力する塩基配列
    入力ステップと、 上記塩基配列入力ステップにより入力された上記塩基配
    列に対してホモロジー検索を行い類似塩基配列を抽出す
    るホモロジー検索ステップと、 上記画像データと対応する上記塩基配列とその上記類似
    塩基配列とを表示する表示ステップと、 を含む遺伝子発現情報管理方法をコンピュータに実行さ
    せることを特徴とするプログラム。
  32. 【請求項32】 上記ホモロジー検索ステップは、 (1)既に同じあるいは別の生物で既知となっている遺
    伝子、 (2)未知の遺伝子であるが同じcDNAが既に取得さ
    れている遺伝子、 (3)未知の遺伝子であるが対応するゲノムDNA断片
    が既に取得されている遺伝子、 (4)染色体上での位置がわかっている遺伝子、 (5)既に特許が取得されている遺伝子、 のうち少なくとも一つの遺伝子の塩基配列を対象として
    ホモロジー検索を行うこと、 を特徴とする請求項31に記載のプログラム。
  33. 【請求項33】 遺伝子の発現に関する画像データを入
    力する画像データ入力ステップと、 上記発現した上記遺伝子の塩基配列を入力する塩基配列
    入力ステップと、 上記塩基配列入力ステップにより入力された上記塩基配
    列に対してクラスタリングを行い、上記塩基配列を特定
    のクラスタに分類するクラスタリングステップと、 上記クラスタ毎に上記画像データと対応する上記塩基配
    列とを表示する表示ステップと、 を含む遺伝子発現情報管理方法をコンピュータに実行さ
    せることを特徴とするプログラム。
  34. 【請求項34】 上記クラスタリングステップにより同
    一の上記クラスタに分類された上記塩基配列からクラス
    タ配列を決定するクラスタ配列決定ステップ、 をさらに含み、 上記表示ステップは、上記クラスタ毎に上記クラスタ配
    列と上記画像データと対応する上記塩基配列とを表示す
    る、 ことを特徴とする請求項33に記載のプログラム。
  35. 【請求項35】 上記クラスタリングステップは、上記
    塩基配列を用いて共通配列のアセンブルを行い、同一の
    上記共通配列を構成した上記塩基配列を同一の上記クラ
    スタに分類し、 上記クラスタ配列決定ステップは、上記クラスタの上記
    共通配列を上記クラスタ配列として決定する、 ことを特徴とする請求項33または34に記載のプログ
    ラム。
  36. 【請求項36】 上記クラスタ配列決定ステップにより
    決定された上記クラスタ配列に対してホモロジー検索を
    行い類似塩基配列を抽出するクラスタ配列ホモロジー検
    索ステップ、 をさらに含み、 上記表示ステップは、上記クラスタ毎に上記クラスタ配
    列とその類似配列と上記画像データと対応する上記塩基
    配列とを表示する、 ことを特徴とする請求項34または35に記載のプログ
    ラム。
  37. 【請求項37】 上記クラスタ配列ホモロジー検索ステ
    ップは、 (1)既に同じあるいは別の生物で既知となっている遺
    伝子、 (2)未知の遺伝子であるが同じcDNAが既に取得さ
    れている遺伝子、 (3)未知の遺伝子であるが対応するゲノムDNA断片
    が既に取得されている遺伝子、 (4)染色体上での位置がわかっている遺伝子、 (5)既に特許が取得されている遺伝子、 のうち少なくとも一つの遺伝子の塩基配列を対象として
    ホモロジー検索を行うことを特徴とする請求項36に記
    載のプログラム。
  38. 【請求項38】 上記画像データに対して、採取した組
    織に関する情報、採取した組織の発育段階または加齢段
    階に関する情報、遺伝子の発現が見られるか否かに関す
    る情報、および、発現が見られる部位に関する情報のう
    ち少なくとも一つを対応付けて格納するアノテーション
    情報格納ステップ、 をさらに含み、 上記表示ステップは、上記画像データに対して、上記採
    取した組織に関する情報、上記採取した組織の発育段階
    または加齢段階に関する情報、上記遺伝子の発現が見ら
    れるか否かに関する情報、および、上記発現が見られる
    部位に関する情報のうち少なくとも一つを対応付けて表
    示する、 ことを特徴とする請求項31から37のいずれか一つに
    記載のプログラム。
  39. 【請求項39】 上記画像データおよび/または上記塩
    基配列に基づいて、上記画像データ中の遺伝子の発現量
    を推定する発現量推定ステップ、 をさらに含むことを特徴とする請求項31から38のい
    ずれか一つに記載のプログラム。
  40. 【請求項40】 上記発現量推定ステップにより推定さ
    れた上記発現量に従って、上記画像データの表示順番を
    ソートする発現量順ソートステップ、 をさらに含むことを特徴とする請求項39に記載のプロ
    グラム。
  41. 【請求項41】 上記画像データ、上記塩基配列、上記
    発現量、上記採取した組織に関する情報、上記採取した
    組織の発育段階または加齢段階に関する情報、上記遺伝
    子の発現が見られるか否かに関する情報、および、上記
    発現が見られる部位に関する情報のうち少なくとも一つ
    に基づいて、2つ以上の上記画像データを比較する画像
    比較ステップと、 上記画像比較ステップの比較結果に基づいて、2つ以上
    の上記画像データの相違点を抽出する相違点抽出ステッ
    プと、 をさらに含むことを特徴とする請求項31から40のい
    ずれか一つに記載のプログラム。
  42. 【請求項42】 2つ以上の上記画像データから3次元
    画像を作成する3次元画像作成ステップと、 上記画像データの上記発現量から上記3次元画像におけ
    る発現量をシミュレーションする発現量シミュレーショ
    ンステップと、 をさらに含むことを特徴とする請求項31から41のい
    ずれか一つに記載のプログラム。
  43. 【請求項43】 同一の上記クラスタに属する上記塩基
    配列の中から、上記画像データ、上記塩基配列、上記発
    現量、上記採取した組織に関する情報、上記採取した組
    織の発育段階または加齢段階に関する情報、上記遺伝子
    の発現が見られるか否かに関する情報、および、上記発
    現が見られる部位に関する情報のうち少なくとも一つに
    基づいて、代表クローンを決定する代表クローン決定ス
    テップ、 をさらに含むことを特徴とする請求項33から42のい
    ずれか一つに記載のプログラム。
  44. 【請求項44】 上記クラスタに対して、上記クラスタ
    配列のホモロジー検索結果、上記画像データ、上記塩基
    配列、上記発現量、上記採取した組織に関する情報、上
    記採取した組織の発育段階または加齢段階に関する情
    報、上記遺伝子の発現が見られるか否かに関する情報、
    および、上記発現が見られる部位に関する情報のうち少
    なくとも一つに基づいて、クラスタ重要度を決定するク
    ラスタ重要度決定ステップ、 をさらに含むことを特徴とする請求項33から43のい
    ずれか一つに記載のプログラム。
  45. 【請求項45】 上記塩基配列の存在する染色体上の遺
    伝子座を特定する遺伝子座特定ステップと、 上記染色体の上記遺伝子座に上記塩基配列に関する情報
    をマッピングすることにより染色体マップを作成する染
    色体マップ作成ステップと、 上記染色体マップ作成ステップにて作成した上記染色体
    マップを表示する染色体マップ表示ステップと、 をさらに含むことを特徴とする請求項31から44のい
    ずれか一つに記載のプログラム。
  46. 【請求項46】 上記請求項31から45のいずれか一
    つに記載されたプログラムを記録したことを特徴とする
    コンピュータ読み取り可能な記録媒体。
JP2002040746A 2002-02-18 2002-02-18 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 Expired - Fee Related JP3880417B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002040746A JP3880417B2 (ja) 2002-02-18 2002-02-18 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体
US10/504,956 US20050107961A1 (en) 2002-02-18 2003-02-18 Apparatus for managing gene expression data
PCT/JP2003/001708 WO2003081471A1 (fr) 2002-02-18 2003-02-18 Dispositif de gestion de donnees d'expression genetique
EP03705276A EP1477910A4 (en) 2002-02-18 2003-02-18 DEVICE FOR MANAGING GENE EXPRESSION DATA

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002040746A JP3880417B2 (ja) 2002-02-18 2002-02-18 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2003242154A true JP2003242154A (ja) 2003-08-29
JP3880417B2 JP3880417B2 (ja) 2007-02-14

Family

ID=27781391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002040746A Expired - Fee Related JP3880417B2 (ja) 2002-02-18 2002-02-18 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP3880417B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036441A1 (ja) * 2003-10-07 2005-04-21 Reverse Proteomics Research Institute Co., Ltd. 生体関連事象間の相関データの可視化方法、解析法及びデータベース
WO2007026705A1 (ja) * 2005-08-29 2007-03-08 Riken 遺伝子発現画像構築方法および遺伝子発現画像構築システム
WO2012096015A1 (ja) * 2011-01-11 2012-07-19 日本ソフトウェアマネジメント株式会社 核酸情報処理装置およびその処理方法
WO2013100572A1 (en) * 2011-12-27 2013-07-04 Macrogen Inc. Apparatus and method for managing genetic information
WO2015199440A1 (ko) * 2014-06-24 2015-12-30 서울대학교산학협력단 핵산염기서열 보안 방법, 장치 및 이를 저장한 기록매체
CN109564770A (zh) * 2017-04-28 2019-04-02 国立研究开发法人海洋研究开发机构 整合系统以及整合方法
US10896743B2 (en) 2014-06-24 2021-01-19 Cipherome, Inc. Secure communication of nucleic acid sequence information through a network
WO2021039592A1 (ja) * 2019-08-29 2021-03-04 コニカミノルタ株式会社 創薬支援方法、創薬支援装置及びプログラム
JP2022508857A (ja) * 2018-10-15 2022-01-19 智慧芽信息科技(蘇州)有限公司 遺伝子配列の権利範囲表記、検索及び情報表記方法、システム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036441A1 (ja) * 2003-10-07 2005-04-21 Reverse Proteomics Research Institute Co., Ltd. 生体関連事象間の相関データの可視化方法、解析法及びデータベース
WO2007026705A1 (ja) * 2005-08-29 2007-03-08 Riken 遺伝子発現画像構築方法および遺伝子発現画像構築システム
JP2007064689A (ja) * 2005-08-29 2007-03-15 Institute Of Physical & Chemical Research 遺伝子発現画像構築方法および遺伝子発現画像構築システム
JP4724497B2 (ja) * 2005-08-29 2011-07-13 独立行政法人理化学研究所 遺伝子発現画像構築方法および遺伝子発現画像構築システム
US8189898B2 (en) 2005-08-29 2012-05-29 Riken Gene expression image constructing method and gene expression image constructing system
WO2012096015A1 (ja) * 2011-01-11 2012-07-19 日本ソフトウェアマネジメント株式会社 核酸情報処理装置およびその処理方法
WO2013100572A1 (en) * 2011-12-27 2013-07-04 Macrogen Inc. Apparatus and method for managing genetic information
KR101300475B1 (ko) 2011-12-27 2013-09-02 서울대학교산학협력단 유전자 정보 관리 장치 및 방법
WO2015199440A1 (ko) * 2014-06-24 2015-12-30 서울대학교산학협력단 핵산염기서열 보안 방법, 장치 및 이를 저장한 기록매체
US10896743B2 (en) 2014-06-24 2021-01-19 Cipherome, Inc. Secure communication of nucleic acid sequence information through a network
CN109564770A (zh) * 2017-04-28 2019-04-02 国立研究开发法人海洋研究开发机构 整合系统以及整合方法
US20210295953A1 (en) * 2017-04-28 2021-09-23 Japan Agency For Marine-Earth Science And Technology Integration system and integration method
CN109564770B (zh) * 2017-04-28 2023-11-21 国立研究开发法人海洋研究开发机构 整合系统以及整合方法
US11837331B2 (en) * 2017-04-28 2023-12-05 Japan Agency For Marine-Earth Science And Technology Integration system and integration method
JP2022508857A (ja) * 2018-10-15 2022-01-19 智慧芽信息科技(蘇州)有限公司 遺伝子配列の権利範囲表記、検索及び情報表記方法、システム
WO2021039592A1 (ja) * 2019-08-29 2021-03-04 コニカミノルタ株式会社 創薬支援方法、創薬支援装置及びプログラム

Also Published As

Publication number Publication date
JP3880417B2 (ja) 2007-02-14

Similar Documents

Publication Publication Date Title
Lähnemann et al. Eleven grand challenges in single-cell data science
Nelson et al. McClintock: an integrated pipeline for detecting transposable element insertions in whole-genome shotgun sequencing data
Burton et al. Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions
Merkel et al. Detecting short tandem repeats from genome data: opening the software black box
EP1477910A1 (en) Apparatus for managing gene expression data
Olson et al. Variant calling and benchmarking in an era of complete human genome sequences
Milone et al. * omeSOM: a software for clustering and visualization of transcriptional and metabolite data mined from interspecific crosses of crop plants
Hajarnavis et al. A probabilistic model of 3′ end formation in Caenorhabditis elegans
JP3880417B2 (ja) 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体
Poustka et al. Generation, annotation, evolutionary analysis, and database integration of 20,000 unique sea urchin EST clusters
JP2003330934A (ja) 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
KR100650203B1 (ko) 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법
Huang et al. Integration of bioinformatics resources for functional analysis of gene expression and proteomic data
Kasukawa et al. Construction of representative transcript and protein sets of human, mouse, and rat as a platform for their transcriptome and proteome analysis
JP5288355B2 (ja) 塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法
Kirkness et al. The TIGR human cDNA database
Guliaev et al. MGERT: a pipeline to retrieve coding sequences of mobile genetic elements from genome assemblies
JP2004147640A (ja) insituハイブリダイゼーション解析管理方法およびinsituハイブリダイゼーション解析管理装置
AU2003235071B2 (en) Information management system, method, computer program, and storage device for large-scale in situ hybridization analysis
US6994965B2 (en) Method for displaying results of hybridization experiment
Schächter Bioinformatics of large-scale protein interaction networks
JP2005038256A (ja) 有効因子情報選択装置、有効因子情報選択方法、プログラム、および、記録媒体
AU2006228077B2 (en) Information management system, method, computer program, and storage device for large-scale in situ hybridization analysis
JP2004147513A (ja) Cyp代謝予測装置、cyp代謝予測方法、および、プログラム
KR100474840B1 (ko) 디렉토리를 이용한 유전자 분석용 마이크로어레이 탐침설계 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061107

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091117

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131117

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees