JP3880417B2 - 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 - Google Patents
遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 Download PDFInfo
- Publication number
- JP3880417B2 JP3880417B2 JP2002040746A JP2002040746A JP3880417B2 JP 3880417 B2 JP3880417 B2 JP 3880417B2 JP 2002040746 A JP2002040746 A JP 2002040746A JP 2002040746 A JP2002040746 A JP 2002040746A JP 3880417 B2 JP3880417 B2 JP 3880417B2
- Authority
- JP
- Japan
- Prior art keywords
- gene
- cluster
- sequence
- expression
- base sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000014509 gene expression Effects 0.000 title claims description 397
- 238000007726 management method Methods 0.000 title claims description 106
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 108090000623 proteins and genes Proteins 0.000 claims description 434
- 239000002299 complementary DNA Substances 0.000 claims description 219
- 210000001519 tissue Anatomy 0.000 claims description 115
- 210000000349 chromosome Anatomy 0.000 claims description 108
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 53
- 230000032683 aging Effects 0.000 claims description 49
- 150000007523 nucleic acids Chemical group 0.000 claims description 45
- 239000012634 fragment Substances 0.000 claims description 40
- 238000003860 storage Methods 0.000 claims description 39
- 108020004414 DNA Proteins 0.000 claims description 28
- 239000000284 extract Substances 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 7
- 108091035707 Consensus sequence Proteins 0.000 claims 3
- 238000000034 method Methods 0.000 description 90
- 108020004999 messenger RNA Proteins 0.000 description 38
- 238000012545 processing Methods 0.000 description 37
- 230000008569 process Effects 0.000 description 34
- 210000001550 testis Anatomy 0.000 description 31
- 238000007901 in situ hybridization Methods 0.000 description 30
- 238000002474 experimental method Methods 0.000 description 25
- 102000004169 proteins and genes Human genes 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 19
- 210000000056 organ Anatomy 0.000 description 19
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 15
- 239000000523 sample Substances 0.000 description 12
- 238000004088 simulation Methods 0.000 description 12
- 239000002773 nucleotide Substances 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000010191 image analysis Methods 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 210000002149 gonad Anatomy 0.000 description 8
- 241000124008 Mammalia Species 0.000 description 7
- 239000007850 fluorescent dye Substances 0.000 description 7
- 238000011065 in-situ storage Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 102100034452 Alternative prion protein Human genes 0.000 description 5
- 108020004635 Complementary DNA Proteins 0.000 description 5
- 230000010365 information processing Effects 0.000 description 5
- 101150084658 INA gene Proteins 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000001647 drug administration Methods 0.000 description 4
- 238000003703 image analysis method Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000012268 genome sequencing Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical group CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 241000792325 Gonia Species 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000002332 leydig cell Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 210000000717 sertoli cell Anatomy 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 235000012571 Ficus glomerata Nutrition 0.000 description 1
- 240000000365 Ficus racemosa Species 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000002431 foraging effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
【発明の属する技術分野】
本発明は、遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体に関し、特に、発現画像を管理する遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】
従来より、破砕していない細胞や組織に特定遺伝子のプローブを直接ハイブリダイズさせ、DNAやmRNAなどの核酸あるいはタンパク質の細胞または組織内の分布や局在を光学顕微鏡や電子顕微鏡により調べるin situハイブリダイゼーションを用いて、遺伝子の発現場所などの同定を行う実験手法が広く行われている。
【0003】
また、科学技術振興事業団土居バイオアシンメトリプロジェクトの小宮透らにより、臓器などの切片を用いた高速in situハイブリダイゼーションの手法が開発されている(小宮透「96ウェルで行う切片のin situハイブリダイゼーション」細胞工学 18、405 1999年 など)。
【0004】
この高速in situハイブリダイゼーション法の概要について図1を参照して説明する。図1に示すように、まず、臓器などの組織からmRNAを精製し、NotIオリゴ(dT)を用いてmRNAからcDNAを合成してcDNAライブラリーを作製する(ステップSA−1)。そして、cDNAライブラリーの均一化を行い均一化ライブラリーを作製する(ステップSA−2)。本手法においては、cDNAの均一化ライブラリーを用いることにより、微量な遺伝子の発現についても同定することができる。
【0005】
そして、ベクタへのライゲーションを行い、大腸菌へのトランスフォームを行う(ステップSA−3)。そして、トランスフォームされた大腸菌のコロニーを作製する(ステップSA−4)。そして、コロニーをランダムにピックアップし、ベクタの配列を使ってPCRにより内部のcDNAを直線化し増幅する。その際にはベクタ由来のRNAポリメラーゼのプロモーター配列が付加される。増幅されたcDNAをガラスパウダー法を用いて96ウェルプレートのフォーマットで精製し、これをマスターライブラリーとして保存する(ステップSA−5)。
【0006】
そして、精製フラグメントを使って96ウェルプレートでハプテンであるDIG(digoxigenin)ラベルの転写反応を行う(ステップSA−6)。そして、出来上がったプローブをエタノール沈殿し、希釈して、96ウェルプレートの底にポリエステルワックスなどで貼り付けた臓器などの組織の切片に対して、in situハイブリダイゼーションを行う(ステップSA−7)。なお、ハイブリダイズ、酵素ラベルされた抗DIG抗体反応後の洗浄はELISA洗浄器を用いてシステマチックに行う。
【0007】
そして、酵素抗体法による発色後、倒立顕微鏡で観察し、画像をCCDカメラで取り込む。ここで、図2は、取り込まれた画像の一例を示す図である。図2に示すように、発色(図中の黒色で示す部分)がある場所などの興味のある発現を示す像が得られた場合には、マスターライブラリーの対応するクローンの塩基配列を決定することで、遺伝子の発現像と塩基配列とを対応させて情報を得ることができる(ステップSA−8)。
【0008】
【発明が解決しようとする課題】
しかしながら、従来の手法によると、in situハイブリダイゼーションにより発現像を得て、プローブとして用いたcDNAの塩基配列の情報とのマッチングやその情報を用いた生物的知見の発見は人手により行っているため、取得した情報を統括的に管理し漏れなく知見を抽出することが困難であるという問題点を有していた。
以下、この問題点の内容について、一層具体的に説明する。
【0009】
上述した高速in situハイブリダイゼーションでは、得られた大量の発現像の解析やその遺伝子配列のホモロジー検索などによる解析が人手により行われる。すなわち、実験者は、発現したcDNAクローンの塩基配列に基づいて、既存のcDNAデータベース(たとえば、ESTデータベースや完全長cDNAデータベースなど)に対してBLASTなどのホモロジー検索プログラムにより類似配列の検索を行い、発現した遺伝子(mRNA)の特定などを行う必要がある。また、cDNAライブラリーに含まれる複数のcDNAクローンにつき同一のmRNAに由来するものを抽出してクラスタリングを行ったり、同一のクラスタに含まれるcDNAクローンの発現画像の分類作業を行ったり、さらに、その画像から読取れる知見について抽出を行ったりする必要がある。
【0010】
また、このような高速in situハイブリダイゼーション実験を一つの組織について行うと少なくとも数百から数千の画像が取得され、さらに近年のトランスクリプトーム解析やプロテオーム解析の進展に伴い、高速in situハイブリダイゼーションなどによる発現解析のための実験データは膨大になることが予想される。従って、人手による作業には自ずと限界が生ずるため、これらの作業につき統合的に管理することができるデータベースシステムの開発が望まれている。
【0011】
また、in situハイブリダイゼーションに関する実験データを一元管理するデータベースシステムを導入してデータマイニング手法を駆使することにより、従来の人手による解析によっては発見することができなかった知見についてコンピュータシステム上で発見することができることが期待される。
【0012】
なお、これまで説明した従来の技術および発明が解決しようとする課題は、上述した高速in situハイブリダイゼーションによる実験データを収集する場合に限られず、他の手法により遺伝子の発現情報を解析する全ての実験手法を用いる場合において、同様に考えることができる。
【0013】
本発明は上記問題点に鑑みてなされたもので、各種の遺伝子発現実験により取得した画像情報および遺伝子情報を統括的に管理し漏れなく知見を抽出することのできる、遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することを目的としている。
【0014】
【課題を解決するための手段】
このような目的を達成するため、請求項1に記載の遺伝子発現情報管理装置は、制御装置と記憶装置と出力装置とを少なくとも備えた遺伝子発現情報管理装置であって、上記記憶装置は、遺伝子の発現に関する複数の画像データと、当該画像データに対応する発現遺伝子の識別情報と、当該発現遺伝子を採取した組織に関する搾取組織情報、当該発現遺伝子を採取した組織の発育段階または加齢段階に関する段階情報、当該発現遺伝子の発現が見られるか否かに関する発現情報、および、発現が見られる部位に関する部位情報を含むアノテーション情報と、を対応付けて格納した画像データベースと、上記画像データに対応する上記発現遺伝子の識別情報と、発現遺伝子塩基配列と、を対応付けて格納した発現遺伝子データベースと、複数の、塩基配列識別情報と塩基配列とを対応付けて格納する核酸配列データベースと、を備え、上記制御装置は、上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該発現遺伝子塩基配列に対応する上記発現発現遺伝子の識別情報と、当該類似塩基配列の上記塩基配列識別情報および当該ホモロジースコアと、を対応付けて登録したホモロジー検索結果データベースを作成し、上記記憶装置に格納するホモロジー検索手段と、上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に基づいてクラスタ分類を実行し、各クラスタを一意に識別するクラスタ識別情報を付与し、上記クラスタ識別情報と、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、を対応付けて登録したクラスタデータベースを作成し、上記記憶装置に格納するクラスタリング手段と、任意の上記クラスタについて、(1)上記クラスターデータベースに登録された、当該任意の上記クラスタに対応する上記クラスタ識別情報、および、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、(2)上記ホモロジー検索結果データベースに登録された、当該発現遺伝子の識別情報に対応する、上記類似塩基配列の塩基配列識別情報および上記ホモロジースコアと、(3)上記画像データベースに登録された、当該クラスタを構成する上記発現遺伝子の識別情報に対応する上記画像データ、および、当該画像データに対応する上記アノテーション情報の一部または全部と、を抽出して上記出力装置に表示する表示手段と、を備えたことを特徴とする。
【0015】
この装置によれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してホモロジー検索を行い類似塩基配列を抽出し、画像データと対応する塩基配列とその類似塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができるようになる。
【0016】
すなわち、例えばin situハイブリダイゼーションなどの遺伝子発現実験において撮影された画像データに対応する、プローブとして用いたcDNAの塩基配列について、塩基配列データベース(ESTデータベースや完全長cDNAデータベースなど)に格納された既知の塩基配列とホモロジー検索(例えば、FastA、Blastなど)を行い、類似性の高い塩基配列を表示することにより、当該cDNAを特定し、当該cDNAと画像データとを併記して分かり易く表示することができるようになる。
【0017】
また、類似塩基配列と一緒に当該塩基配列と類似塩基配列との間の類似度(例えば、ホモロジー検索のスコアなど)を表示してもよい。これにより、最も類似する塩基配列を表示したり、ホモロジースコアの高い順にソートして類似配列を表示したりすることができるようになる。
【0018】
さらに、類似配列に付属する情報として、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該cDNAの塩基配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報のうち少なくとも一つを類似配列と併記して表示してもよい。
また、この装置によれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してクラスタリングを行い、塩基配列を特定のクラスタに分類し、クラスタ毎に画像データと対応する塩基配列とを表示するので、例えば同じmRNAに由来するcDNA(EST配列)を同じクラスタに分類すること等により、同一の性質を持つ塩基配列を集めて特定のクラスタに分類することができるようになる。
これにより、cDNAライブラリーからランダムに抽出したcDNAクローンの重複を排除すること等ができるようになり、さらに、実験結果のまとめ作業を効率化することができるようになる。
また、この装置によれば、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて格納し、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて表示することができるようになる。
【0019】
また、請求項2に記載の装置は、請求項1に記載の遺伝子発現情報管理装置において、上記ホモロジー検索手段は、上記核酸配列データベースに格納された、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子、のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする。
【0020】
これはホモロジー検索の一例を一層具体的に示すものである。この装置によれば、ホモロジー検索は、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うので、画像データの持つ生物学的な重要度などを容易に特定することができるようになる。
【0021】
すなわち、(1)から(5)の各カテゴリの塩基配列を格納した各塩基情報データベースを対象としてホモロジー検索を行うことができるようになるので、各カテゴリで最も類似度の高い塩基配列を個別に特定することができるようになる。
【0025】
また、請求項3に記載の装置は、請求項1または2に記載の遺伝子発現情報管理装置において、上記クラスタリング手段により同一の上記クラスタに分類された上記発現遺伝子塩基配列からクラスタ配列を決定するクラスタ配列決定手段、をさらに備え、上記表示手段は、さらに、上記クラスタ毎に上記クラスタ配列を表示する、ことを特徴とする。
【0026】
この装置によれば、同一のクラスタに分類された塩基配列からクラスタ配列を決定し、クラスタ毎にクラスタ配列と画像データと対応する塩基配列とを表示するので、例えば、クラスタのメンバーの塩基配列を組み合わせて作成した塩基配列(例えば、完全長cDNAなど)をクラスタ配列として決定し、表示することができるようになる。
【0027】
これにより、部分的なcDNA配列(EST配列)を用いた実験から、完全長cDNA(mRNA配列)などの遺伝子配列を容易に予想することができるようになる。
【0028】
また、請求項4に記載の装置は、請求項3に記載の遺伝子発現情報管理装置において、上記クラスタリング手段は、上記発現遺伝子塩基配列を用いて共通配列のアセンブルを行い、同一の上記共通配列を構成した上記発現遺伝子塩基配列を同一の上記クラスタに分類し、上記クラスタ配列決定手段は、上記クラスタの上記共通配列を上記クラスタ配列として決定する、ことを特徴とする。
【0029】
この装置によれば、塩基配列を用いて共通配列のアセンブルを行い、同一の共通配列を構成した塩基配列を同一のクラスタに分類し、クラスタの共通配列をクラスタ配列として決定するので、アセンブル技術(短い断片配列から長い配列を作成する技術をいう。例えば、断片配列間の配列の重なりをマルチプルアラインメントなどの手法を用いて探索し、重なりを持つ断片配列同士を合成することにより長い配列を生成する。)により部分的なcDNA配列からより完全長に近いcDNA配列を作成することができるようになる。
【0030】
また、請求項5に記載の装置は、請求項3または4に記載の遺伝子発現情報管理装置において、上記クラスタ配列決定手段により決定された上記クラスタ配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該クラスタ配列に対応する上記クラスタ識別情報と、当該類似塩基配列の上記塩基配列識別情報と、当該ホモロジースコアと、を対応付けて登録したクラスタ配列ホモロジー検索結果データベースを作成し、上記記憶装置に格納するクラスタ配列ホモロジー検索手段、をさらに備え、上記表示手段は、さらに、上記クラスタ毎に上記クラスタ配列ホモロジー検索結果データベースに登録した上記クラスタ配列と上記類似配列の上記塩基配列識別情報と上記ホモロジースコアを表示する、ことを特徴とする。
【0031】
この装置によれば、決定されたクラスタ配列に対してホモロジー検索を行い類似塩基配列を抽出し、クラスタ毎にクラスタ配列とその類似配列と画像データと対応する塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができるようになる。
【0032】
すなわち、プローブに用いたcDNAの塩基配列からアセンブルなどを実行することより合成したクラスタ配列について、塩基配列データベース(ESTデータベースや完全長cDNAデータベースなど)に格納された既知の塩基配列とホモロジー検索(例えば、FastA、Blastなど)を行い、類似性の高い塩基配列を表示することにより、発現した遺伝子を容易に特定することができるようになる。
【0033】
また、類似塩基配列と一緒に当該クラスタ配列と類似塩基配列との間の類似度(例えば、ホモロジースコアなど)を表示してもよい。これにより、クラスタ配列に最も類似する塩基配列を表示したり、ホモロジースコアの高い順にソートして類似配列を表示したりすることができるようになる。
【0034】
さらに、類似配列に付属する情報として、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該クラスタ配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報のうち少なくとも一つを類似配列と一緒に表示してもよい。
【0035】
さらに、任意の遺伝子配列を入力することにより、入力された遺伝子について登録されたcDNAクローン配列とクラスタリングを行い、同一のクラスタに属するクラスタ配列に関する情報(画像データなど)を表示することが可能になる。
【0036】
また、請求項6に記載の装置は、請求項5に記載の遺伝子発現情報管理装置において、上記クラスタ配列ホモロジー検索手段は、上記核酸配列データベースに格納された、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子、のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする。
【0037】
これはクラスタ配列に対するホモロジー検索の一例を一層具体的に示すものである。この装置によれば、ホモロジー検索は、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うので、画像データの持つ生物学的な重要度などを容易に特定することができるようになる。
【0038】
すなわち、(1)から(5)の各カテゴリの塩基配列を格納した各塩基情報データベースを対象としてホモロジー検索を行うことができるようになるので、各カテゴリで最も類似度の高い塩基配列を個別に特定することができるようになる。
【0041】
また、請求項7に記載の装置は、請求項1から6のいずれか一つに記載の遺伝子発現情報管理装置において、上記画像データベースに登録された上記アノテーション情報の中の上記段階情報が異なる2つ以上の上記画像データについて、上記画像データ中の発光量および発光面積を比較する画像比較手段と、上記画像比較手段の比較結果に基づいて、2つ以上の上記画像データの相違点を抽出する相違点抽出手段と、上記相違点に基づいて、上記画像データ中の遺伝子の発現量を推定する発現量推定手段と、上記発現量推定手段により推定された上記発現量に従って、上記表示手段における上記上記画像データの表示順番をソートする発現量順ソート手段とをさらに備えたことを特徴とする。
【0042】
この装置によれば、画像データおよび/または塩基配列に基づいて、画像データ中の遺伝子の発現量を推定するので、発現パターン(均一に発現、偏って発現など)などを容易に特定することができるようになる。
【0043】
ここで、画像データ中の蛍光色素などの発光量や発光面積を既知の画像解析手法などにより求めることにより、発現量を推定してもよい。また、画像データだけでなく塩基配列の情報も利用すれば、例えば、塩基配列にリピート配列が含まれている場合にはクロスハイブリダイズ(同じリピートを持つ当該mRNA以外のmRNAに対してもハイブリダイゼーション反応が起こる)の可能性が高いため推定された発現量に対する信用性は低い、などの評価を自動的にできるようになる。
【0044】
また、例えば、同じ組織切片に対してプローブを発光させたものと発光させないものを撮影したり、別の種類の蛍光色素などで染色したものを撮影したりすることにより、画像解析処理を簡単に実行することができるようになる(その2枚の画像の差分をとることにより発現量を推定する等)。
【0046】
この装置によれば、推定された発現量に従って、画像データの表示順番をソートするので、効率的に実験結果を確認できるようになる。
【0048】
この装置によれば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、2つ以上の画像データを比較し、比較結果に基づいて、2つ以上の画像データの相違点を抽出するので、画像間の差異を効率的に抽出することができるようになる。
【0049】
これにより、画像認識あるいは手作業によってそれぞれの組織での発現パターンについてアノテーションを行ない、そのアノテーションを自動で比較し、相違がみられるものについて抽出して表示することができるようになる。
【0050】
また、例えば、正常細胞と疾患細胞との比較や、発育段階または加齢段階の時系列での比較や、薬剤投与前と投与後の比較などを効率的に実行することができるようになる。
【0052】
この装置によれば、2つ以上の画像データから3次元画像を作成し、画像データの発現量から3次元画像における発現量をシミュレーションするので、一つの配列で臓器の全スライスをテストした場合、その画像をつなぐことにより臓器の3次元画像をシミュレーションし、各画像を画像解析して求めたmRNAの発現量を3次元的に補正し表示することができるようになる。
【0054】
この装置によれば、同一のクラスタに属する塩基配列の中から、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、代表クローンを決定するので、例えば、同じmRNAに由来するクローン群のうち最もよい実験データがとれるクローンを一つ選んで代表クローンとして抽出することができるようになる。また、同じmRNA由来と思われるESTは同じクラスタに分類し、代表クローンのみを実験することによって、その後の実験回数を減らすことができる。つまり、クラスタリングによって、それまではEST数の実験が必要だったのに対し、代表クローン(クラスタ数存在する)についてのみ実験を行うことで足りるようになる。
【0055】
ここで、同一mRNAに由来するcDNAクローンであっても切断箇所により配列が少しずつ異なる。in situハイブリダイゼーションを実施したときにそのcDNA配列によってきれいに発現シグナルがでるものとそうでないものがあるため、画像データをみてきれいにシグナルが出ているクローンを代表クローンとしてもよい。
【0056】
また、cDNAクローンの塩基配列は、リピート配列を持たないものや、実験に適した配列長のものを代表クローンとしてもよい。
【0058】
この装置によれば、クラスタ配列のホモロジー検索結果、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいてクラスタ重要度を決定するので、これらの情報に基づいてクラスタの重要度を任意に決定し、利用者が注目するクラスタを容易に発見することができるようになる。
【0059】
例えば、発現量と組織に関する情報に基づいて特定の発育段階または加齢段階の組織で高い発現を示すクローンについて重要度を高く決定してもよく、さらに、その塩基配列に対するホモロジー検索結果により既存の遺伝子配列DBにヒットしない(すなわち、既知の類似配列が存在しない)ものであれば、さらに重要度を高く決定してもよい。
【0060】
また、請求項8に記載の装置は、請求項1から7のいずれか一つに記載の遺伝子発現情報管理装置において、上記塩基配列の存在する染色体上の遺伝子座を特定する遺伝子座特定手段と、上記染色体の上記遺伝子座に上記塩基配列に関する情報をマッピングすることにより染色体マップを作成する染色体マップ作成手段と、上記染色体マップ作成ステップにて作成した上記染色体マップを表示する染色体マップ表示ステップとをさらに備えたことを特徴とする。
【0061】
この装置によれば、塩基配列の存在する染色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配列に関する情報(例えば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報など)をマッピングすることにより染色体マップを作成することができるようになる。
【0062】
また、当該染色体マップの遺伝子座に対応する部分(特定のマークなどを表示しても良い)を選択すると、その詳細な塩基配列に関する情報を表示するようにしてもよい。
【0063】
また、本発明は遺伝子発現情報管理方法に関するものであり、請求項9に記載の遺伝子発現情報管理方法は、制御装置と記憶装置と出力装置とを少なくとも備えた遺伝子発現情報管理装置を用いた遺伝子発現情報管理方法であって、上記記憶装置は、遺伝子の発現に関する複数の画像データと、当該画像データに対応する発現遺伝子の識別情報と、当該発現遺伝子を採取した組織に関する搾取組織情報、当該発現遺伝子を採取した組織の発育段階または加齢段階に関する段階情報、当該発現遺伝子の発現が見られるか否かに関する発現情報、および、発現が見られる部位に関する部位情報を含むアノテーション情報と、を対応付けて格納した画像データベースと、上記画像データに対応する上記発現遺伝子の識別情報と、発現遺伝子塩基配列と、を対応付けて格納した発現遺伝子データベースと、複数の、塩基配列識別情報と塩基配列とを対応付けて格納する核酸配列データベースと、を備え、上記制御装置において実行される、上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該発現遺伝子塩基配列に対応する上記発現発現遺伝子の識別情報と、当該類似塩基配列の上記塩基配列識別情報および当該ホモロジースコアと、を対応付けて登録したホモロジー検索結果データベースを作成し、上記記憶装置に格納するホモロジー検索ステップと、上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に基づいてクラスタ分類を実行し、各クラスタを一意に識別するクラスタ識別情報を付与し、上記クラスタ識別情報と、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、を対応付けて登録したクラスタデータベースを作成し、上記記憶装置に格納するクラスタリングステップと、任意の上記クラスタについて、(1)上記クラスターデータベースに登録された、当該任意の上記クラスタに対応する上記クラスタ識別情報、および、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、(2)上記ホモロジー検索結果データベースに登録された、当該発現遺伝子の識別情報に対応する、上記類似塩基配列の塩基配列識別情報および上記ホモロジースコアと、(3)上記画像データベースに登録された、当該クラスタを構成する上記発現遺伝子の識別情報に対応する上記画像データ、および、当該画像データに対応する上記アノテーション情報の一部または全部と、を抽出して上記出力装置に表示する表示ステップと、を備えたことを特徴とする。
【0064】
この方法によれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してホモロジー検索を行い類似塩基配列を抽出し、画像データと対応する塩基配列とその類似塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができるようになる。
【0065】
すなわち、例えばin situハイブリダイゼーションなどの遺伝子発現実験において撮影された画像データに対応する、プローブとして用いたcDNAの塩基配列について、塩基配列データベース(ESTデータベースや完全長cDNAデータベースなど)に格納された既知の塩基配列とホモロジー検索(例えば、FastA、Blastなど)を行い、類似性の高い塩基配列を表示することにより、当該cDNAを特定し、当該cDNAと画像データとを併記して分かり易く表示することができるようになる。
【0066】
また、類似塩基配列と一緒に当該塩基配列と類似塩基配列との間の類似度(例えば、ホモロジー検索のスコアなど)を表示してもよい。これにより、最も類似する塩基配列を表示したり、ホモロジースコアの高い順にソートして類似配列を表示したりすることができるようになる。
【0067】
さらに、類似配列に付属する情報として、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該cDNAの塩基配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報のうち少なくとも一つを類似配列と併記して表示してもよい。
また、この方法によれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してクラスタリングを行い、塩基配列を特定のクラスタに分類し、クラスタ毎に画像データと対応する塩基配列とを表示するので、例えば同じmRNAに由来するcDNA(EST配列)を同じクラスタに分類すること等により、同一の性質を持つ塩基配列を集めて特定のクラスタに分類することができるようになる。
これにより、cDNAライブラリーからランダムに抽出したcDNAクローンの重複を排除すること等ができるようになり、さらに、実験結果のまとめ作業を効率化することができるようになる。
また、この方法によれば、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて格納し、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて表示することができるようになる。
【0068】
また、請求項10に記載の方法は、請求項9に記載の遺伝子発現情報管理方法において、上記ホモロジー検索ステップは、上記核酸配列データベースに格納された、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子、のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする。
【0069】
これはホモロジー検索の一例を一層具体的に示すものである。この方法によれば、ホモロジー検索は、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うので、画像データの持つ生物学的な重要度などを容易に特定することができるようになる。
【0070】
すなわち、(1)から(5)の各カテゴリの塩基配列を格納した各塩基情報データベースを対象としてホモロジー検索を行うことができるようになるので、各カテゴリで最も類似度の高い塩基配列を個別に特定することができるようになる。
【0074】
また、請求項11に記載の方法は、請求項9または10に記載の遺伝子発現情報管理方法において、上記クラスタリングステップにより同一の上記クラスタに分類された上記発現遺伝子塩基配列からクラスタ配列を決定するクラスタ配列決定ステップ、をさらに備え、上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列を表示する、ことを特徴とする。
【0075】
この方法によれば、同一のクラスタに分類された塩基配列からクラスタ配列を決定し、クラスタ毎にクラスタ配列と画像データと対応する塩基配列とを表示するので、例えば、クラスタのメンバーの塩基配列を組み合わせて作成した塩基配列(例えば、完全長cDNAなど)をクラスタ配列として決定し、表示することができるようになる。
【0076】
これにより、部分的なcDNA配列(EST配列)を用いた実験から、完全長cDNA(mRNA配列)などの遺伝子配列を容易に予想することができるようになる。
【0077】
また、請求項12に記載の方法は、請求項11に記載の遺伝子発現情報管理方法において、上記クラスタリングステップは、上記発現遺伝子塩基配列を用いて共通配列のアセンブルを行い、同一の上記共通配列を構成した上記発現遺伝子塩基配列を同一の上記クラスタに分類し、上記クラスタ配列決定ステップは、上記クラスタの上記共通配列を上記クラスタ配列として決定する、ことを特徴とする。
【0078】
この方法によれば、塩基配列を用いて共通配列のアセンブルを行い、同一の共通配列を構成した塩基配列を同一のクラスタに分類し、クラスタの共通配列をクラスタ配列として決定するので、アセンブル技術(短い断片配列から長い配列を作成する技術をいう。例えば、断片配列間の配列の重なりをマルチプルアラインメントなどの手法を用いて探索し、重なりを持つ断片配列同士を合成することにより長い配列を生成する。)により部分的なcDNA配列からより完全長に近いcDNA配列を作成することができるようになる。
【0079】
また、請求項13に記載の方法は、請求項11または12に記載の遺伝子発現情報管理方法において、上記クラスタ配列決定ステップにより決定された上記クラスタ配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該クラスタ配列に対応する上記クラスタ識別情報と、当該類似塩基配列の上記塩基配列識別情報と、当該ホモロジースコアと、を対応付けて登録したクラスタ配列ホモロジー検索結果データベースを作成し、上記記憶装置に格納するクラスタ配列ホモロジー検索ステップ、をさらに備え、上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列ホモロジー検索結果データベースに登録した上記クラスタ配列と上記類似配列の上記塩基配列識別情報と上記ホモロジースコアを表示する、ことを特徴とする。
【0080】
この方法によれば、決定されたクラスタ配列に対してホモロジー検索を行い類似塩基配列を抽出し、クラスタ毎にクラスタ配列とその類似配列と画像データと対応する塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができるようになる。
【0081】
すなわち、プローブに用いたcDNAの塩基配列からアセンブルなどを実行することより合成したクラスタ配列について、塩基配列データベース(ESTデータベースや完全長cDNAデータベースなど)に格納された既知の塩基配列とホモロジー検索(例えば、FastA、Blastなど)を行い、類似性の高い塩基配列を表示することにより、発現した遺伝子を容易に特定することができるようになる。
【0082】
また、類似塩基配列と一緒に当該クラスタ配列と類似塩基配列との間の類似度(例えば、ホモロジースコアなど)を表示してもよい。これにより、クラスタ配列に最も類似する塩基配列を表示したり、ホモロジースコアの高い順にソートして類似配列を表示したりすることができるようになる。
【0083】
さらに、類似配列に付属する情報として、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該クラスタ配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報のうち少なくとも一つを類似配列と一緒に表示してもよい。
【0084】
さらに、任意の遺伝子配列を入力することにより、入力された遺伝子について登録されたcDNAクローン配列とクラスタリングを行い、同一のクラスタに属するクラスタ配列に関する情報(画像データなど)を表示することが可能になる。
【0085】
また、請求項14に記載の方法は、請求項13に記載の遺伝子発現情報管理方法において、上記クラスタ配列ホモロジー検索ステップは、上記核酸配列データベースに格納された、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子、のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする。
【0086】
これはクラスタ配列に対するホモロジー検索の一例を一層具体的に示すものである。この方法によれば、ホモロジー検索は、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うので、画像データの持つ生物学的な重要度などを容易に特定することができるようになる。
【0087】
すなわち、(1)から(5)の各カテゴリの塩基配列を格納した各塩基情報データベースを対象としてホモロジー検索を行うことができるようになるので、各カテゴリで最も類似度の高い塩基配列を個別に特定することができるようになる。
【0090】
また、請求項15に記載の方法は、請求項9から14のいずれか一つに記載の遺伝子発現情報管理方法において、上記画像データベースに登録された上記アノテーション情報の中の上記段階情報が異なる2つ以上の上記画像データについて、上記画像データ中の発光量および発光面積を比較する画像比較ステップと、上記画像比較ステップの比較結果に基づいて、2つ以上の上記画像データの相違点を抽出する相違点抽出ステップと、上記相違点に基づいて、上記画像データ中の遺伝子の発現量を推定する発現量推定ステップと、上記発現量推定ステップにより推定された上記発現量に従って、上記表示ステップにおける上記上記画像データの表示順番をソートする発現量順ソートステップとをさらに備えたことを特徴とする。
【0091】
この方法によれば、画像データおよび/または塩基配列に基づいて、画像データ中の遺伝子の発現量を推定するので、発現パターン(均一に発現、偏って発現など)などを容易に特定することができるようになる。
【0092】
ここで、画像データ中の蛍光色素などの発光量や発光面積を既知の画像解析手法などにより求めることにより、発現量を推定してもよい。また、画像データだけでなく塩基配列の情報も利用すれば、例えば、塩基配列にリピート配列が含まれている場合にはクロスハイブリダイズ(同じリピートを持つ当該mRNA以外のmRNAに対してもハイブリダイゼーション反応が起こる)の可能性が高いため推定された発現量に対する信用性は低い、などの評価を自動的にできるようになる。
【0093】
また、例えば、同じ組織切片に対してプローブを発光させたものと発光させないものを撮影したり、別の種類の蛍光色素などで染色したものを撮影したりすることにより、画像解析処理を簡単に実行することができるようになる(その2枚の画像の差分をとることにより発現量を推定する等)。
【0095】
この方法によれば、推定された発現量に従って、画像データの表示順番をソートするので、効率的に実験結果を確認できるようになる。
【0097】
この方法によれば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、2つ以上の画像データを比較し、比較結果に基づいて、2つ以上の画像データの相違点を抽出するので、画像間の差異を効率的に抽出することができるようになる。
【0098】
これにより、画像認識あるいは手作業によってそれぞれの組織での発現パターンについてアノテーションを行ない、そのアノテーションを自動で比較し、相違がみられるものについて抽出して表示することができるようになる。
【0099】
また、例えば、正常細胞と疾患細胞との比較や、発育段階または加齢段階の時系列での比較や、薬剤投与前と投与後の比較などを効率的に実行することができるようになる。
【0101】
この方法によれば、2つ以上の画像データから3次元画像を作成し、画像データの発現量から3次元画像における発現量をシミュレーションするので、一つの配列で臓器の全スライスをテストした場合、その画像をつなぐことにより臓器の3次元画像をシミュレーションし、各画像を画像解析して求めたmRNAの発現量を3次元的に補正し表示することができるようになる。
【0103】
この方法によれば、同一のクラスタに属する塩基配列の中から、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、代表クローンを決定するので、例えば、同じmRNAに由来するクローン群のうち最もよい実験データがとれるクローンを一つ選んで代表クローンとして抽出することができるようになる。また、同じmRNA由来と思われるESTは同じクラスタに分類し、代表クローンのみを実験することによって、その後の実験回数を減らすことができる。つまり、クラスタリングによって、それまではEST数の実験が必要だったのに対し、代表クローン(クラスタ数存在する)についてのみ実験を行うことで足りるようになる。
【0104】
ここで、同一mRNAに由来するcDNAクローンであっても切断箇所により配列が少しずつ異なる。in situハイブリダイゼーションを実施したときにそのcDNA配列によってきれいに発現シグナルがでるものとそうでないものがあるため、画像データをみてきれいにシグナルが出ているクローンを代表クローンとしてもよい。
【0105】
また、cDNAクローンの塩基配列は、リピート配列を持たないものや、実験に適した配列長のものを代表クローンとしてもよい。
【0107】
この方法によれば、クラスタ配列のホモロジー検索結果、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいてクラスタ重要度を決定するので、これらの情報に基づいてクラスタの重要度を任意に決定し、利用者が注目するクラスタを容易に発見することができるようになる。
【0108】
例えば、発現量と組織に関する情報に基づいて特定の発育段階または加齢段階の組織で高い発現を示すクローンについて重要度を高く決定してもよく、さらに、その塩基配列に対するホモロジー検索結果により既存の遺伝子配列DBにヒットしない(すなわち、既知の類似配列が存在しない)ものであれば、さらに重要度を高く決定してもよい。
【0109】
また、請求項16に記載の方法は、請求項9から15のいずれか一つに記載の遺伝子発現情報管理方法において、上記塩基配列の存在する染色体上の遺伝子座を特定する遺伝子座特定ステップと、上記染色体の上記遺伝子座に上記塩基配列に関する情報をマッピングすることにより染色体マップを作成する染色体マップ作成ステップと、上記染色体マップ作成ステップにて作成した上記染色体マップを表示する染色体マップ表示ステップとをさらに備えたことを特徴とする。
【0110】
この方法によれば、塩基配列の存在する染色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配列に関する情報(例えば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報など)をマッピングすることにより染色体マップを作成することができるようになる。
【0111】
また、当該染色体マップの遺伝子座に対応する部分(特定のマークなどを表示しても良い)を選択すると、その詳細な塩基配列に関する情報を表示するようにしてもよい。
【0112】
また、本発明はプログラムに関するものであり、請求項17に記載のプログラムは、制御装置と記憶装置と出力装置とを少なくとも備えた遺伝子発現情報管理装置に遺伝子発現情報管理方法を実行させるためのプログラムであって、上記記憶装置は、遺伝子の発現に関する複数の画像データと、当該画像データに対応する発現遺伝子の識別情報と、当該発現遺伝子を採取した組織に関する搾取組織情報、当該発現遺伝子を採取した組織の発育段階または加齢段階に関する段階情報、当該発現遺伝子の発現が見られるか否かに関する発現情報、および、発現が見られる部位に関する部位情報を含むアノテーション情報と、を対応付けて格納した画像データベースと、上記画像データに対応する上記発現遺伝子の識別情報と、発現遺伝子塩基配列と、を対応付けて格納した発現遺伝子データベースと、複数の、塩基配列識別情報と塩基配列とを対応付けて格納する核酸配列データベースと、を備え、上記制御装置において実行される、上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該発現遺伝子塩基配列に対応する上記発現発現遺伝子の識別情報と、当該類似塩基配列の上記塩基配列識別情報および当該ホモロジースコアと、を対応付けて登録したホモロジー検索結果データベースを作成し、上記記憶装置に格納するホモロジー検索ステップと、上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に基づいてクラスタ分類を実行し、各クラスタを一意に識別するクラスタ識別情報を付与し、上記クラスタ識別情報と、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、を対応付けて登録したクラスタデータベースを作成し、上記記憶装置に格納するクラスタリングステップと、任意の上記クラスタについて、(1)上記クラスターデータベースに登録された、当該任意の上記クラスタに対応する上記クラスタ識別情報、および、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、(2)上記ホモロジー検索結果データベースに登録された、当該発現遺伝子の識別情報に対応する、上記類似塩基配列の塩基配列識別情報および上記ホモロジースコアと、(3)上記画像データベースに登録された、当該クラスタを構成する上記発現遺伝子の識別情報に対応する上記画像データ、および、当該画像データに対応する上記アノテーション情報の一部または全部と、を抽出して上記出力装置に表示する表示ステップと、を備えたことを特徴とする。
【0113】
このプログラムによれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してホモロジー検索を行い類似塩基配列を抽出し、画像データと対応する塩基配列とその類似塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができるようになる。
【0114】
すなわち、例えばin situハイブリダイゼーションなどの遺伝子発現実験において撮影された画像データに対応する、プローブとして用いたcDNAの塩基配列について、塩基配列データベース(ESTデータベースや完全長cDNAデータベースなど)に格納された既知の塩基配列とホモロジー検索(例えば、FastA、Blastなど)を行い、類似性の高い塩基配列を表示することにより、当該cDNAを特定し、当該cDNAと画像データとを併記して分かり易く表示することができるようになる。
【0115】
また、類似塩基配列と一緒に当該塩基配列と類似塩基配列との間の類似度(例えば、ホモロジー検索のスコアなど)を表示してもよい。これにより、最も類似する塩基配列を表示したり、ホモロジースコアの高い順にソートして類似配列を表示したりすることができるようになる。
【0116】
さらに、類似配列に付属する情報として、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該cDNAの塩基配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報のうち少なくとも一つを類似配列と併記して表示してもよい。
また、このプログラムによれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してクラスタリングを行い、塩基配列を特定のクラスタに分類し、クラスタ毎に画像データと対応する塩基配列とを表示するので、例えば同じmRNAに由来するcDNA(EST配列)を同じクラスタに分類すること等により、同一の性質を持つ塩基配列を集めて特定のクラスタに分類することができるようになる。
これにより、cDNAライブラリーからランダムに抽出したcDNAクローンの重複を排除すること等ができるようになり、さらに、実験結果のまとめ作業を効率化することができるようになる。
また、このプログラムによれば、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて格納し、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて表示することができるようになる。
【0117】
また、請求項18に記載のプログラムは、請求項17に記載のプログラムにおいて、上記ホモロジー検索ステップは、上記核酸配列データベースに格納された、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子、のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする。
【0118】
これはホモロジー検索の一例を一層具体的に示すものである。このプログラムによれば、ホモロジー検索は、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うので、画像データの持つ生物学的な重要度などを容易に特定することができるようになる。
【0119】
すなわち、(1)から(5)の各カテゴリの塩基配列を格納した各塩基情報データベースを対象としてホモロジー検索を行うことができるようになるので、各カテゴリで最も類似度の高い塩基配列を個別に特定することができるようになる。
【0123】
また、請求項19に記載のプログラムは、請求項17または18に記載のプログラムにおいて、上記クラスタリングステップにより同一の上記クラスタに分類された上記発現遺伝子塩基配列からクラスタ配列を決定するクラスタ配列決定ステップ、をさらに備え、上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列を表示する、ことを特徴とする。
【0124】
このプログラムによれば、同一のクラスタに分類された塩基配列からクラスタ配列を決定し、クラスタ毎にクラスタ配列と画像データと対応する塩基配列とを表示するので、例えば、クラスタのメンバーの塩基配列を組み合わせて作成した塩基配列(例えば、完全長cDNAなど)をクラスタ配列として決定し、表示することができるようになる。
【0125】
これにより、部分的なcDNA配列(EST配列)を用いた実験から、完全長cDNA(mRNA配列)などの遺伝子配列を容易に予想することができるようになる。
【0126】
また、請求項20に記載のプログラムは、請求項19に記載のプログラムにおいて、上記クラスタリングステップは、上記発現遺伝子塩基配列を用いて共通配列のアセンブルを行い、同一の上記共通配列を構成した上記発現遺伝子塩基配列を同一の上記クラスタに分類し、上記クラスタ配列決定ステップは、上記クラスタの上記共通配列を上記クラスタ配列として決定する、ことを特徴とする。
【0127】
このプログラムによれば、塩基配列を用いて共通配列のアセンブルを行い、同一の共通配列を構成した塩基配列を同一のクラスタに分類し、クラスタの共通配列をクラスタ配列として決定するので、アセンブル技術(短い断片配列から長い配列を作成する技術をいう。例えば、断片配列間の配列の重なりをマルチプルアラインメントなどの手法を用いて探索し、重なりを持つ断片配列同士を合成することにより長い配列を生成する。)により部分的なcDNA配列からより完全長に近いcDNA配列を作成することができるようになる。
【0128】
また、請求項21に記載のプログラムは、請求項19または20に記載のプログラムにおいて、上記クラスタ配列決定ステップにより決定された上記クラスタ配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該クラスタ配列に対応する上記クラスタ識別情報と、当該類似塩基配列の上記塩基配列識別情報と、当該ホモロジースコアと、を対応付けて登録したクラスタ配列ホモロジー検索結果データベースを作成し、上記記憶装置に格納するクラスタ配列ホモロジー検索ステップ、をさらに備え、上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列ホモロジー検索結果データベースに登録した上記クラスタ配列と上記類似配列の上記塩基配列識別情報と上記ホモロジースコアを表示する、ことを特徴とする。
【0129】
このプログラムによれば、決定されたクラスタ配列に対してホモロジー検索を行い類似塩基配列を抽出し、クラスタ毎にクラスタ配列とその類似配列と画像データと対応する塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができるようになる。
【0130】
すなわち、プローブに用いたcDNAの塩基配列からアセンブルなどを実行することより合成したクラスタ配列について、塩基配列データベース(ESTデータベースや完全長cDNAデータベースなど)に格納された既知の塩基配列とホモロジー検索(例えば、FastA、Blastなど)を行い、類似性の高い塩基配列を表示することにより、発現した遺伝子を容易に特定することができるようになる。
【0131】
また、類似塩基配列と一緒に当該クラスタ配列と類似塩基配列との間の類似度(例えば、ホモロジースコアなど)を表示してもよい。これにより、クラスタ配列に最も類似する塩基配列を表示したり、ホモロジースコアの高い順にソートして類似配列を表示したりすることができるようになる。
【0132】
さらに、類似配列に付属する情報として、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該クラスタ配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報のうち少なくとも一つを類似配列と一緒に表示してもよい。
【0133】
さらに、任意の遺伝子配列を入力することにより、入力された遺伝子について登録されたcDNAクローン配列とクラスタリングを行い、同一のクラスタに属するクラスタ配列に関する情報(画像データなど)を表示することが可能になる。
【0134】
また、請求項22に記載のプログラムは、請求項21に記載のプログラムにおいて、上記クラスタ配列ホモロジー検索ステップは、上記核酸配列データベースに格納された、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子、のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする。
【0135】
これはクラスタ配列に対するホモロジー検索の一例を一層具体的に示すものである。このプログラムによれば、ホモロジー検索は、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うので、画像データの持つ生物学的な重要度などを容易に特定することができるようになる。
【0136】
すなわち、(1)から(5)の各カテゴリの塩基配列を格納した各塩基情報データベースを対象としてホモロジー検索を行うことができるようになるので、各カテゴリで最も類似度の高い塩基配列を個別に特定することができるようになる。
【0139】
また、請求項23に記載のプログラムは、請求項17から22のいずれか一つに記載のプログラムにおいて、上記画像データベースに登録された上記アノテーション情報の中の上記段階情報が異なる2つ以上の上記画像データについて、上記画像データ中の発光量および発光面積を比較する画像比較ステップと、上記画像比較ステップの比較結果に基づいて、2つ以上の上記画像データの相違点を抽出する相違点抽出ステップと、上記相違点に基づいて、上記画像データ中の遺伝子の発現量を推定する発現量推定ステップと、上記発現量推定ステップにより推定された上記発現量に従って、上記表示ステップにおける上記上記画像データの表示順番をソートする発現量順ソートステップとをさらに備えたことを特徴とする。
【0140】
このプログラムによれば、画像データおよび/または塩基配列に基づいて、画像データ中の遺伝子の発現量を推定するので、発現パターン(均一に発現、偏って発現など)などを容易に特定することができるようになる。
【0141】
ここで、画像データ中の蛍光色素などの発光量や発光面積を既知の画像解析手法などにより求めることにより、発現量を推定してもよい。また、画像データだけでなく塩基配列の情報も利用すれば、例えば、塩基配列にリピート配列が含まれている場合にはクロスハイブリダイズ(同じリピートを持つ当該mRNA以外のmRNAに対してもハイブリダイゼーション反応が起こる)の可能性が高いため推定された発現量に対する信用性は低い、などの評価を自動的にできるようになる。
【0142】
また、例えば、同じ組織切片に対してプローブを発光させたものと発光させないものを撮影したり、別の種類の蛍光色素などで染色したものを撮影したりすることにより、画像解析処理を簡単に実行することができるようになる(その2枚の画像の差分をとることにより発現量を推定する等)。
【0144】
このプログラムによれば、推定された発現量に従って、画像データの表示順番をソートするので、効率的に実験結果を確認できるようになる。
【0146】
このプログラムによれば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、2つ以上の画像データを比較し、比較結果に基づいて、2つ以上の画像データの相違点を抽出するので、画像間の差異を効率的に抽出することができるようになる。
【0147】
これにより、画像認識あるいは手作業によってそれぞれの組織での発現パターンについてアノテーションを行ない、そのアノテーションを自動で比較し、相違がみられるものについて抽出して表示することができるようになる。
【0148】
また、例えば、正常細胞と疾患細胞との比較や、発育段階または加齢段階の時系列での比較や、薬剤投与前と投与後の比較などを効率的に実行することができるようになる。
【0150】
このプログラムによれば、2つ以上の画像データから3次元画像を作成し、画像データの発現量から3次元画像における発現量をシミュレーションするので、一つの配列で臓器の全スライスをテストした場合、その画像をつなぐことにより臓器の3次元画像をシミュレーションし、各画像を画像解析して求めたmRNAの発現量を3次元的に補正し表示することができるようになる。
【0152】
このプログラムによれば、同一のクラスタに属する塩基配列の中から、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、代表クローンを決定するので、例えば、同じmRNAに由来するクローン群のうち最もよい実験データがとれるクローンを一つ選んで代表クローンとして抽出することができるようになる。また、同じmRNA由来と思われるESTは同じクラスタに分類し、代表クローンのみを実験することによって、その後の実験回数を減らすことができる。つまり、クラスタリングによって、それまではEST数の実験が必要だったのに対し、代表クローン(クラスタ数存在する)についてのみ実験を行うことで足りるようになる。
【0153】
ここで、同一mRNAに由来するcDNAクローンであっても切断箇所により配列が少しずつ異なる。in situハイブリダイゼーションを実施したときにそのcDNA配列によってきれいに発現シグナルがでるものとそうでないものがあるため、画像データをみてきれいにシグナルが出ているクローンを代表クローンとしてもよい。
【0154】
また、cDNAクローンの塩基配列は、リピート配列を持たないものや、実験に適した配列長のものを代表クローンとしてもよい。
【0156】
このプログラムによれば、クラスタ配列のホモロジー検索結果、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいてクラスタ重要度を決定するので、これらの情報に基づいてクラスタの重要度を任意に決定し、利用者が注目するクラスタを容易に発見することができるようになる。
【0157】
例えば、発現量と組織に関する情報に基づいて特定の発育段階または加齢段階の組織で高い発現を示すクローンについて重要度を高く決定してもよく、さらに、その塩基配列に対するホモロジー検索結果により既存の遺伝子配列DBにヒットしない(すなわち、既知の類似配列が存在しない)ものであれば、さらに重要度を高く決定してもよい。
【0158】
また、請求項24に記載のプログラムは、請求項17から23のいずれか一つに記載のプログラムにおいて、上記塩基配列の存在する染色体上の遺伝子座を特定する遺伝子座特定ステップと、上記染色体の上記遺伝子座に上記塩基配列に関する情報をマッピングすることにより染色体マップを作成する染色体マップ作成ステップと、上記染色体マップ作成ステップにて作成した上記染色体マップを表示する染色体マップ表示ステップとをさらに備えたことを特徴とする。
【0159】
このプログラムによれば、塩基配列の存在する染色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配列に関する情報(例えば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報など)をマッピングすることにより染色体マップを作成することができるようになる。
【0160】
また、当該染色体マップの遺伝子座に対応する部分(特定のマークなどを表示しても良い)を選択すると、その詳細な塩基配列に関する情報を表示するようにしてもよい。
【0161】
また、本発明は記録媒体に関するものであり、請求項25に記載の記録媒体は、上記請求項17から24のいずれか一つに記載されたプログラムを記録したことを特徴とする。
【0162】
この記録媒体によれば、当該記録媒体に記録されたプログラムをコンピュータに読み取らせて実行することによって、請求項17から24のいずれか一つに記載されたプログラムをコンピュータを利用して実現することができ、これら各方法と同様の効果を得ることができる。
【0163】
【発明の実施の形態】
以下に、本発明にかかる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
特に、以下の実施の形態においては、本発明を、高速in situハイブリダイゼーションによる実験データを収集する場合に適用した例について説明するが、この場合に限られず、他の手法により遺伝子の発現情報を解析する全ての実験手法を用いる場合において、同様に適用することができる。
【0164】
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について詳細に説明する。図3は本発明の基本原理を示す原理構成図である。
【0165】
本発明は、概略的に、以下の基本的特徴を有する。すなわち、図3に示すように、まず、本発明は、in situハイブリダイゼーション結果の画像データと対応する発現遺伝子(cDNA)の塩基配列データを格納し、当該画像データに対するアノテーション情報(採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる細胞などの部位に関する情報など)を利用者に入力させる。また、本発明は、これらのアノテーション情報について既知の画像解析技術を用いて画像データから自動的に認識する。
【0166】
そして、本発明は、入力されたcDNAの塩基配列に対して、塩基配列データベース(ESTデータベースや完全長cDNAデータベースなど)に格納された既知の塩基配列を対象としてホモロジー検索を行い、その類似塩基配列を抽出し、画像データと対応する塩基配列、その類似塩基配列、ホモロジースコア等を表示する。
【0167】
また、本発明は、既に同じあるいは別の生物で既知となっている遺伝子、未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、染色体上での位置がわかっている遺伝子、既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象として、cDNAクローン塩基の配列データとホモロジー検索を行う。
【0168】
また、本発明は、例えば同じmRNAに由来するcDNA(EST配列)を同じクラスタに分類すること等により、同一の性質を持つ塩基配列を集めて特定のクラスタに分類する。また、同一のクラスタに分類された塩基配列からクラスタ配列を決定し、クラスタ毎にクラスタ配列と画像データと対応する塩基配列とを表示する。また、塩基配列を用いて共通配列のアセンブルを行い、同一の共通配列を構成した塩基配列を同一のクラスタに分類し、クラスタの共通配列をクラスタ配列として決定してもよい。
【0169】
また、本発明は、決定されたクラスタ配列に対してホモロジー検索を行い類似塩基配列を抽出し、クラスタ毎にクラスタ配列とその類似配列と画像データと対応する塩基配列とを表示する。
【0170】
また、本発明は、画像データおよび/または塩基配列に基づいて、画像データ中の遺伝子の発現量を推定する。また、推定された発現量に従って、画像データの表示順番をソートしてもよい。
【0171】
また、本発明は、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、2つ以上の画像データを比較し、比較結果に基づいて、2つ以上の画像データの相違点を抽出する。
【0172】
また、本発明は、2つ以上の画像データから3次元画像を作成し、画像データの発現量から3次元画像における発現量をシミュレーションする。
【0173】
また、本発明は、同一のクラスタに属する塩基配列の中から、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、代表クローンを決定する。
【0174】
また、本発明は、クラスタ配列のホモロジー検索結果、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいてクラスタ重要度を決定する。
【0175】
さらに、本発明は、塩基配列の存在する染色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配列に関する情報(例えば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報など)をマッピングすることにより染色体マップを作成する。
【0176】
[システム構成]
まず、本システムの構成について説明する。図4は、本発明が適用される本システムの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。本システムは、概略的に、遺伝子発現情報管理装置100と、配列情報等に関する外部データベースやホモロジー検索等の外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されている。
【0177】
図4においてネットワーク300は、遺伝子発現情報管理装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
【0178】
図4において外部システム200は、ネットワーク300を介して、遺伝子発現情報管理装置100と相互に接続され、利用者に対してcDNAなどの配列情報等に関する外部データベースや、ホモロジー検索等の外部プログラムを実行するウェブサイトを提供する機能を有する。
【0179】
ここで、外部システム200は、WEBサーバやASPサーバ等として構成してもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
【0180】
図4において遺伝子発現情報管理装置100は、概略的に、遺伝子発現情報管理装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。さらに、この遺伝子発現情報管理装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
【0181】
記憶部106に格納される各種のデータベースやテーブル(cDNAクローンデータベース106a〜核酸配列データベース106h)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0182】
これら記憶部106の各構成要素のうち、cDNAクローンデータベース106aは、各cDNAクローンを一意に識別するcDNAクローン識別情報と、その塩基配列(EST配列)とを対応付けて格納する。
【0183】
また、クラスタデータベース106bは、各クラスタを一意に識別するクラスタ識別情報と、クラスタを構成するcDNAクローンのcDNAクローン識別情報と、クラスタ配列を一意に識別するクラスタ配列識別情報と、代表クローンのcDNAクローン識別情報とを対応付けて格納する。
【0184】
また、ホモロジー検索結果データベース106cは、cDNAクローン識別情報と、cDNAクローンの塩基配列に対して各種の塩基配列データベースに格納された塩基配列を対象としてホモロジー検索を行った検索結果とを対応付けて格納する。
【0185】
また、クラスタ配列データベース106dは、クラスタ配列識別情報と、クラスタ配列の塩基配列とを対応付けて格納する。
【0186】
また、クラスタ配列ホモロジー検索結果データベース106eは、クラスタ配列識別情報と、クラスタ配列の塩基配列に対して各種の塩基配列データベースに格納された塩基配列を対象としてホモロジー検索を行った検索結果とを対応付けて格納する。
【0187】
また、ベクタ配列データベース106fは、cDNAクローン識別情報と、cDNAクローンを組み込んだベクタの塩基配列とを対応付けて格納する。
【0188】
また、画像データベース106gは、画像データを一意に識別するための画像識別情報と、cDNAクローン識別情報と、アノテーション情報(例えば、遺伝子の発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報など)とを対応付けて格納する。
【0189】
また、核酸配列データベース106hは、EST配列や完全長cDNA配列などの塩基配列を格納したデータベースである。核酸配列データベース106hは、インターネットを経由してアクセスする外部の塩基配列データベースであってもよく、また、これらのデータベースをコピーしたり、オリジナルの配列情報を格納したり、さらに独自のアノテーション情報等を付加したりして作成したインハウスデータベースであってもよい。ここで、核酸配列データベース106hは、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子に関する塩基配列を格納してもよい。
【0190】
また、図4において、通信制御インターフェース部104は、遺伝子発現情報管理装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
【0191】
また、図4において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置114をモニタとして記載する場合がある)。また、入力装置112としては、キーボード、マウス、および、マイク等を用いることができる。また、モニタも、マウスと協働してポインティングデバイス機能を実現する。
【0192】
また、図4において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、画像アノテーション情報入力部102a、cDNAクローン配列ホモロジー検索部102b、cDNAクローンクラスタリング部102c、クラスタ配列決定部102d、クラスタ配列ホモロジー検索部102e、3次元シミュレーション部102f、発現量推定部102g、画像比較部102h、代表クローン決定部102i、クラスタ重要度決定部102j、外部データベースアクセス部102k、染色体マップ作成部102m、および、表示画面作成部102nを備えて構成されている。
【0193】
このうち、画像アノテーション情報入力部102aは、遺伝子の発現に関する画像データを入力する画像データ入力手段、および、発現した遺伝子の塩基配列を入力する塩基配列入力手段である。また、cDNAクローン配列ホモロジー検索部102bは、塩基配列入力手段により入力された塩基配列に対してホモロジー検索を行い類似塩基配列を抽出するホモロジー検索手段である。また、cDNAクローンクラスタリング部102cは、塩基配列入力手段により入力された塩基配列に対してクラスタリングを行い、塩基配列を特定のクラスタに分類するクラスタリング手段である。
【0194】
また、クラスタ配列決定部102dは、クラスタリング手段により同一のクラスタに分類された塩基配列からクラスタ配列を決定するクラスタ配列決定手段である。また、クラスタ配列ホモロジー検索部102eは、クラスタ配列決定手段により決定されたクラスタ配列に対してホモロジー検索を行い類似塩基配列を抽出するクラスタ配列ホモロジー検索手段である。また、3次元シミュレーション部102fは、2つ以上の画像データから3次元画像を作成する3次元画像作成手段、および、画像データの発現量から3次元画像における発現量をシミュレーションする発現量シミュレーション手段である。
【0195】
また、発現量推定部102gは、画像データおよび/または塩基配列に基づいて、画像データ中の遺伝子の発現量を推定する発現量推定手段、および、発現量推定手段により推定された発現量に従って、画像データの表示順番をソートする発現量順ソート手段である。また、画像比較部102hは、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、2つ以上の画像データを比較する画像比較手段、および、画像比較手段の比較結果に基づいて、2つ以上の画像データの相違点を抽出する相違点抽出手段である。
【0196】
また、代表クローン決定部102iは、同一の上記クラスタに属する上記塩基配列の中から、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、代表クローンを決定する代表クローン決定手段である。
【0197】
また、クラスタ重要度決定部102jは、クラスタに対して、クラスタ配列のホモロジー検索結果、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、クラスタ重要度を決定するクラスタ重要度決定手段である。また、外部データベースアクセス部102kは、ネットワーク300を介して外部システム200の外部データベースにアクセスする外部データベースアクセス手段である。
【0198】
また、染色体マップ作成部102mは、塩基配列の存在する染色体上の遺伝子座を特定する遺伝子座特定手段、染色体の遺伝子座に塩基配列に関する情報をマッピングすることにより染色体マップを作成する染色体マップ作成手段、および、染色体マップ作成手段にて作成した染色体マップを表示する染色体マップ表示手段である。また、表示画面作成部102nは、画像データと対応する塩基配列とその類似塩基配列とを表示する表示手段、および、クラスタ毎に画像データと対応する塩基配列とを表示する表示手段である。なお、これら各部によって行なわれる処理の詳細については、後述する。
【0199】
[システムの処理]
次に、このように構成された本実施の形態における本システムの処理の一例について、以下に図5〜図13を参照して詳細に説明する。
【0200】
[画像アノテーション情報入力処理]
まず、画像アノテーション情報入力処理の詳細について図5を参照して説明する。図5は、本実施形態における本システムの画像アノテーション情報入力処理の一例を示すフローチャートである。
【0201】
まず、遺伝子発現情報管理装置100は、画像アノテーション情報入力部102aの処理により、アノテーション情報入力画面を出力装置114に表示する(ステップSB−1)。
【0202】
ここで、図13は、モニタに表示されるアノテーション情報入力画面の表示画面の一例を示す図である。この図に示すようにアノテーション情報入力画面は、例えば、画像識別情報の入力領域(図中の(1))、cDNAクローン識別情報の入力領域(図中の(2))、cDNAクローンの塩基配列決定が完了しているか否かを示す情報の入力領域(図中の(3))、切片を採取した組織名の入力領域(図中の(4))、切片を採取した生物の発育段階または加齢段階の入力領域(図中の(5))、どの細胞や組織などの部分領域に発現が見られるかを示す情報の入力領域(図中の(6)〜(11))、切片上に遺伝子の発現が見られるか否かを示す情報の入力領域(図中の(12)〜(15))、および、画像データの表示領域(図中の(16))を含んで構成されている。
【0203】
ついで、ユーザがアノテーション情報入力画面を確認して各種の情報を入力装置112を介して入力すると(ステップSB−2)、遺伝子発現情報管理装置100は、画像アノテーション情報入力部102aの処理により、記憶部106の所定の記憶領域に入力情報を格納する(ステップSB−3)。これにて、画像アノテーション情報入力処理が終了する。
【0204】
[cDNAクローン配列ホモロジー検索処理]
次に、cDNAクローン配列ホモロジー検索処理の詳細について図6を参照して説明する。図6は、本実施形態における本システムのcDNAクローン配列ホモロジー検索処理の一例を示すフローチャートである。
【0205】
まず、遺伝子発現情報管理装置100は、cDNAクローン配列ホモロジー検索部102bの処理により、cDNAクローンデータベース106aにアクセスしてcDNAクローン配列を取得する(ステップSC−1)。
【0206】
ついで、cDNAクローン配列ホモロジー検索部102bは、核酸配列データベース106hにアクセスして、取得したcDNAクローン配列に対するホモロジー検索を実行する(ステップSC−2)。cDNAクローン配列ホモロジー検索部102bがアクセスする核酸配列データベース106hには、例えば、mammal(哺乳動物)について既知の遺伝子配列を集めたデータベース、全生物について既知の遺伝子配列を集めたデータベース、EST配列(cDNAクローンの断片配列)を集めたデータベース、ゲノム配列決定プロジェクトによって決定されつつあるゲノムDNA配列のドラフトを集めたデータベース、GSS配列(ゲノムDNAクローンの断片配列)を集めたデータベース、STS配列(ゲノム上でマッピングされた配列)を集めたデータベース、既に特許が取得されている遺伝子配列を集めたデータベースを含む。
【0207】
ついで、cDNAクローン配列ホモロジー検索部102bは、ホモロジー検索結果(例えば、類似配列、ホモロジースコア、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該cDNAの塩基配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報などを含む)をホモロジー検索結果データベース106cに格納する(ステップSC−3)。これにて、cDNAクローン配列ホモロジー検索処理が終了する。
【0208】
[アセンブル処理]
次に、アセンブル処理の詳細について図7を参照して説明する。図7は、本実施形態における本システムのアセンブル処理の一例を示すフローチャートである。
【0209】
まず、遺伝子発現情報管理装置100は、cDNAクローンクラスタリング部102cの処理により、cDNAクローンデータベース106aにアクセスして全てのcDNAクローンの塩基配列を取得し、既知のアセンブラ・ソフトウェアを用いて共通配列のアセンブルを行う(ステップSD−1)。
【0210】
そして、クラスタ配列決定部102dは、複数のcDNAクローン配列からつながれた共通配列をクラスタ配列として決定し、クラスタ配列データベース106dの所定の記録領域に格納する(ステップSD−2)。
【0211】
そして、cDNAクローンクラスタリング部102cは、同一のクラスタ配列を構成するcDNAクローンを同一クラスタに分類し、cDNAクローンデータベース106aにどのcDNAクローンがどのクラスタに含まれるか対応付けて記憶する(ステップSD−3)。これにて、アセンブル処理が終了する。
【0212】
[クラスタ配列ホモロジー検索処理]
次に、クラスタ配列ホモロジー検索処理の詳細について図8を参照して説明する。図8は、本実施形態における本システムのクラスタ配列ホモロジー検索処理の一例を示すフローチャートである。
【0213】
まず、遺伝子発現情報管理装置100は、クラスタ配列ホモロジー検索部102eの処理により、クラスタ配列データベース106dにアクセスしてクラスタ配列を取得する(ステップSE−1)。
【0214】
ついで、クラスタ配列ホモロジー検索部102eは、核酸配列データベース106hにアクセスして、取得したクラスタ配列に対するホモロジー検索を実行する(ステップSE−2)。クラスタ配列ホモロジー検索部102eがアクセスする核酸配列データベース106hには、例えば、mammal(哺乳動物)について既知の遺伝子配列を集めたデータベース、全生物について既知の遺伝子配列を集めたデータベース、EST配列(cDNAクローンの断片配列)を集めたデータベース、ゲノム配列決定プロジェクトによって決定されつつあるゲノムDNA配列のドラフトを集めたデータベース、GSS配列(ゲノムDNAクローンの断片配列)を集めたデータベース、STS配列(ゲノム上でマッピングされた配列)を集めたデータベース、既に特許が取得されている遺伝子配列を集めたデータベースを含む。
【0215】
ついで、クラスタ配列ホモロジー検索部102eは、ホモロジー検索結果(例えば、類似配列、ホモロジースコア、遺伝子名、当該遺伝子の産物タンパク質名、当該遺伝子が取得されている生物種、当該遺伝子が取得された臓器名や組織名、当該遺伝子のGenBankデータベースでのID、当該遺伝子の産物タンパク質のGenBankデータベースでのID、当該クラスタ配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、または、当該遺伝子の存在の証拠に関する情報などを含む)をクラスタ配列ホモロジー検索結果データベース106eに格納する(ステップSE−3)。これにて、クラスタ配列ホモロジー検索処理が終了する。
【0216】
[3次元シミュレーション処理]
次に、3次元シミュレーション処理の詳細について図9を参照して説明する。図9は、本実施形態における本システムの3次元シミュレーション処理の一例を示すフローチャートである。
【0217】
一つの配列で臓器の全スライスをテストした場合、遺伝子発現情報管理装置100は、3次元シミュレーション部102fの所により、2つ以上の画像データのセットを画像データベース106gから取得する(ステップSF−1)。
【0218】
そして、3次元シミュレーション部102fは、画像データセットから既存の3D表示ソフトウェアなどを用いて3次元画像を作成する(ステップSF−2)。
【0219】
そして、3次元シミュレーション部102fは、画像データの発現量から3次元画像における発現量をシミュレーションし、各画像を画像解析して求めた発現量を3次元的に補正し表示する(ステップSF−3)。これにて、3次元シミュレーション処理が終了する。
【0220】
[発現量推定処理]
次に、発現量推定処理の詳細について図10を参照して説明する。図10は、本実施形態における本システムの発現量推定処理の一例を示すフローチャートである。
【0221】
まず、遺伝子発現情報管理装置100は、発現量推定部102gの処理により、画像データベース106gおよびcDNAクローンデータベース106aにアクセスして、画像データおよび塩基配列を取得する(ステップSG−1)。
【0222】
ついで、発現量推定部102gは、画像データおよび/または塩基配列に基づいて、画像データ中の遺伝子の発現量を推定する。すなわち、発現量推定部102gは、画像データ中の蛍光色素などの発光量や発光面積を既知の画像解析手法などにより求めることにより(ステップSG−2)、発現量を推定する(ステップSG−3)。
【0223】
また、画像データだけでなく塩基配列の情報も利用すれば、例えば、塩基配列にリピート配列が含まれている場合にはクロスハイブリダイズ(同じリピートを持つ当該mRNA以外のmRNAに対してもハイブリダイゼーション反応が起こる)の可能性が高いため推定された発現量に対する信用性は低い、などの評価を自動的にできるようになる。これにて、発現量推定処理が終了する。
【0224】
[画像比較処理]
次に、画像比較処理の詳細について図11を参照して説明する。図11は、本実施形態における本システムの画像比較処理の一例を示すフローチャートである。
【0225】
まず、遺伝子発現情報管理装置100は、例えば、正常細胞と疾患細胞との比較や、発育段階または加齢段階の時系列での比較や、薬剤投与前と投与後の比較などを行う場合に、画像比較部102hの処理により、画像データベース106g等にアクセスして、比較される画像の組について、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報などを取得する(ステップSH−1)。
【0226】
そして、画像比較部102hは、これらの情報に基づいて、2つ以上の画像データを比較し、比較結果に基づいて、2つ以上の画像データの相違点を抽出する(ステップSH−2)。これにて、画像比較処理が終了する。
【0227】
[染色体マップ作成処理]
次に、染色体マップ作成処理の詳細について図12を参照して説明する。図12は、本実施形態における本システムの染色体マップ作成処理の一例を示すフローチャートである。
【0228】
まず、遺伝子発現情報管理装置100は、染色体マップ作成部102mの処理により、cDNAクローンデータベース106aあるいはクラスタ配列データベース106d、および、核酸配列データベース106hにアクセスすることにより、核酸配列データベース106hに登録された遺伝子座の特定されている塩基配列情報をもとに、当該cDNAクローンあるいは当該クラスタの遺伝子座を特定する(ステップSJ−1)。
【0229】
ついで、染色体マップ作成部102mは、染色体の遺伝子座に塩基配列に関する情報(例えば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報など)を染色体マップ上に配置(例えば、リンク情報を設定するなど)してマッピングする(ステップSJ−2)。
【0230】
ついで、染色体マップ作成部102mは、塩基配列に関する情報を追加して、当該染色体マップの遺伝子座に対応する部分(特定のマークなどを表示しても良い)を選択すると、その詳細な塩基配列に関する情報を表示するようにする(ステップSJ−3)。これにて、染色体マップ作成処理が終了する。
【0231】
[実施例]
次に、このように構成された本発明の実施例について、以下に図14〜図19を参照して詳細に説明する。
【0232】
1.cDNAクローンごとのデータ閲覧
cDNAクローンごとのデータを閲覧する場合に表示される一覧レポート画面を図14に示す。図14に示すように、一覧レポート画面では、1行に1つのcDNAクローンについての情報が表示される。各列に表示される情報はそれぞれ以下の情報(1)〜(13)を表わす(図14中の(1)〜(13)を示す)。
【0233】
(1) cDNAクローンIDを表示する。
【0234】
(2) 当該cDNAクローンのGonadに対するin situ ハイブリダイゼーション画像が何枚存在するかを表示する。
【0235】
(3) 当該cDNAクローンの生後1週のマウス精巣に対するin situ
ハイブリダイゼーション画像が何枚存在するかを表示する。
【0236】
(4) 当該cDNAクローンの生後2週のマウス精巣に対するin situ
ハイブリダイゼーション画像が何枚存在するかを表示する。
【0237】
(5) 当該cDNAクローンの生後3週のマウス精巣に対するin situ
ハイブリダイゼーション画像が何枚存在するかを表示する。
【0238】
(6) 当該cDNAクローンのAdultのマウス精巣に対するin situ ハイブリダイゼーション画像が何枚存在するかを表示する。
【0239】
(7) 当該cDNAクローンのin situ ハイブリダイゼーション画像が全部で何枚存在するかを表示する。
【0240】
(8) 当該cDNAクローンが所属クラスタの代表cDNAクローンである場合はYES、そうでない場合はNOを表示する。
【0241】
(9) 当該cDNAクローンが属するクラスタのIDを表示する。
【0242】
(10) 当該cDNAクローンのEST配列をnr(無冗長核酸配列データベース)に対してblast検索した結果のtop hit scoreを表示する。
【0243】
(11) 当該cDNAクローンのEST配列をdbest(EST配列データベース)に対してblast検索した結果のtop hit scoreを表示する。
【0244】
(12) 当該cDNAクローンのEST配列の長さ(塩基数)を表示する。
【0245】
(13) 当該cDNAクローンのEST配列にベクタの配列が含まれている場合は「YES」、そうでない場合は「NO」を表示する。
【0246】
次に詳細レポート画面について説明する。
cDNAクローンごとのデータを閲覧する場合に表示される詳細レポート画面を図15に示す。図15に示すように、詳細レポート画面では、1つのcDNAクローンについての情報が1画面に表示される。図15中の各項目(1)〜(26)で表示される情報を以下に示す。
【0247】
(1) cDNAクローンIDを表示する。
【0248】
(2) 当該cDNAクローンが属するクラスタのIDを表示する。
【0249】
(3) 当該cDNAクローンが所属クラスタの代表cDNAクローンである場合は「YES」、そうでない場合は「NO」を表示する。
【0250】
(4) 当該cDNAクローンのEST配列にベクタの配列が含まれている場合は「YES」、そうでない場合は「NO」を表示する。
【0251】
(5)、(8)、(11)、(14)、(17) 当該cDNAクローンがinsitu ハイブリダイゼーション実験によって、それぞれGonad、生後1週マウス精巣、生後2週マウス精巣、生後3週マウス精巣、Adultマウス精巣においてどの細胞に発現がみられたかを表示する。ここでG、 C、 R、E、 L、 Sはそれぞれ、「Gonia細胞」、 「Spermatocyte細胞」、「Round spermatid細胞」、「Elongatedspermatid細胞」、「Leydig細胞」、「Sertoli細胞」を表わす。
【0252】
(6)、(9)、(12)、(15)、(18) 当該cDNAクローンのGonad、生後1週マウス精巣、生後2週マウス精巣、生後3週マウス精巣、Adultマウス精巣に対するin situ ハイブリダイゼーション画像がそれぞれ何枚存在するかを表示する。
【0253】
(7)、(10)、(13)、(16)、(19) 当該cDNAクローンのGonad、生後1週マウス精巣、生後2週マウス精巣、生後3週マウス精巣、Adultマウス精巣に対するin situ ハイブリダイゼーション画像をそれぞれ表示する。画像は画像IDと共に表示される。
【0254】
(20) 当該cDNAクローンのEST配列をnrに対してblast検索した結果を表示する。
【0255】
(21) 当該cDNAクローンのEST配列をnrに対してblast検索した結果のtop hit scoreを表示する。
【0256】
(22) 当該cDNAクローンのEST配列をblast検索した対象nrデータのバージョン情報を表示する。
【0257】
(23) 当該cDNAクローンのEST配列をdbestに対してblast検索した結果を表示する。
【0258】
(24) 当該cDNAクローンのEST配列をdbestに対してblast検索した結果のtop hit scoreを表示する。
【0259】
(25) 当該cDNAクローンのEST配列をblast検索した対象dbestデータのバージョン情報を表示する。
【0260】
(26) 当該cDNAクローンのEST配列を表示する。
【0261】
また、cDNAクローンごとのデータを閲覧する場合に表示される詳細レポート画面の別の一例を図16に示す。図16中の各項目(1)〜(17)で表示される情報を以下に示す。
【0262】
(1)〜(5) 各発育段階または加齢段階での画像の右上にそれぞれ、“Y”、“N”、“?”、“Nd”というチェックボックスによって表示されている部分である、発現情報フィールドを表示する。これは画像から遺伝子の発現がみられるかどうかを入力するためのフィールドであり、「Y」は発現がみられること、「N」は発現がみられないこと、「?」はどちらとも判定できないこと、「Nd(No data)」は画像データが存在しないことを示す。
【0263】
(6) 当該cDNAクローンの重要度を表示する。
【0264】
(7) 既存のデータベースに掲載されたものであるか否かを表示する。
【0265】
(8) 当該cDNAクローンのEST配列をホモロジー検索した結果のトップスコアをデータベース分類別に表示する。これにより当該クローンが未知のものであるか既知のものであるかどうかが概観できる。ここで、「mammal」は哺乳動物について既知の遺伝子配列を集めたデータベース、「NT」は全生物について既知の遺伝子配列を集めたデータベース、「EST」はEST 配列(cDNA クローンの断片配列)を集めたデータベース、「HTG」はゲノム配列決定プロジェクトによって決定されつつあるゲノムDNA 配列のドラフトを集めたデータベース、「GSS」はGSS 配列(ゲノムDNA クローンの断片配列)を集めたデータベース、「STS」はSTS 配列(ゲノム上でマッピングされた配列)を集めたデータベース、「PAT」は既に特許が取得されている遺伝子配列を集めたデータベースを示す。この結果を見ることによって、当該cDNAクローンが、既に同じあるいは別の生物で既知となっている遺伝子(mammal、NT )、未知の遺伝子であるが同じcDNA が既に取得されている遺伝子(EST)、未知の遺伝子であるが対応するゲノムDNA 断片が既に取得されている遺伝子(HTG、GSS)、染色体上での位置がわかっている遺伝子(STS)、既に特許が取得されている遺伝子(PAT)であるかを確認することができる。
【0266】
(9)〜(17) 当該cDNAクローンが既知の遺伝子である場合、各フィールドにその既知遺伝子に関する情報が表示される。ここで、「Gene」は遺伝子名、「Product」は当該遺伝子の産物タンパク質名、「Organism」は当該遺伝子が取得されている生物種、「Tissue」は当該遺伝子が取得された臓器または組織、「Locus ID」は当該遺伝子のGenBankデータベースでのID、「Protein ID」は当該遺伝子の産物タンパク質のGenBank データベースでのID、「Hit length、Hit Identity」は、当該cDNAの塩基配列が当該遺伝子配列にどのくらいの長さでどのくらい一致したか、「Evidence」は当該遺伝子の存在の証拠に関する情報(mRNA、DNA など;mRNA:mRNA の存在が確認されている、DNA:DNA 配列から予測されたもの)を表示する。
【0267】
2.クラスタごとのデータ閲覧
クラスタごとのデータを閲覧する場合に表示される一覧レポート画面を図17に示す。図17に示すように、一覧レポート画面では、1行に1つのクラスタについての情報が表示される。図17の各列はそれぞれ以下の情報(1)〜(13)を表わす。
【0268】
(1) クラスタIDを表示する。
【0269】
(2) 当該クラスタに属するすべてのcDNAクローンのGonadに対するin situハイブリダイゼーション画像が合計何枚存在するかを表示する。
【0270】
(3) 当該クラスタに属するすべてのcDNAクローンの生後1週のマウス精巣に対するin situ ハイブリダイゼーション画像が合計何枚存在するかを表示する。
【0271】
(4) 当該クラスタに属するすべてのcDNAクローンの生後2週のマウス精巣に対するin situ ハイブリダイゼーション画像が合計何枚存在するかを表示する。
【0272】
(5) 当該クラスタに属するすべてのcDNAクローンの生後3週のマウス精巣に対するin situ ハイブリダイゼーション画像が合計何枚存在するかを表示する。
【0273】
(6) 当該クラスタに属するすべてのcDNAクローンのAdultのマウス精巣に対するin situ ハイブリダイゼーション画像が合計何枚存在するかを表示する。
【0274】
(7) 当該クラスタに属するすべてのcDNAクローンのin situ ハイブリダイゼーション画像が全部で何枚存在するかを表示する。
【0275】
(8) 当該クラスタに属するcDNAクローンの数を表示する。
【0276】
(9) 当該クラスタの代表cDNAクローンのIDを表示する。
【0277】
(10) 当該クラスタの配列をnrに対してblast検索した結果のtop
hit scoreを表示する。
【0278】
(11) 当該クラスタの配列をdbestに対してblast検索した結果のtop hit scoreを表示する。
【0279】
(12) 当該クラスタの重要度を表示する。重要度の高いものからAAA、 AA、A、B、… のようにランク付けされている。
【0280】
(13) 当該クラスタに属するいずれかのcDNAクローンのEST配列にベクタの配列が含まれている場合はYES、そうでない場合はNOを表示する。
【0281】
クラスタごとのデータを閲覧する場合に表示される詳細レポート画面を図18に示す。図18に示すように、詳細レポート画面では、1つのクラスタについての情報が1画面に表示される。図中の各項目(1)〜(29)に表示される情報は以下の通りである。
【0282】
(1) クラスタIDを表示する。
【0283】
(2) 当該クラスタの代表cDNAクローンのIDを表示する。
【0284】
(3) 当該クラスタの重要度を表示する。重要度の高いものからAAA、AA、A、B、… のようにランク付けされている。
【0285】
(4) 当該クラスタの配列および、所属cDNAクローンのEST配列について公開してもよいと思われるものにはYES、そうでないものにはNOを表示する。
【0286】
(5) 当該クラスタに属するいずれかのcDNAクローンのEST配列にベクタの配列が含まれている場合はYES、そうでない場合はNOを表示する。
【0287】
(6)、(9)、(12)、(15)、(18) 当該クラスタに属するcDNAクローンがin situハイブリダイゼーション実験によって、それぞれGonad、生後1週マウス精巣、生後2週マウス精巣、生後3週マウス精巣、Adultマウス精巣においてどの細胞に発現がみられたかを表示する。ここでG、 C、R、E、L、Sはそれぞれ、Gonia、Spermatocyte、Round spermatid、Elongated spermatid、Leydig cell、Sertoli cellを表わす。
【0288】
(7)、(10)、(13)、(16)、(19) 当該クラスタに属するcDNAクローンのGonad、生後1週マウス精巣、生後2週マウス精巣、生後3週マウス精巣、Adultマウス精巣に対するin situ ハイブリダイゼーション画像がそれぞれ合計何枚存在するかを表示する。
【0289】
(8)、(11)、(14)、(17)、(20) 当該クラスタに属するcDNAクローンのGonad、生後1週マウス精巣、生後2週マウス精巣、生後3週マウス精巣、Adultマウス精巣に対するin situ ハイブリダイゼーション画像をそれぞれ表示する。画像は画像IDと共に表示される。
【0290】
(21) 当該クラスタに属するcDNAクローンの数を表示する。
【0291】
(22) 当該クラスタに属するすべてのcDNAクローンのIDを表示する。各cDNAクローンはcDNAクローンIDとEST配列長(塩基数)が表示される。
【0292】
(23) 当該クラスタの配列をnrに対してblast検索した結果を表示する。
【0293】
(24) 当該クラスタの配列をnrに対してblast検索した結果のtop
hit scoreを表示する。
【0294】
(25) 当該クラスタの配列をblast検索した対象nrデータのバージョン情報を表示する。
【0295】
(26) 当該クラスタの配列をdbestに対してblast検索した結果を表示する。
【0296】
(27) 当該クラスタの配列をdbestに対してblast検索した結果のtop hit scoreを表示する。
【0297】
(28) 当該クラスタの配列をblast検索した対象dbestデータのバージョン情報を表示する。
【0298】
(29) 当該クラスタの配列を表示する。
【0299】
3.染色体マップの閲覧
染色体マップを閲覧する場合に表示される染色体マップ表示画面を図19に示す。図19に示すように、遺伝子座が特定されたcDNAクローン(またはクラスタ)が染色体マップ上に配置される。そして、そのcDNAクローンの発現量を時系列に一覧表示する。
【0300】
また、各cDNAクローン(またはクラスタ名)をクリックなどすることにより選択すると、対応するcDNAクローンまたはクラスタの詳細レポート画面が表示される。
【0301】
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
【0302】
例えば、遺伝子発現情報管理装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、遺伝子発現情報管理装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
【0303】
また、実施形態において説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0304】
また、遺伝子発現情報管理装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、遺伝子発現情報管理装置100の各部または各装置が備える処理機能、特に制御部102にて行なわれる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。なお、プログラムは、後述する記録媒体に記録されており、必要に応じて遺伝子発現情報管理装置100に機械的に読み取られる。
【0305】
すなわち、ROMまたはHDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAM等にロードされることによって実行され、CPUと協働して制御部102を構成する。また、このコンピュータプログラムは、遺伝子発現情報管理装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記録されてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0306】
また、本発明にかかるプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」や、各種コンピュータシステムに内蔵されるROM、RAM、HD等の任意の「固定用の物理媒体」、を含むものとする。
【0307】
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0308】
記憶部106に格納される各種のデータベース等(cDNAクローンデータベース106a〜核酸配列データベース106h)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0309】
また、遺伝子発現情報管理装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理端末等の情報処理装置にプリンタやモニタやイメージスキャナ等の周辺装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
【0310】
さらに、遺伝子発現情報管理装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。例えば、各データベースを独立したデータベース装置として独立に構成してもよく、また、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
【0311】
また、ネットワーク300は、遺伝子発現情報管理装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネットや、イントラネットや、LAN(有線/無線の双方を含む)や、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、IMT2000方式、GSM方式またはPDC/PDC―P方式等の携帯回線交換網/携帯パケット交換網や、無線呼出網や、Bluetooth等の局所無線網や、PHS網や、CS、BSまたはISDB等の衛星通信網等のうちいずれかを含んでもよい。すなわち、本システムは、有線・無線を問わず任意のネットワークを介して、各種データを送受信することができる。
【0312】
【発明の効果】
以上詳細に説明したように、本発明によれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してホモロジー検索を行い類似塩基配列を抽出し、画像データと対応する塩基配列とその類似塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0313】
また、本発明によれば、ホモロジー検索は、(1)既に同じあるいは別の生物で既知となっている遺伝子、(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、(4)染色体上での位置がわかっている遺伝子、(5)既に特許が取得されている遺伝子のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うので、画像データの持つ生物学的な重要度などを容易に特定することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0314】
また、本発明によれば、遺伝子の発現に関する画像データを入力し、発現した遺伝子の塩基配列(例えば、cDNAクローンの塩基配列など)を入力し、入力された塩基配列に対してクラスタリングを行い、塩基配列を特定のクラスタに分類し、クラスタ毎に画像データと対応する塩基配列とを表示するので、例えば同じmRNAに由来するcDNA(EST配列)を同じクラスタに分類すること等により、同一の性質を持つ塩基配列を集めて特定のクラスタに分類することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0315】
また、本発明によれば、同一のクラスタに分類された塩基配列からクラスタ配列を決定し、クラスタ毎にクラスタ配列と画像データと対応する塩基配列とを表示するので、例えば、クラスタのメンバーの塩基配列を組み合わせて作成した塩基配列(例えば、完全長cDNAなど)をクラスタ配列として決定し、表示することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0316】
また、本発明によれば、塩基配列を用いて共通配列のアセンブルを行い、同一の共通配列を構成した塩基配列を同一のクラスタに分類し、クラスタの共通配列をクラスタ配列として決定するので、アセンブル技術(短い断片配列から長い配列を作成する技術をいう。例えば、断片配列間の配列の重なりをマルチプルアラインメントなどの手法を用いて探索し、重なりを持つ断片配列同士を合成することにより長い配列を生成する。)により部分的なcDNA配列からより完全長に近いcDNA配列を作成することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0317】
また、本発明によれば、決定されたクラスタ配列に対してホモロジー検索を行い類似塩基配列を抽出し、クラスタ毎にクラスタ配列とその類似配列と画像データと対応する塩基配列とを表示するので、画像データにおいて発現した遺伝子を容易に特定することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0318】
また、本発明によれば、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて格納し、画像データに対して、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つを対応付けて表示することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0319】
また、本発明によれば、画像データおよび/または塩基配列に基づいて、画像データ中の遺伝子の発現量を推定するので、発現パターン(均一に発現、偏って発現など)などを容易に特定することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0320】
また、本発明によれば、推定された発現量に従って、画像データの表示順番をソートするので、効率的に実験結果を確認できる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0321】
また、本発明によれば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、2つ以上の画像データを比較し、比較結果に基づいて、2つ以上の画像データの相違点を抽出するので、画像間の差異を効率的に抽出することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0322】
また、本発明によれば、2つ以上の画像データから3次元画像を作成し、画像データの発現量から3次元画像における発現量をシミュレーションするので、一つの配列で臓器の全スライスをテストした場合、その画像をつなぐことにより臓器の3次元画像をシミュレーションし、各画像を画像解析して求めたmRNAの発現量を3次元的に補正し表示することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0323】
また、本発明によれば、同一のクラスタに属する塩基配列の中から、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいて、代表クローンを決定するので、例えば、同じmRNAに由来するクローン群のうち最もよい実験データがとれるクローンを一つ選んで代表クローンとして抽出することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0324】
また、本発明によれば、クラスタ配列のホモロジー検索結果、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報のうち少なくとも一つに基づいてクラスタ重要度を決定するので、これらの情報に基づいてクラスタの重要度を任意に決定し、利用者が注目するクラスタを容易に発見することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【0325】
さらに、本発明によれば、塩基配列の存在する染色体上の遺伝子座を特定し、染色体の遺伝子座に塩基配列に関する情報(例えば、画像データ、塩基配列、発現量、採取した組織に関する情報、採取した組織の発育段階または加齢段階に関する情報、遺伝子の発現が見られるか否かに関する情報、および、発現が見られる部位に関する情報など)をマッピングすることにより染色体マップを作成することができる遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体を提供することができる。
【配列表】
【図面の簡単な説明】
【図1】高速in situハイブリダイゼーション法の概要を示す図である。
【図2】取り込まれた画像の一例を示す図である。
【図3】本発明の基本原理を示す原理構成図である。
【図4】本発明が適用される本システムの構成の一例を示すブロック図である。
【図5】本実施形態における本システムの画像アノテーション情報入力処理の一例を示すフローチャートである。
【図6】本実施形態における本システムのcDNAクローン配列ホモロジー検索処理の一例を示すフローチャートである。
【図7】本実施形態における本システムのアセンブル処理の一例を示すフローチャートである。
【図8】本実施形態における本システムのクラスタ配列ホモロジー検索処理の一例を示すフローチャートである。
【図9】本実施形態における本システムの3次元シミュレーション処理の一例を示すフローチャートである。
【図10】本実施形態における本システムの発現量推定処理の一例を示すフローチャートである。
【図11】本実施形態における本システムの画像比較処理の一例を示すフローチャートである。
【図12】本実施形態における本システムの染色体マップ作成処理の一例を示すフローチャートである。
【図13】モニタに表示されるアノテーション情報入力画面の表示画面の一例を示す図である。
【図14】cDNAクローンごとのデータを閲覧する場合に表示される一覧レポート画面の一例を示す図である。
【図15】cDNAクローンごとのデータを閲覧する場合に表示される詳細レポート画面の一例を示す図である。
【図16】cDNAクローンごとのデータを閲覧する場合に表示される詳細レポート画面の別の一例を示す図である。
【図17】クラスタごとのデータを閲覧する場合に表示される一覧レポート画面の一例を示す図である。
【図18】クラスタごとのデータを閲覧する場合に表示される詳細レポート画面の一例を示す図である。
【図19】染色体マップを閲覧する場合に表示される染色体マップ表示画面の一例を示す図である。
【符号の説明】
100 遺伝子発現情報管理装置
102 制御部
102a 画像アノテーション情報入力部
102b cDNAクローン配列ホモロジー検索部
102c cDNAクローンクラスタリング部
102d クラスタ配列決定部
102e クラスタ配列ホモロジー検索部
102f 3次元シミュレーション部
102g 発現量推定部
102h 画像比較部
102i 代表クローン決定部
102j クラスタ重要度決定部
102k 外部データベースアクセス部
102m 染色体マップ作成部
102n 表示画面作成部
104 通信制御インターフェース部
106 記憶部
106a cDNAクローンデータベース
106b クラスタデータベース
106c ホモロジー検索結果データベース
106d クラスタ配列データベース
106e クラスタ配列ホモロジー検索結果データベース
106f ベクタ配列データベース
106g 画像データベース
106h 核酸配列データベース
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク
Claims (25)
- 制御装置と記憶装置と出力装置とを少なくとも備えた遺伝子発現情報管理装置であって、
上記記憶装置は、
遺伝子の発現に関する複数の画像データと、当該画像データに対応する発現遺伝子の識別情報と、当該発現遺伝子を採取した組織に関する搾取組織情報、当該発現遺伝子を採取した組織の発育段階または加齢段階に関する段階情報、当該発現遺伝子の発現が見られるか否かに関する発現情報、および、発現が見られる部位に関する部位情報を含むアノテーション情報と、を対応付けて格納した画像データベースと、
上記画像データに対応する上記発現遺伝子の識別情報と、発現遺伝子塩基配列と、を対応付けて格納した発現遺伝子データベースと、
複数の、塩基配列識別情報と塩基配列とを対応付けて格納する核酸配列データベースと、
を備え、
上記制御装置は、
上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該発現遺伝子塩基配列に対応する上記発現発現遺伝子の識別情報と、当該類似塩基配列の上記塩基配列識別情報および当該ホモロジースコアと、を対応付けて登録したホモロジー検索結果データベースを作成し、上記記憶装置に格納するホモロジー検索手段と、
上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に基づいてクラスタ分類を実行し、各クラスタを一意に識別するクラスタ識別情報を付与し、上記クラスタ識別情報と、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、を対応付けて登録したクラスタデータベースを作成し、上記記憶装置に格納するクラスタリング手段と、
任意の上記クラスタについて、(1)上記クラスターデータベースに登録された、当該任意の上記クラスタに対応する上記クラスタ識別情報、および、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、(2)上記ホモロジー検索結果データベースに登録された、当該発現遺伝子の識別情報に対応する、上記類似塩基配列の塩基配列識別情報および上記ホモロジースコアと、(3)上記画像データベースに登録された、当該クラスタを構成する上記発現遺伝子の識別情報に対応する上記画像データ、および、当該画像データに対応する上記アノテーション情報の一部または全部と、を抽出して上記出力装置に表示する表示手段と、
を備えたことを特徴とする遺伝子発現情報管理装置。 - 上記ホモロジー検索手段は、
上記核酸配列データベースに格納された、
(1)既に同じあるいは別の生物で既知となっている遺伝子、
(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、
(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子、
のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うこと、
を特徴とする請求項1に記載の遺伝子発現情報管理装置。 - 上記クラスタリング手段により同一の上記クラスタに分類された上記発現遺伝子塩基配列からクラスタ配列を決定するクラスタ配列決定手段、
をさらに備え、
上記表示手段は、さらに、上記クラスタ毎に上記クラスタ配列を表示する、
ことを特徴とする請求項1または2に記載の遺伝子発現情報管理装置。 - 上記クラスタリング手段は、上記発現遺伝子塩基配列を用いて共通配列のアセンブルを行い、同一の上記共通配列を構成した上記発現遺伝子塩基配列を同一の上記クラスタに分類し、
上記クラスタ配列決定手段は、上記クラスタの上記共通配列を上記クラスタ配列として決定する、
ことを特徴とする請求項3に記載の遺伝子発現情報管理装置。 - 上記クラスタ配列決定手段により決定された上記クラスタ配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該クラスタ配列に対応する上記クラスタ識別情報と、当該類似塩基配列の上記塩基配列識別情報と、当該ホモロジースコアと、を対応付けて登録したクラスタ配列ホモロジー検索結果データベースを作成し、上記記憶装置に格納するクラスタ配列ホモロジー検索手段、
をさらに備え、
上記表示手段は、さらに、上記クラスタ毎に上記クラスタ配列ホモロジー検索結果データベースに登録した上記クラスタ配列と上記類似配列の上記塩基配列識別情報と上記ホモロジースコアを表示する、
ことを特徴とする請求項3または4に記載の遺伝子発現情報管理装置。 - 上記クラスタ配列ホモロジー検索手段は、
上記核酸配列データベースに格納された、
(1)既に同じあるいは別の生物で既知となっている遺伝子、
(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、
(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子、
のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする請求項5に記載の遺伝子発現情報管理装置。 - 上記画像データベースに登録された上記アノテーション情報の中の上記段階情報が異なる2つ以上の上記画像データについて、上記画像データ中の発光量および発光面積を比較する画像比較手段と、
上記画像比較手段の比較結果に基づいて、2つ以上の上記画像データの相違点を抽出する相違点抽出手段と、
上記相違点に基づいて、上記画像データ中の遺伝子の発現量を推定する発現量推定手段と、
上記発現量推定手段により推定された上記発現量に従って、上記表示手段における上記上記画像データの表示順番をソートする発現量順ソート手段と
をさらに備えたことを特徴とする請求項1から6のいずれか一つに記載の遺伝子発現情報管理装置。 - 上記塩基配列の存在する染色体上の遺伝子座を特定する遺伝子座特定手段と、
上記染色体の上記遺伝子座に上記塩基配列に関する情報をマッピングすることにより染色体マップを作成する染色体マップ作成手段と、
上記染色体マップ作成手段にて作成した上記染色体マップを表示する染色体マップ表示手段と、
をさらに備えたことを特徴とする請求項1から7のいずれか一つに記載の遺伝子発現情報管理装置。 - 制御装置と記憶装置と出力装置とを少なくとも備えた遺伝子発現情報管理装置を用いた遺伝子発現情報管理方法であって、
上記記憶装置は、
遺伝子の発現に関する複数の画像データと、当該画像データに対応する発現遺伝子の識別情報と、当該発現遺伝子を採取した組織に関する搾取組織情報、当該発現遺伝子を採取した組織の発育段階または加齢段階に関する段階情報、当該発現遺伝子の発現が見られる か否かに関する発現情報、および、発現が見られる部位に関する部位情報を含むアノテーション情報と、を対応付けて格納した画像データベースと、
上記画像データに対応する上記発現遺伝子の識別情報と、発現遺伝子塩基配列と、を対応付けて格納した発現遺伝子データベースと、
複数の、塩基配列識別情報と塩基配列とを対応付けて格納する核酸配列データベースと、
を備え、
上記制御装置において実行される、
上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該発現遺伝子塩基配列に対応する上記発現発現遺伝子の識別情報と、当該類似塩基配列の上記塩基配列識別情報および当該ホモロジースコアと、を対応付けて登録したホモロジー検索結果データベースを作成し、上記記憶装置に格納するホモロジー検索ステップと、
上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に基づいてクラスタ分類を実行し、各クラスタを一意に識別するクラスタ識別情報を付与し、上記クラスタ識別情報と、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、を対応付けて登録したクラスタデータベースを作成し、上記記憶装置に格納するクラスタリングステップと、
任意の上記クラスタについて、(1)上記クラスターデータベースに登録された、当該任意の上記クラスタに対応する上記クラスタ識別情報、および、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、(2)上記ホモロジー検索結果データベースに登録された、当該発現遺伝子の識別情報に対応する、上記類似塩基配列の塩基配列識別情報および上記ホモロジースコアと、(3)上記画像データベースに登録された、当該クラスタを構成する上記発現遺伝子の識別情報に対応する上記画像データ、および、当該画像データに対応する上記アノテーション情報の一部または全部と、を抽出して上記出力装置に表示する表示ステップと、
を備えたことを特徴とする遺伝子発現情報管理方法。 - 上記ホモロジー検索ステップは、
上記核酸配列データベースに格納された、
(1)既に同じあるいは別の生物で既知となっている遺伝子、
(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、
(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子、
のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うこと、
を特徴とする請求項9に記載の遺伝子発現情報管理方法。 - 上記クラスタリングステップにより同一の上記クラスタに分類された上記発現遺伝子塩基配列からクラスタ配列を決定するクラスタ配列決定ステップ、
をさらに備え、
上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列を表示する、
ことを特徴とする請求項9または10に記載の遺伝子発現情報管理方法。 - 上記クラスタリングステップは、上記発現遺伝子塩基配列を用いて共通配列のアセンブルを行い、同一の上記共通配列を構成した上記発現遺伝子塩基配列を同一の上記クラスタに分類し、
上記クラスタ配列決定ステップは、上記クラスタの上記共通配列を上記クラスタ配列として決定する、
ことを特徴とする請求項11に記載の遺伝子発現情報管理装置。 - 上記クラスタ配列決定ステップにより決定された上記クラスタ配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該クラスタ配列に対応する上記クラスタ識別情報と、当該類似塩基配列の上記塩基配列識別情報と、当該ホモロジースコアと、を対応付けて登録したクラスタ配列ホモロジー検索結果データベースを作成し、上記記憶装置に格納するクラスタ配列ホモロジー検索ステップ、
をさらに備え、
上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列ホモロジー検索結果データベースに登録した上記クラスタ配列と上記類似配列の上記塩基配列識別情報と上記ホモロジースコアを表示する、
ことを特徴とする請求項11または12に記載の遺伝子発現情報管理装置。 - 上記クラスタ配列ホモロジー検索ステップは、
上記核酸配列データベースに格納された、
(1)既に同じあるいは別の生物で既知となっている遺伝子、
(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、
(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子、
のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする請求項13に記載の遺伝子発現情報管理装置。 - 上記画像データベースに登録された上記アノテーション情報の中の上記段階情報が異なる2つ以上の上記画像データについて、上記画像データ中の発光量および発光面積を比較する画像比較ステップと、
上記画像比較ステップの比較結果に基づいて、2つ以上の上記画像データの相違点を抽出する相違点抽出ステップと、
上記相違点に基づいて、上記画像データ中の遺伝子の発現量を推定する発現量推定ステップと、
上記発現量推定ステップにより推定された上記発現量に従って、上記表示ステップにおける上記上記画像データの表示順番をソートする発現量順ソートステップと
をさらに備えたことを特徴とする請求項9から14のいずれか一つに記載の遺伝子発現情報管理装置。 - 上記塩基配列の存在する染色体上の遺伝子座を特定する遺伝子座特定ステップと、
上記染色体の上記遺伝子座に上記塩基配列に関する情報をマッピングすることにより染色体マップを作成する染色体マップ作成ステップと、
上記染色体マップ作成ステップにて作成した上記染色体マップを表示する染色体マップ表示ステップと、
をさらに備えたことを特徴とする請求項9から15のいずれか一つに記載の遺伝子発現情報管理装置。 - 制御装置と記憶装置と出力装置とを少なくとも備えた遺伝子発現情報管理装置に遺伝子発現情報管理方法を実行させるためのプログラムであって、
上記記憶装置は、
遺伝子の発現に関する複数の画像データと、当該画像データに対応する発現遺伝子の識別情報と、当該発現遺伝子を採取した組織に関する搾取組織情報、当該発現遺伝子を採取した組織の発育段階または加齢段階に関する段階情報、当該発現遺伝子の発現が見られるか否かに関する発現情報、および、発現が見られる部位に関する部位情報を含むアノテーション情報と、を対応付けて格納した画像データベースと、
上記画像データに対応する上記発現遺伝子の識別情報と、発現遺伝子塩基配列と、を対応付けて格納した発現遺伝子データベースと、
複数の、塩基配列識別情報と塩基配列とを対応付けて格納する核酸配列データベースと、
を備え、
上記制御装置において実行される、
上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該発現遺伝子塩基配列に対応する上記発現発現遺伝子の識別情報と、当該類似塩基配列の上記塩基配列識別情報および当該ホモロジースコアと、を対応付けて登録したホモロジー検索結果データベースを作成し、上記記憶装置に格納するホモロジー検索ステップと、
上記発現遺伝子データベースに格納された上記発現遺伝子塩基配列に基づいてクラスタ分類を実行し、各クラスタを一意に識別するクラスタ識別情報を付与し、上記クラスタ識別情報と、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、を対応付けて登録したクラスタデータベースを作成し、上記記憶装置に格納するクラスタリングステップと、
任意の上記クラスタについて、(1)上記クラスターデータベースに登録された、当該任意の上記クラスタに対応する上記クラスタ識別情報、および、当該クラスタを構成する上記発現遺伝子塩基配列に対応する上記発現遺伝子の識別情報と、(2)上記ホモロジー検索結果データベースに登録された、当該発現遺伝子の識別情報に対応する、上記類似塩基配列の塩基配列識別情報および上記ホモロジースコアと、(3)上記画像データベースに登録された、当該クラスタを構成する上記発現遺伝子の識別情報に対応する上記画像データ、および、当該画像データに対応する上記アノテーション情報の一部または全部と、を抽出して上記出力装置に表示する表示ステップと、
を備えたことを特徴とするプログラム。 - 上記ホモロジー検索ステップは、
上記核酸配列データベースに格納された、
(1)既に同じあるいは別の生物で既知となっている遺伝子、
(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、
(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子、
のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うこと、
を特徴とする請求項17に記載のプログラム。 - 上記クラスタリングステップにより同一の上記クラスタに分類された上記発現遺伝子塩基配列からクラスタ配列を決定するクラスタ配列決定ステップ、
をさらに備え、
上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列を表示する、
ことを特徴とする請求項17または18に記載のプログラム。 - 上記クラスタリングステップは、上記発現遺伝子塩基配列を用いて共通配列のアセンブルを行い、同一の上記共通配列を構成した上記発現遺伝子塩基配列を同一の上記クラスタに分類し、
上記クラスタ配列決定ステップは、上記クラスタの上記共通配列を上記クラスタ配列として決定する、
ことを特徴とする請求項19に記載のプログラム。 - 上記クラスタ配列決定ステップにより決定された上記クラスタ配列に対して、上記核酸配列データベースに格納された上記複数の塩基配列を対象としてホモロジー検索を行いホモロジースコアにより類似塩基配列を抽出し、当該クラスタ配列に対応する上記クラスタ識別情報と、当該類似塩基配列の上記塩基配列識別情報と、当該ホモロジースコアと、を対応付けて登録したクラスタ配列ホモロジー検索結果データベースを作成し、上記記憶装置に格納するクラスタ配列ホモロジー検索ステップ、
をさらに備え、
上記表示ステップは、さらに、上記クラスタ毎に上記クラスタ配列ホモロジー検索結果データベースに登録した上記クラスタ配列と上記類似配列の上記塩基配列識別情報と上記 ホモロジースコアを表示する、
ことを特徴とする請求項19または20に記載のプログラム。 - 上記クラスタ配列ホモロジー検索ステップは、
上記核酸配列データベースに格納された、
(1)既に同じあるいは別の生物で既知となっている遺伝子、
(2)未知の遺伝子であるが同じcDNAが既に取得されている遺伝子、
(3)未知の遺伝子であるが対応するゲノムDNA断片が既に取得されている遺伝子、
(4)染色体上での位置がわかっている遺伝子、
(5)既に特許が取得されている遺伝子、
のうち少なくとも一つの遺伝子の塩基配列を対象としてホモロジー検索を行うことを特徴とする請求項21に記載のプログラム。 - 上記画像データベースに登録された上記アノテーション情報の中の上記段階情報が異なる2つ以上の上記画像データについて、上記画像データ中の発光量および発光面積を比較する画像比較ステップと、
上記画像比較ステップの比較結果に基づいて、2つ以上の上記画像データの相違点を抽出する相違点抽出ステップと、
上記相違点に基づいて、上記画像データ中の遺伝子の発現量を推定する発現量推定ステップと、
上記発現量推定ステップにより推定された上記発現量に従って、上記表示ステップにおける上記上記画像データの表示順番をソートする発現量順ソートステップと
をさらに備えたことを特徴とする請求項17から22のいずれか一つに記載のプログラム。 - 上記塩基配列の存在する染色体上の遺伝子座を特定する遺伝子座特定ステップと、
上記染色体の上記遺伝子座に上記塩基配列に関する情報をマッピングすることにより染色体マップを作成する染色体マップ作成ステップと、
上記染色体マップ作成ステップにて作成した上記染色体マップを表示する染色体マップ表示ステップと、
をさらに備えたことを特徴とする請求項17から23のいずれか一つに記載のプログラム。 - 上記請求項17から24のいずれか一つに記載されたプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002040746A JP3880417B2 (ja) | 2002-02-18 | 2002-02-18 | 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 |
EP03705276A EP1477910A4 (en) | 2002-02-18 | 2003-02-18 | DEVICE FOR MANAGING GENE EXPRESSION DATA |
PCT/JP2003/001708 WO2003081471A1 (fr) | 2002-02-18 | 2003-02-18 | Dispositif de gestion de donnees d'expression genetique |
US10/504,956 US20050107961A1 (en) | 2002-02-18 | 2003-02-18 | Apparatus for managing gene expression data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002040746A JP3880417B2 (ja) | 2002-02-18 | 2002-02-18 | 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003242154A JP2003242154A (ja) | 2003-08-29 |
JP3880417B2 true JP3880417B2 (ja) | 2007-02-14 |
Family
ID=27781391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002040746A Expired - Fee Related JP3880417B2 (ja) | 2002-02-18 | 2002-02-18 | 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3880417B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005036441A1 (ja) * | 2003-10-07 | 2005-04-21 | Reverse Proteomics Research Institute Co., Ltd. | 生体関連事象間の相関データの可視化方法、解析法及びデータベース |
JP4724497B2 (ja) * | 2005-08-29 | 2011-07-13 | 独立行政法人理化学研究所 | 遺伝子発現画像構築方法および遺伝子発現画像構築システム |
JP5825790B2 (ja) * | 2011-01-11 | 2015-12-02 | 日本ソフトウェアマネジメント株式会社 | 核酸情報処理装置およびその処理方法 |
KR101300475B1 (ko) * | 2011-12-27 | 2013-09-02 | 서울대학교산학협력단 | 유전자 정보 관리 장치 및 방법 |
KR101788673B1 (ko) | 2014-06-24 | 2017-11-15 | 싸이퍼롬, 인코퍼레이티드 | 핵산염기서열 보안 방법, 장치 및 이를 저장한 기록매체 |
WO2015199440A1 (ko) * | 2014-06-24 | 2015-12-30 | 서울대학교산학협력단 | 핵산염기서열 보안 방법, 장치 및 이를 저장한 기록매체 |
EP3617916A4 (en) * | 2017-04-28 | 2021-05-05 | Japan Agency for Marine-Earth Science and Technology | INTEGRATION SYSTEM AND INTEGRATION PROCEDURE |
CN109448793B (zh) * | 2018-10-15 | 2021-04-20 | 智慧芽信息科技(苏州)有限公司 | 基因序列的权利范围标注、检索及信息标注方法、系统 |
JPWO2021039592A1 (ja) * | 2019-08-29 | 2021-03-04 |
-
2002
- 2002-02-18 JP JP2002040746A patent/JP3880417B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003242154A (ja) | 2003-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nelson et al. | McClintock: an integrated pipeline for detecting transposable element insertions in whole-genome shotgun sequencing data | |
US6303297B1 (en) | Database for storage and analysis of full-length sequences | |
Tomancak et al. | Systematic determination of patterns of gene expression during Drosophila embryogenesis | |
EP1477910A1 (en) | Apparatus for managing gene expression data | |
Ferea et al. | Observing the living genome | |
JP5464503B2 (ja) | 医療分析システム | |
US20070067111A1 (en) | Computer-aided visualization of expression comparison | |
Merkel et al. | Detecting short tandem repeats from genome data: opening the software black box | |
US7065451B2 (en) | Computer-based method for creating collections of sequences from a dataset of sequence identifiers corresponding to natural complex biopolymer sequences and linked to corresponding annotations | |
JP3880417B2 (ja) | 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体 | |
US20020064792A1 (en) | Database for storage and analysis of full-length sequences | |
Schulze et al. | Analysis of gene expression by microarrays: cell biologist’s gold mine or minefield? | |
JP2003330934A (ja) | 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体 | |
JP5288355B2 (ja) | 塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法 | |
JP3563315B2 (ja) | 樹状図表示方法及び樹状図表示システム | |
AU2003235071B2 (en) | Information management system, method, computer program, and storage device for large-scale in situ hybridization analysis | |
JP2004147640A (ja) | insituハイブリダイゼーション解析管理方法およびinsituハイブリダイゼーション解析管理装置 | |
US6994965B2 (en) | Method for displaying results of hybridization experiment | |
JP5247009B2 (ja) | 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 | |
US7133780B2 (en) | Computer software for automated annotation of biological sequences | |
AU2006228077B2 (en) | Information management system, method, computer program, and storage device for large-scale in situ hybridization analysis | |
JP4298101B2 (ja) | 類似発現パターン抽出方法及び関連生体高分子抽出方法 | |
JP2004147513A (ja) | Cyp代謝予測装置、cyp代謝予測方法、および、プログラム | |
Ikeda et al. | SEVENS: a database for comprehensive GPCR genes obtained from genomes—Update to 68 eukaryotes— | |
JP2005038256A (ja) | 有効因子情報選択装置、有効因子情報選択方法、プログラム、および、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061107 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091117 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101117 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111117 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121117 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131117 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |