JP3972105B2 - Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置 - Google Patents

Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置 Download PDF

Info

Publication number
JP3972105B2
JP3972105B2 JP2004053743A JP2004053743A JP3972105B2 JP 3972105 B2 JP3972105 B2 JP 3972105B2 JP 2004053743 A JP2004053743 A JP 2004053743A JP 2004053743 A JP2004053743 A JP 2004053743A JP 3972105 B2 JP3972105 B2 JP 3972105B2
Authority
JP
Japan
Prior art keywords
rhythm
time series
dna array
data
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004053743A
Other languages
English (en)
Other versions
JP2005242837A (ja
Inventor
正寛 石浦
和久 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nagoya University NUC
Tokai National Higher Education and Research System NUC
Original Assignee
Nagoya University NUC
Tokai National Higher Education and Research System NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nagoya University NUC, Tokai National Higher Education and Research System NUC filed Critical Nagoya University NUC
Priority to JP2004053743A priority Critical patent/JP3972105B2/ja
Priority to US11/063,608 priority patent/US20060084075A1/en
Priority to EP05251161A priority patent/EP1583020A3/en
Priority to GBGB0504092.8A priority patent/GB0504092D0/en
Publication of JP2005242837A publication Critical patent/JP2005242837A/ja
Application granted granted Critical
Publication of JP3972105B2 publication Critical patent/JP3972105B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

本発明は、DNAアレイ法により得られた時系列データを解析するためのプログラム、DNAアレイ法の時系列データの解析方法、更にはDNAアレイ法の時系列データの解析装置に関する。
DNAアレイ法は生物のゲノム上における全遺伝子の発現を網羅的に測定することを可能とする画期的な手法である。しかし、DNAアレイ法で得た大量のデータを時系列に沿って整理して解析するための環境の整備は未だ不十分であるのが現状である。
現在使用されているマイクロアレイ解析用の従来のプログラムとしては、GnenPix Pro 4.1 (Axon Instruments社)やGeneSpring (Silicon Genenetics社)などを挙げることができる。Gene Pix Pro 4.1を使用することにより2組のDNAアレイデータを比較検討することが可能であるが、時系列に沿ったデータなど、複数組のDNAアレイのデータを処理することはできない。
一方、GeneSpringを使用することにより複数組のDNAアレイのデータを時系列に沿って視覚化することができる。しかしデータの読み込みや操作が極めて煩雑であり、データの統計処理や解析、クラスタリングや解析結果の出力など機能の点で不十分である。GeneSpringではリズムの解析は行うことは全くできず、例えば、得られた時系列データに周期的な変動があるか否かの判定、周期的な変動がある場合のリズム成分の算出、解析結果に基づく遺伝子のクラスタリングを行うことは全くできない。
一方、本発明者らは特願2003-061203において、測定データのリアルタイム表示を可能とする生物試料発光の測定・解析に関する手段を開発している。特願2003-061203において、96穴プレートの生物試料において発光を一度にリアルタイムで解析したり、プリントしたりすることは可能となったが、そのシステムをDNAアレイのデータの処理に適用できるか試みることはなされていなかった。
特願2003-061203
そこで、特願2003-061203において開発されたデータ解析手段を基礎として、DNAアレイ法によって得た大量のデータを時系列に沿ってデータベース化し、迅速かつ簡単にリズム成分などの詳細な解析を行うことを可能とする手段を提供することが、本発明の課題である。
また本発明は、DNAアレイから得られたデータを記録するための記録媒体、記録媒体に記録された数値データファイルを用いてDNAアレイ法によって得た遺伝子発現の数値データを時系列に沿ってデータベース化するための手段と、ディスプレイ上で該遺伝子発現の数値データを時系列に沿って視覚化するための手段と、前記時系列に沿ってデータベース化する機能によってデータベース化された数値データを数学的に解析し、リズム成分を算出する手段と、コンピューターを用いて、前記時系列に沿ってデータベース化する機能によってデータベース化された数値データを、数学的に解析した後、解析結果の有意性をスチューデントのt検定により統計処理する手段と、データベース化された前記数値データを数学的に解析して得られたリズムデータを分類する機能を実行させる手段を有する、DNAアレイ法の時系列データの解析装置を提供するものである。
本発明においては、リズムデータの分類を行う手段としては、ヒストグラムの作成、2次元主成分分析または階層型クラスタリングなどを挙げることができる。更に、本発明においては、得られた結果をテキストファイルまたはHTML形式のファイルとして記録媒体に記録するプリンターへ出力することも可能である。
本発明により、DNAアレイ法によって得た遺伝子発現の数値データを時系列に沿って整理して統計学的な解析を行うこと、更には数学的に解析してリズム成分を算出することが可能となった。また本発明によって、解析により得られた結果に基づいてリズムデータを視覚化し、例えばヒストグラムの作成、2次元主成分分析、階層型クラスタリングなど、複数の基準で分類することも可能となった。またこれら一連の結果を記録媒体に記録し、プリンターへ出力することも可能となった。本発明のプログラムを使用することで、上記一連の処理を迅速かつ容易に実行することが可能である。これは既存のプログラムでは不可能なことであり、本発明のプログラムにより初めて達成された効果であり、DNAアレイ法の利便性を大いに高めることができる。
図1にDNAアレイ法の概要を示す。DNAアレイとはスライドグラスやナイロン膜上に、目的の生物の遺伝子のコード領域を含むDNA断片を固定したものであり、ゲノム機能解析を行うためのツールとして本分野で汎用されている。固定するべきDNA断片としては、ゲノムDNA断片、cDNA、人工的に合成したオリゴヌクレオチドが挙げられる。そして、DNAアレイ法とは、対象の生物から抽出したRNAから逆転写酵素を用いてcDNAを合成し、それを蛍光色素またはラジオアイソトープ(RI)でラベルし、ラベルしたcDNAとDNAアレイ上のDNA断片とをハイブリダイズさせることで、遺伝子の転写量を蛍光発光または放射線強度として測定する方法である。
DNAアレイを使用することにより、一枚のスライドグラス上に数万個のDNAを固定できるため、一度の実験で大量の遺伝子発現を測定することが可能である。DNAアレイ上のDNA断片とハイブリダイズしたラベル化cDNAから発せられるシグナルは専用のスキャナーによって取り込まれて数値化される。その様にして得られた数値データを解析プログラムによってデータベース化して解析することにより、実験者は目的の結果を得ることができる。
本発明のプログラムは、DNAアレイ法で得た大量の数値データを時系列に沿ってデータベース化し、迅速かつ簡単に詳細な解析を行うことを可能とするものである。特に、時系列データに周期成分が含まれる場合、例えば特願2003-061203に記載されたプログラムに基づいて強力なデータ解析を行うことができる。
即ち本発明は特願2003-061203に基づいて行われたものであり、特願2003-061203のプログラムの機能に加えて以下の6点の機能を付加したものである。(1)DNAアレイ法によって得た大量の数値データを時系列に沿ってデータベース化する機能。(2)大量の遺伝子発現の数値データを時系列に沿って視覚化する機能。(3)時系列に沿ってデータベース化した数値データを数学的に解析して統計処理を行い、実験者の設定した基準を有意に満たすか否かを判定する機能。(4)時系列に沿って整理したデータを数学的に解析して、リズム成分を算出する機能。(5)解析したリズムデータを分類する機能(ヒストグラムの作成、2次元主成分分析、階層型クラスタリング)。(6)全ての結果をテキストファイルまたはHTML形式のファイルとして記録媒体に記録したプリンターへ出力する機能。
なお本発明のプログラムは特願2003-061203に記載の生物発光測定データの解析にも適用が可能であり、本発明のプログラムを用いることで生物発光測定により得たデータとDNAアレイ法で得たデータとを比較検討することも可能である。以下において本発明において特徴的な機能について説明する。
(1)データベース化する機能
本発明のプログラムを実行し、コンピューター上の記録媒体に予め記録しておいたDNAアレイ実験の数値データファイルを指定する。次に、数値データファイルの組数、数値データと次の時刻の数値データとの時間間隔、各時刻ごとのDNAアレイの枚数、各DNAアレイにスポットされている遺伝子数、スポットされている遺伝子のセット数を指定した後に、数値データファイルの読み込みを実行する。本発明のプログラムは、実験者が指定した上記の条件に従って数値データファイルから平均値と標準偏差とを計算し、その結果を遺伝子ごとに時系列に沿ってデータベース化して記録する。
(2)リズム成分を算出する機能
時系列に沿ってデータベース化されたデータを特願2003-061203に記載の方法で数学的に解析する。DNAアレイ法で得た時系列データに対してこの方法で解析を行うことで、時系列データに含まれる周期的な変動を計算することができる。生物学的な多くの現象が周期的な法則性を持つにもかかわらず、既存のプログラムではその周期性を解析することができなかった。DNAアレイデータを特願2003-061203に記載の方法で数学的に解析することにより、既存のプログラムでは不可能であった周期的な変動の解析ができるようになった。
(3)統計処理を行なって基準を満たすか否かを判定する機能
数学的に解析結果を基に統計処理を行い、得られたデータに有意なリズムがあるか否かを判別する。数学的な解析の結果から得た周期成分から推定したリズムの山のデータ群とリズムの谷のデータ群とを抽出してt検定を行い、p値(比較するデータ群の値に有意な差が存在する確率)を算出する。そして数学的な解析によって算出した周期、元の数値データと数学的な解析から算出した結果との誤差、t検定のp値の全てが指定した基準を満たしている場合に、そのデータに有意なリズムがあると判断する。有意な概日リズムがあると判断する基準は、算出した周期が18.0〜26.8時間、誤差が0.75以下、t検定のp値が0.05以下というように、実験者が任意に設定することができる。
(4)数値データを視覚化する機能
それぞれの遺伝子の時系列に沿った発現量は、各点の平均値と標準偏差としてプログラム上で視覚化できる。また、数学的に解析した結果も同時にプログラム上で確認できる。さらに全ての解析結果を印刷したり、テキストファイルとして出力することができる。
(5)リズムデータを分類する機能
本発明において解析するべきリズム成分としては周期、位相、振幅、リズムの有意性などが挙げられる。そこで本発明のプログラムが備えているヒストグラム機能により、任意の1種類のリズム成分と遺伝子数の関係をヒストグラムとして描画することができる。よってリズムの成分と遺伝子数に何らかの関連性が有るのか否かを容易に判断することが可能である。ヒストグラムでは、例えば、円周に沿って0時から24時までの各時刻と各時刻に発現のピークを示す遺伝子数をヒストグラムとして表示し、ディスプレイ上に同時に各遺伝子名を表示することができる。このヒストグラムによって、一日のどの時刻に何の遺伝子が発現しているのかを容易に知ることができる。
また本発明のプログラムが備えている2次元主成分分析機能は、解析結果から得た各伝子発現リズムにおけるリズム成分の中の、任意の2種類のリズム成分を2次元の散布図として描画できる。よってリズムの成分間に何らかの関連性が有るのか否かを容易に判断することが可能である。
本発明のプログラムが備えている階層型クラスタリング機能は、解析結果から得たリズム成分の中の、任意の複数種類のリズム成分を基準として各遺伝子をグループに分類することができる。よって分類した各グループの遺伝子の機能に関連性が有るのか否かを容易に知ることが可能であり、機能が未知である遺伝子の機能推測を行ったり、発現制御の様式が未知である遺伝子の発現制御様式を推測することができる。なお既存のプログラムではDNAアレイデータに含まれる周期性を計算できないので、リズム成分を元にした遺伝子の分類機能を有さない。それを可能とした点が、本発明のプログラムの大きな特徴である。
下記の実施例に基づいて本発明を更に詳しく説明するが、その記載は何らの意味においても本発明の範囲を限定するものではない。
本発明のプログラムを用いてDNAアレイ法で得た藍色細菌の3,070個の遺伝子発現を解析した。藍色細菌Synechocystis sp. strain PCC 6803の野生型株をBG-11液体培地に接種し、30℃、90 μmol m-2 sec-1の白色光照射下(連続明条件)で通気培養した。培養液のOD730が0.35(細胞密度が3.5×108cells/ml)に達した後は連続培養装置を用いてOD730の値が0.35(細胞密度が3.5×108cells/ml)を保つようにBG-11液体培地を追加することで細胞密度を一定に維持した。Synechocystis sp. strain PCC 6803の生物時計をリセットするために細胞に12時間の暗期を与えた。12時間の暗期終了後、細胞を再び連続明条件に戻した。そして、12時間の暗期終了直後を0時間目として、0時間目から48時間目まで4時間ごとに培養液を分取した。分取した培養液は液体窒素で速やかに凍結し、RNAの抽出まで-85℃で保存した。RNAの抽出はフェノール/SDS法で行った。
Synechocystis sp. strain PCC 6803のDNAアレイはCynanoCHIP ver.1.6 (宝酒造)を用いた。このDNAアレイには、Synechocystis sp. strain PCC 6803のほぼ全ての遺伝子をカバーする3,070個のDNA断片が2セットずつ固定されている。連続明条件に移してからのそれぞれの時刻ごとに分取したSynechocystis sp. strain PCC 6803の培養液から5μgの全RNAを調製し、蛍光ラベルコアキットM-MLV version 2.0 (宝酒造)を用いて蛍光色素ラベルしたcDNAを合成した。蛍光色素はCy3-dUTPまたはCy5-dUTPを用いた。12時間の暗処理で生物時計をリセットしたSynechocystis sp. strain PCC 6803の4時間ごとの細胞から抽出したRNAからは、Cy3で蛍光ラベルしたcDNAを合成し、リセットしていない細胞から抽出したRNAからは、Cy5で蛍光ラベルした対照cDNAを合成した。
これら2種類のcDNAをDNAアレイ上のDNA断片へ競合的にハイブリダイズさせた。各時間につき3枚のDNAアレイを用いて実験を行った。Cy3とCy5の蛍光はGenePix 4000Bスキャナー(Axon Instruments社)を用いて検出と数値化とを行った。各DNAアレイは2回ずつ検出感度を変えて検出と数値化とを行った。
DNAアレイ上の各スポットの蛍光シグナル強度と周辺部(非スポット部)の蛍光シグナル強度とをGenePix Pro 4.1 ソフトウェア(Axon Instruments社)で測定して、スポットの蛍光シグナル強度から周辺部の蛍光シグナル強度を差し引いて、真のシグナル蛍光強度とした。各時刻の遺伝子の相対発現量を、生物時計をリセットした細胞としていない細胞の遺伝子発現量の違いとして標準化し、log2(Cy3/Cy5)として算出した。数値化したデータはそれぞれのDNAアレイごとに一つのテキストファイルとしてコンピューター上に記録した。そして、本発明のプログラムを用いて数値データファイルから平均値と標準偏差とを計算し、その結果を遺伝子ごとに時系列に沿ってデータベース化した。
時系列に沿ってデータベース化されたデータを特願2003-061203に記載の方法で数学的に解析して統計処理を行い、t検定を行ってp値を算出した。数学的な解析によって算出した周期、元の数値データと数学的な解析から算出した結果との誤差、t検定のp値がそれぞれ、18.0〜26.8時間、0.75以下、0.05以下という条件を全て満たす場合には、有意に概日リズムであると判断した。そしてこれらの条件を満たすSynechocystis sp. strain PCC 6803の遺伝子を特願2003-061203に記載の検索機能で検索した。その結果3,070個の遺伝子の中において、644個の遺伝子発現は有意に概日リズムを示すと判断できた。
図2は、数値データの読み込みとデータの解析時の際に使用するメインウィンドウであり、このウィンドウから各機能を実行するためのサブウィンドウを呼び出す。図2の上段において左から、データの読み込みと記録媒体への出力の条件を設定する領域、解析条件の設定領域、印刷の設定を行う領域、データの表示の設定を行う領域を、下段に解析結果を表示する領域を、それぞれ示す。図2において、それぞれの遺伝子の時系列に沿った発現量を、各点の平均値と標準偏差としてプログラム上で視覚化することができた。また、数学的に解析した結果を同時にプログラム上で確認することができた。さらに全ての解析結果は印刷やテキストファイルとして出力することができた。
更に、本発明のプログラムが備えているヒストグラム機能により、解析結果から得た各遺伝子発現リズムのリズム成分を描画することができる。図3は、遺伝子発現が有意に概日リズムを示すと判断できたSynechocystis sp. strain PCC 6803の644個の遺伝子における発現リズムのピークの時刻と遺伝子数とを、ヒストグラムとして表示したヒストグラムのウィンドウである。図3において、遺伝子発現リズムのピークの時刻(位相)と遺伝子数とをヒストグラムとして描画している。図3の上段において機能の選択、条件の入力領域を、下段において左からヒストグラムの描画領域、位相のグループを表示する領域、各グループに含まれる遺伝子名の表示領域を、それぞれ示す。
図3のヒストグラムでは、円周に沿って0時から24時までの各時刻と各時刻に発現のピークを示す遺伝子数をヒストグラムとして表示しており、右側のボックス内に該当する各遺伝子名が表示されている。これによって、一日のどの時刻に何の遺伝子が発現しているのか容易に知ることができる。Synechocystis sp. strain PCC 6803では、早朝と夕暮れに多くの遺伝子発現がピークを示すことを容易に明らかとすることができた。また、各時刻に何の遺伝子の発現がピークを示すのかも明らかにできた。
既に述べた様に、本発明のプログラムが備えている2次元主成分分析機能は、解析結果から得た各伝子発現リズムにおける任意の2種類のリズム成分を、2次元の散布図として描画できる。更に本発明のプログラムが備えている2次元主成分分析機能により、解析結果から得た各伝子発現リズムのリズム成分中の2種類を2次元の散布図として描画できる。そこで遺伝子発現が有意に概日リズムを示すと判断することができたSynechocystis sp. strain PCC 6803の644個の遺伝子の発現リズムのピークの時刻(位相)と遺伝子発現リズムの振幅を2次元の散布図として表示した。その結果を図4に示す。図4において、左上に機能の選択、条件の入力領域を、左下に2次元主成分分析の描画領域を、中央下に位相のグループを表示する領域を、右下に各グループに含まれる遺伝子名の表示領域を表示した。図4より、Synechocystis sp. strain PCC 6803では、遺伝子発現リズムの位相とリズムの振幅には関連性がないことが明らかになった。
更に本発明のプログラムが備えている階層型クラスタリング機能により、解析結果から得たリズム成分を基準として各遺伝子をグループに分類した。既に述べたように、階層型クラスタリングを行うことにより、分類した各グループの遺伝子の機能に関連性が有るのか否かを容易に知ることができる。遺伝子発現が有意に概日リズムを示すと判断できたSynechocystis sp. strain PCC 6803の644個の遺伝子の発現リズムのピークの時刻(位相)を基準として、階層型クラスタリングを行った結果を図5に示す。なお図5においては、解析により得られたリズム成分の関連性から各遺伝子の発現型を分類し、クラスタリングの図と共に発現パターンを疑似カラーで表示している。図5により、Synechocystis sp. strain PCC 6803では、機能的に関連性のある遺伝子が近い位相のグループで発現していることが明らかになった。
また、図6は遺伝子の発現プロファイルのウィンドウを示す図である。各機能のウィンドウで表示される遺伝子名を選択すると、遺伝子の発現プロファイルのウィンドウを随時表示できる。このウィンドウには遺伝子に関する情報(遺伝子名、時系列に沿った遺伝子発現パターンのグラフ、各時刻における遺伝子発現量の相対値の平均値および標準偏差、周期、位相、振幅など)を表示できる。
本実施例では12点の時刻で各3枚ずつ(計36枚)のDNAアレイから得た数値データを本発明のプログラムで処理した。それぞれのDNAアレイには各遺伝子が2個ずつスポットされているので、合計221,040個の数値データを処理したことになる。本発明のプログラムは、実施例の大量の数値データを時系列に沿ってデータベース化して、時系列に沿って視覚化することができた。そして、時系列に沿ってデータベース化した数値データを数学的に解析して統計処理を行い、実験者の設定した基準を有意に満たすか否かを判定することができた。
上記の実施例で示したように、DNAアレイ法によって得た遺伝子発現の数値データを時系列に沿って整理し、そのデータを数学的に解析してリズム成分を算出することができた。さらに、解析結果に基づいてリズムデータを視覚化して複数の基準で分類し、例えばヒストグラムの作成、2次元主成分分析、階層型クラスタリングなどを行うことができた。また、これら一連の結果を記録媒体に記録したり、プリンターへ出力することもできた。本発明のプログラムのみを使用することで、上記一連の処理を迅速かつ容易に実行することができた。これは既存のプログラムでは不可能なことであり、本発明のプログラム特有の効果であり、DNAアレイ法の利便性を大いに高めるものである。
本発明のプログラムは、大量のDNAアレイデータを、時系列に沿ってシステマティックに解析することを可能とするものである。よって本発明はDNAアレイ法の利便性を大いに高めるものと考えられる。DNAアレイ法を有効活用するためのデータ解析プログラムはバイオ市場において需要が大きいために、市販のDNAアレイ用機器に添付販売したり、あるいは本発明のプログラム単独で販売することができると考えられる。
図1は、DNAアレイ法の概略を示す模式図である。 図2は、メインウィンドウを示す図である。 図3は、ヒストグラムのウィンドウを示す図である。 図4は、2次元主成分分析のウィンドウを示す図である。 図5は、階層型クラスタリングのウィンドウを示す図である。 図6は、遺伝子の発現プロファイルのウィンドウを示す図である。

Claims (6)

  1. DNAアレイから得られたデータを記録するための記録媒体と、
    記録媒体に記録された数値データファイルを用いてDNAアレイ法によって得た遺伝子発現の数値データを時系列に沿ってデータベース化するための手段と
    前記時系列に沿ってデータベース化する機能によってデータベース化された数値データからリズム成分を算出する手段と、
    前記算出されたリズム成分を、数学的に解析することによって得た周期成分から推定したリズムの山のデータ群とリズムの谷のデータ群とを抽出してスチューデントのt検定を行ってp値を算出し、該p値が、指定された基準を満たすか否かによってリズムの有意性を判定する手段と、
    ディスプレイ上で前記遺伝子発現の数値データおよび前記リズム成分を時系列に沿って視覚化して表示する手段と、
    を有することを特徴とするDNAアレイ法の時系列データの解析装置。
  2. 前記リズム成分を、ヒストグラムの作成、2次元主成分分析または階層型クラスタリングを行うことにより分類する機能を実行させる手段、
    をさらに有することを特徴とする、請求項1記載の装置。
  3. 前記ヒストグラムの作成により、遺伝子の発現パターンの経時的な分布を解析することを可能とする、請求項2記載の装置。
  4. 前記2次元主成分分析により、リズム成分中の任意の2種類を2次元の散布図として描画することを可能とする、請求項2記載の装置。
  5. 前記階層型クラスタリングにより、リズム成分中の任意の複数種類を基準として各遺伝子をグループ化することを可能とする、請求項2記載の装置。
  6. 得られたリズム解析データの結果をテキストファイルまたはHTML形式のファイルとして記録媒体に記録するか、あるいはプリンターへ出力する手段、
    をさらに有する請求項1乃至請求項5のいずれか一つの請求項記載の装置。
JP2004053743A 2004-02-27 2004-02-27 Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置 Expired - Lifetime JP3972105B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2004053743A JP3972105B2 (ja) 2004-02-27 2004-02-27 Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置
US11/063,608 US20060084075A1 (en) 2004-02-27 2005-02-24 Program for analysis of the time-series data obtained by DNA array method, a method for analysis of the time-series data obtained by DNA array method, and a device for analysis of the time-series data obtained by DNA array method
EP05251161A EP1583020A3 (en) 2004-02-27 2005-02-28 Program, method and device for analysis of the time-series data obtained by DNA array method
GBGB0504092.8A GB0504092D0 (en) 2004-02-27 2005-02-28 A program for analysis of the time-series data obtained by DNA array method, a method for analysis of the time-series data obtained by DNA array method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004053743A JP3972105B2 (ja) 2004-02-27 2004-02-27 Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006318785A Division JP2007128529A (ja) 2006-11-27 2006-11-27 Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置

Publications (2)

Publication Number Publication Date
JP2005242837A JP2005242837A (ja) 2005-09-08
JP3972105B2 true JP3972105B2 (ja) 2007-09-05

Family

ID=34431653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004053743A Expired - Lifetime JP3972105B2 (ja) 2004-02-27 2004-02-27 Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置

Country Status (4)

Country Link
US (1) US20060084075A1 (ja)
EP (1) EP1583020A3 (ja)
JP (1) JP3972105B2 (ja)
GB (1) GB0504092D0 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4555256B2 (ja) * 2006-05-24 2010-09-29 Necソフト株式会社 時系列遺伝子発現量データの特徴抽出と比較分類を目的とする解析方法、および該解析方法に基づく解析装置
CA2740334C (en) 2010-05-14 2015-12-08 National Research Council Order-preserving clustering data analysis system and method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040080536A1 (en) * 2002-10-23 2004-04-29 Zohar Yakhini Method and user interface for interactive visualization and analysis of microarray data and other data, including genetic, biochemical, and chemical data

Also Published As

Publication number Publication date
EP1583020A3 (en) 2008-02-27
JP2005242837A (ja) 2005-09-08
EP1583020A2 (en) 2005-10-05
GB0504092D0 (en) 2005-04-06
US20060084075A1 (en) 2006-04-20

Similar Documents

Publication Publication Date Title
Waylen et al. From whole-mount to single-cell spatial assessment of gene expression in 3D
US6950756B2 (en) Rearrangement of microarray scan images to form virtual arrays
US11954614B2 (en) Systems and methods for visualizing a pattern in a dataset
Saeed et al. [9] TM4 microarray software suite
Kurella et al. DNA microarray analysis of complex biologic processes
Buness et al. arrayMagic: two-colour cDNA microarray quality control and preprocessing
Smid et al. GO-Mapper: functional analysis of gene expression data using the expression level as a score to evaluate Gene Ontology terms
JP2003500663A (ja) 実験データの正規化のための方法
EP2923293A1 (en) Efficient comparison of polynucleotide sequences
Dolan et al. TileQC: a system for tile-based quality control of Solexa data
US7877213B2 (en) System and methods for automated processing of multiple chemical arrays
Durinck Pre-processing of microarray data and analysis of differential expression
JP3972105B2 (ja) Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置
CN104182656B (zh) 一种在染色体上定位并显示生物基因表达信息及环境敏感区域的方法
JP2007128529A (ja) Dnaアレイ法の時系列データを解析するためのプログラム、dnaアレイ法の時系列データの解析方法、dnaアレイ法の時系列データの解析装置
US20110301862A1 (en) System for array-based DNA copy number and loss of heterozygosity analyses and reporting
Herwig et al. Expression profiling of drug response-from genes to pathways
Schillert et al. Genotype calling for the Affymetrix platform
US6994965B2 (en) Method for displaying results of hybridization experiment
JP4579525B2 (ja) 遺伝子発現データ管理表示方法
JP2007048027A (ja) 遺伝子発現データと遺伝子機能の関連表示方法
Tesson et al. eQTL analysis in mice and rats
US20240354607A1 (en) Systems and methods for visualizing a pattern in a dataset
KR20080013099A (ko) 마이크로어레이 이미지 분할 방법
Yadav et al. Visualization of high throughput genomic data using R and Bioconductor

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060329

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061127

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061128

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070110

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070413

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070515

R150 Certificate of patent or registration of utility model

Ref document number: 3972105

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term