JP2004325419A - cDNAマイクロアレイデータの補正システム、方法、プログラム、及び記録媒体 - Google Patents

cDNAマイクロアレイデータの補正システム、方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2004325419A
JP2004325419A JP2003124585A JP2003124585A JP2004325419A JP 2004325419 A JP2004325419 A JP 2004325419A JP 2003124585 A JP2003124585 A JP 2003124585A JP 2003124585 A JP2003124585 A JP 2003124585A JP 2004325419 A JP2004325419 A JP 2004325419A
Authority
JP
Japan
Prior art keywords
data
gene expression
expression intensity
correction
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003124585A
Other languages
English (en)
Inventor
Masaki Ando
正貴 安東
Akira Saito
彰 斎藤
Shigeru Otaki
慈 大瀧
Kenichi Sato
健一 佐藤
Masahiko Nishiyama
正彦 西山
Keiko Otani
敬子 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Japan Biological Informatics Consortium
Original Assignee
NEC Corp
Japan Biological Informatics Consortium
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Japan Biological Informatics Consortium filed Critical NEC Corp
Priority to JP2003124585A priority Critical patent/JP2004325419A/ja
Priority to US10/696,572 priority patent/US20040219566A1/en
Publication of JP2004325419A publication Critical patent/JP2004325419A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】マイクロアレイデータのグローバルおよびローカルな歪みに対してより精密な補正をし、さらに蛍光色素の感度の違いによる測定誤差を補正する。
【解決手段】第一処理過程であるデータ規準化手段は、入力装置から遺伝子発現強度データを入力し、大半の遺伝子は発現していないことを前提としてグリッド毎の順序統計量を用いて遺伝子発現強度データを規準化し、規準化した遺伝子発現強度データを出力する。第二処理過程であるスポット位置による補正手段は、グリッド毎にスポット位置に依存する歪みをノンパラメトリック平滑化法によって推定し、スポット位置に依存した歪みを補正した遺伝子発現強度データを出力する。第三処理過程であるS−Dプロットによる補正手段は、S−D変換を行い、蛍光色素の感度の違いによる歪みをノンパラメトリック平滑化法によって推定し、蛍光色素の感度の違いによる歪みを補正した遺伝子発現強度データを出力装置に出力する。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、数理モデルに基づいたcDNAマイクロアレイデータのデータ補正システム、方法、プログラム及び記録媒体に関し、特にグローバルノーマライゼーションとローカルノーマライゼーション、さらに蛍光色素の感度の違いによる測定の歪みの補正をすることができるcDNAマイクロアレイデータの補正システム、方法、プログラム及び記録媒体に関するものである。
【0002】
【従来の技術】
現在、ゲノム研究は個々の遺伝子についての構造解析から体系的な遺伝子の機能解析へと展開しつつある。機能未知の遺伝子や総体としての遺伝子の機能解析のために、多数の遺伝子の発現強度を同時に定量化することのできるcDNA(相補的なDNA)マイクロアレイを用いた実験はその有効性が大いに期待されている。
【0003】
二色蛍光法によるcDNAマイクロアレイを用いた実験の目的は二種類の細胞の遺伝子発現の違いを検出することにある。ここで、二色蛍光法によるcDNAマイクロアレイの概要について述べる。まず、多数の遺伝子セットのcDNAを参照用のプローブとして、スライドグラス上にアレイ状に高密度に固定化する(マイクロアレイ)。
【0004】
次に、条件の異なる2種類のサンプル、細胞1と細胞2(例えば正常細胞と癌細胞)から抽出したmRNAをそれぞれ波長の異なる蛍光色素でラベルし、ターゲットcDNAを合成する。そして、それらを等量混合したものをマイクロアレイに固定化された参照用のプローブcDNAに競合的にハイブリダイズさせる。ハイブリダイゼーション後、スキャナーでそれぞれの蛍光色素強度を測定する。細胞1にラベルされた蛍光色素をチャンネル1により、細胞2にラベルされた蛍光色素をチャンネル2により読み取り、それぞれを各細胞の遺伝子発現強度データ(マイクロアレイデータ)とする。
【0005】
このように、マイクロアレイデータが得られるまでの過程は複雑であり、高度な実験技術が必要とされることから、実験の各段階において様々な実験誤差が生じると考えられる。このため、マイクロアレイデータから真に生物学的意味のあるデータを取り出すためには遺伝子発現強度の分布と実験誤差の解析は解決すべき重要な課題である。
【0006】
遺伝子発現強度の分布に関しては、例えば、以下の非特許文献1を参照すると、Newton等は遺伝子発現強度にガンマ分布関数を仮定し、遺伝子発現強度比(チャンネル1とチャンネル2の遺伝子発現強度データの比)についての統計学的性質を考察している。
【0007】
また、観測された遺伝子発現強度データに対しては、例えば、以下の非特許文献2を参照すると、Lee等は真の遺伝子発現強度を2個の水準値に分離できることおよび偶然誤差の存在を前提として、以下の数15に示されるような混合正規分布を適用し、遺伝子発現強度データについての統計学的考察を行った。
【0008】
【数15】
Figure 2004325419
ここで、xはスキャナーなどによって得られる蛍光強度などの遺伝子発現強度データを表し、右辺第1項の外15は
【外15】
Figure 2004325419
遺伝子が発現しているときの平均μ、分散外16の正規分布、
【外16】
Figure 2004325419
また、同第2項の外17は遺伝子が発現していないときの平均μ、分散外18の正規分布の密度関数を表し、
【外17】
Figure 2004325419
【外18】
Figure 2004325419
pはその混合率を表す母数である。
【0009】
実験誤差の解析については、系統誤差の除去、いわゆるノーマライゼーションの方法がいくつか提案されている。ノーマライゼーションの方法は、大きく分けてアレイ上のすべてのスポットを対象にしたグローバルノーマライゼーションと,あるサブセットに分けた(例えばグリッド単位の)スポットを対象にしたローカルノーマライゼーションの二つが提案されている。グローバルノーマライゼーションについては、例えば、以下の非特許文献3を参照すると、Chen等は二つの細胞の遺伝子発現強度の中央値は等しいとしてチャンネル1とチャンネル2で得られた測定値の補正を行った。ローカルノーマライゼーションについては、例えば、以下の非特許文献4、5、6を参照すると、DudoitやSchuchhardtやYangは、系統誤差が、スポットのスライドグラス上の位置や、二種類の蛍光色素の感度の違いによって生じたものと考え、それらを除去する方法を提案した。
【0010】
【非特許文献1】
Newton et. al、2001年、ジャーナル・オブ・コンピュテーショナル・バイオロジー、第8巻、37〜52頁(Journal of Computational Biology Vol. 8, pp. 37−52)
【0011】
【非特許文献2】
Lee et. al、2000年、プロシーディング・オブ・ザ・ナショナル・アカデミィー・オブ・サイエンシズ、第97巻、第18号、9834〜9839頁(Proceeding of the National Academy of Sciences Vol. 97, No 18, pp. 9834−9839)
【0012】
【非特許文献3】
Chen et. al、1997年、ジャーナル・オブ・バイオメディカル・オプティクス、第2号、364 ̄374頁(Journal of Biomedical Optics Vol. 2, pp. 364−374)
【0013】
【非特許文献4】
Dudoit et. al、2000. Statistical methods for identifying differentially expressed genes in replicated cDNA microarray experiments. Technical ̄Report #578 2.
【0014】
【非特許文献5】
Schuchhardt et. al、2000年、ヌクレ・アシッド・リサーチ、第28巻、第10号(Nucleic Acids Research, 2000, Vol.28, No. 10)
【0015】
【非特許文献6】
Yang et. al、 2002年、ヌクレ・アシッド・リサーチ、第30巻、第4号(Nucleic Acids Research, 2002, Vol.30, No. 4)
【0016】
【発明が解決しようとする課題】
上記した従来技術における問題点は、マイクロアレイデータの解析結果は再現性に乏しく不安定なものになりがちで、精度や効率は低いものとみなされていることである。その理由は、遺伝子の発現に関する真の信号と実験誤差の分離が十分に行われていないからである。その背景要因として、遺伝子の発現強度はそれぞれの遺伝子によってレベルが異なっていることが考えられ、その場合、上記数15によるモデルは明らかに過大に単純化されすぎている。
【0017】
本発明の目的は、マイクロアレイ上の遺伝子発現強度データに関してよりもっともな数理モデルを想定して、グローバルおよびローカルな歪みに対して高い精度の補正を行い、さらに蛍光色素の感度の違いによる測定誤差を補正するための包括的なノーマライゼーションの方法およびシステムを提供することである。
【0018】
【課題を解決するための手段】
本発明のcDNAマイクロアレイデータの補正システムは、蛍光強度などの遺伝子発現強度データを入力する入力装置と、プログラムの制御により動作するデータ解析装置と、出力装置とを含む。なお,入力される遺伝子発現強度データは、各スポットのバックグラウンドノイズの除去や各スポットの信頼性を示すフラッグ情報を考慮し、あらかじめ調整されているものとする。
【0019】
前記データ解析装置は、下記の三個の連続した処理過程で構成される。第一処理過程であるデータ規準化手段では、前記入力装置から遺伝子発現強度データを入力し、大半の遺伝子は発現していないことを前提としてグリッド毎の順序統計量を用いて遺伝子発現強度データを規準化し、規準化した遺伝子発現強度データを出力する。
【0020】
第二処理過程であるスポット位置による補正手段では、前記規準化された遺伝子発現強度データを入力し、グリッド毎にスポット位置に依存する歪みをノンパラメトリック平滑化法によって推定し、スポット位置に依存したデータの歪みを補正した遺伝子発現強度データを出力する。
【0021】
第三処理過程であるS−Dプロットによる補正手段では、第二処理過程の段階まで補正された遺伝子発現強度データに対してMA変換の変形であるS−D変換(MA変換およびMAプロットについては、上記非特許文献6を参照)を行い、遺伝子発現強度データに潜在しうる蛍光色素の感度の違いによる歪みをノンパラメトリック平滑化法によって推定し、蛍光色素の感度の違いによる歪みを補正した遺伝子発現強度データを前記出力装置に出力する。
【0022】
なお、本システムは、任意の段階で遺伝子発現強度データの歪みを定量化し、S−Dプロット上に視覚化するS−D変換手段を有していることを特徴とする。
【0023】
このような構成を採用し、遺伝子発現強度データを補正することにより、本発明の目的を達成することができる。
【0024】
【発明の実施の形態】
はじめに、本発明におけるマイクロアレイの構造を説明する。図1を参照すると、K個の各グリッドにI×J個ずつ、合計K×I×J個のcDNAがスライドグラス上にスポットされている。いま、グリッドkにおける座標(i,j)にスポットされたcDNAに対して、チャンネルc=1,2によって得られた蛍光強度を外19とする。
【0025】
【外19】
Figure 2004325419
次に、以下の2つの仮定をする。
【0026】
(仮定1)
遺伝子が発現している確率は0.5より小さいと仮定し、各グリッド内の半分以上のスポットで検出される蛍光強度外20は、バックグラウンドノイズあるいは系統誤差を示しているとする。
【0027】
【外20】
Figure 2004325419
(仮定2)
グリッドkにおいて、チャンネルcによって得られた蛍光強度外21の25%点と50%点を、
【外21】
Figure 2004325419
それぞれL(c)およびM(c)とするとき、遺伝子の大半は非発現状態にあり全てのグリッドとチャンネルにおいて蛍光強度の50%点以下の分布は共通であるという前提に基づき、L(c)とM(c)−L(c)は各グリッドおよび各チャンネルで等しいと仮定する。
【0028】
次に、以上の仮定をもとに、本発明の第1の実施の形態について図面を参照して詳細に説明する。図2を参照すると、本発明の第1の実施の形態は、蛍光強度などの遺伝子発現強度データを入力する入力装置1と、プログラム制御により動作するデータ解析装置2と、ディスプレイ装置や印刷装置等の出力装置3とを含む。データ解析装置は、データ規準化手段21と、スポット位置による補正手段22と、S−Dプロットによる補正手段23とを備えている。
【0029】
データ規準化手段21は、与えられた遺伝子発現強度データに対して、グリッド毎の順序統計量を用いて遺伝子発現強度データを規準化し、スポット位置による補正手段22及びS−D変換手段24に送る。
【0030】
スポット位置による補正手段22は、データ規準化手段21から送られてきた規準化された遺伝子発現強度データに対して、グリッド毎にスポット位置に依存する歪みをノンパラメトリック平滑化法によって推定し、補正した遺伝子発現強度データをS−Dプロットによる補正手段23及びS−D変換手段24に送る。
【0031】
S−Dプロットによる補正手段23は、スポット位置による補正手段22から送られてきた補正された遺伝子発現強度データにS−D変換を行い、蛍光色素の感度の違いに起因する歪みをノンパラメトリック平滑化法により補正した後、遺伝子発現強度データを出力装置3へ送る。
【0032】
S−D変換手段24は送られてきた遺伝子発現強度データにS−D変換を行い、出力装置3へ送る。
【0033】
次に、図2、図3を参照して本実施の形態について詳細に説明する。入力装置1より入力された蛍光強度などの遺伝子発現強度データはデータ規準化手段21へ送られる。データ規準化手段21は、送られてきた発現強度データに対して、以下の数16で示されるように、グリッド毎の順序統計量を用いて発現強度データを規準化する(図3のステップA1)。
【0034】
【数16】
Figure 2004325419
2つのチャンネルによって得られた全スポットの遺伝子発現強度データ外22を規準化したかどうかを判定し、
【外22】
Figure 2004325419
全スポットの遺伝子発現強度データ(2×I×J×K個)を規準化するまで続ける(ステップA2)。
【0035】
データ規準化手段21において規準化された遺伝子発現強度データ外23に対して、
【外23】
Figure 2004325419
外24を真の発現強度を反映した蛍光強度(以下、真の発現蛍光強度)とし、
【外24】
Figure 2004325419
外25をグリッドkの座標(i,j)におけるスポット位置に依存する歪みとする。
【0036】
【外25】
Figure 2004325419
このとき、以下の数17に示すように、遺伝子発現強度データ外26は、真の発現強度外27とスポット位置に依存する歪み外28との和によって表されるとする。
【0037】
【外26】
Figure 2004325419
【外27】
Figure 2004325419
【外28】
Figure 2004325419
【数17】
Figure 2004325419
ただし、外29はランダムなノイズであるとする。
【0038】
【外29】
Figure 2004325419
スポット位置による補正手段22は、以下の数18に示すようにスポット位置に依存する歪み外30を「x軸」、「y軸」および「2つの軸の交互作用」による歪みの回帰関係で示されるノンパラメトリック回帰モデルにより記述し、
【外30】
Figure 2004325419
以下の数19に示すようにノンパラメトリック平滑化法を用いて、スポット位置による歪み外31を推定する。
【0039】
【外31】
Figure 2004325419
【数18】
Figure 2004325419
【数19】
Figure 2004325419
ここで、外32とする。
【0040】
【外32】
Figure 2004325419
外33はα以上の最小の整数とする。
【0041】
【外33】
Figure 2004325419
スポット位置による補正手段22は、以下の数20に示すように、データ規準化手段21において規準化された遺伝子発現強度データ外34に対して、推定されたスポット位置による歪み外35を補正する(ステップA3)。
【0042】
【外34】
Figure 2004325419
【外35】
Figure 2004325419
【数20】
Figure 2004325419
データ規準化手段21において規準化された全スポットの遺伝子発現強度データ外36に対して、
【外36】
Figure 2004325419
スポット位置による歪み外37の補正をしたかどうかを判定し、
【外37】
Figure 2004325419
全スポットの遺伝子発現強度データ(2×I×J×K個)を補正するまで続ける(ステップA4)。
【0043】
S−Dプロットによる補正手段23は、スポット位置による補正手段22において補正された真の遺伝子発現強度データ外38に対して、
【外38】
Figure 2004325419
以下の数21に示すように、S−D変換を行う。
【0044】
【数21】
Figure 2004325419
さらに、以下の数22で示されるようなノンパラメトリック回帰モデルを記述し、以下の数23及び数24に示すようにノンパラメトリック平滑化法を用いて蛍光色素の感度による測定誤差を推定し、補正を行う(ステップA5)。
【0045】
【数22】
Figure 2004325419
【数23】
Figure 2004325419
【数24】
Figure 2004325419
スポット位置による補正手段22において補正された真の遺伝子発現強度データ外39に対して、
【外39】
Figure 2004325419
S−Dプロットによる補正をしたかどうかを判定し、全スポットの真の遺伝子発現強度データ(2×I×J×K個)を補正するまで続ける(ステップA6)。
【0046】
なお、図3のA2、A4の各ステップ終了後、遺伝子発現強度データはS−D変換手段24を介して出力装置3に送られ、S−Dプロットによって遺伝子発現強度データの歪みを視覚化することができる。
【0047】
次に、本実施の形態の効果について説明する。本実施の形態では、グリッド間での順序統計量を用いた規準化(グローバルノーマライゼーション)とグリッド内でのスポット位置に依存する歪みの補正(ローカルノーマライゼーション)を組み合わせたノーマライゼーションを行った。これにより、グリッド間での遺伝子発現強度の偏りによる系統誤差と、グリッド内でのスポット位置に依存する歪みを同時に補正することができる。さらに、S−Dプロットによる補正においては、発現強度データの和と差を用いることにより、蛍光色素の感度の違いによる測定誤差を補正することができる。
【0048】
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。図4を参照すると、本発明の第2の実施の形態は、本発明の第1の実施の形態と同様に、入力装置、データ解析装置、出力装置を備え、更に、データ解析プログラムを記録した記録媒体4を備える。この記録媒体4は可搬形あるいは固定型のいずれであってもよく、磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってもよい。
【0049】
また、本手法を実行できるコンピュータプログラムを、ネットワークに接続されたコンピュータの記録装置に格納しておき、ネットワークを介して他のコンピュータに転送することもできる。本アルゴリズムを実行するコンピュータプログラムを提供する提供媒体としては、様々な形式のコンピュータに読み出し可能な媒体として頒布可能であって、特定のタイプの媒体に限定されるものではない。データ解析プログラムは記録媒体4からデータ解析装置5に読み込まれ、データ解析装置2の動作を制御し、入力装置1から入力されたデータファイルに対して第1の実施の形態におけるデータ処理装置2による処理と同一の処理を実行する。
【0050】
【実施例】
以下、本発明の実施例について説明する。例として用いたデータは,異なる2種類の癌細胞(A細胞、B細胞)の遺伝子発現状況の比較のために行われた実験から得られたものである。
【0051】
一枚のチップ上に48グリッド,1グリッドあたり441(21×21)スポット,計21168の遺伝子の発現パターンについて調べたものである。
【0052】
図5、図7はチャンネル1により得られたオリジナルデータのA細胞遺伝子発現強度を示し、図6、図8はチャンネル2によって得られたオリジナルデータのB細胞遺伝子発現強度を示す。それぞれの図は、マイクロアレイ上のスポット位置に対する遺伝子発現強度の対数値をプロットしたものである。また、図7、図8は第1グリッドから第4グリッドまでを拡大したものである。図5〜図8を見ると、遺伝子発現強度がグリッドごとに周期的に繰り返される系統的な歪みが観察される。マイクロアレイ上の遺伝子は無作為にスポットされているので、このような歪みは実験誤差と考えられる。
【0053】
図9は,それらのS−Dプロットである。横軸は,各チャンネルの遺伝子発現強度の和,縦軸はそれらの差をとったものを示している。各チャンネルの遺伝子発現強度の和が小さい領域と大きい領域においては、各チャンネルの遺伝子発現強度の差は真の遺伝子発現の違いによる影響は小さく、各チャンネルの蛍光色素の感度の違いによるものと考えられる。これにより、図9において蛍光色素の感度の違いによって生じたと考えられる歪みが観察される。
【0054】
図10に、チャンネル1におけるオリジナルデータのスポット位置に対する遺伝子発現強度の図を示す。図11に、チャンネル1における第一処理過程後のスポット位置に対する遺伝子発現強度の図を示す。図12に、チャンネル1における第二処理過程後のスポット位置に対する遺伝子発現強度の図を示す。スポット位置に依存していたグリッドごとに周期的に繰り返される系統的な歪みが補正されて取り除かれていることがわかる。
【0055】
図13にチャンネル1における第三処理過程後のスポット位置に対する遺伝子発現強度の図を示す。図14〜図17にチャンネル2におけるオリジナルデータ、第一処理過程後、第二処理過程後、第三処理過程後のスポット位置に対する遺伝子発現強度の図を示す。チャンネル1と同様にスポット位置に依存していたグリッドごとに周期的に繰り返される系統的な歪みが補正されて取り除かれていることがわかる。
【0056】
図18〜図21にオリジナルデータ、第一処理過程後、第二処理過程後、第三処理過程後のS−Dプロットを示す。図21を見ると、蛍光色素の感度の違いによる歪みが補正されて取り除かれていることがわかる。
【0057】
【発明の効果】
本発明によれば、グリッド間での位置および尺度の揺らぎに対する頑健な順序統計量の25%点と50%点による規準化(グローバルノーマライゼーション)と、グリッド内でのスポット位置に依存する歪みの補正(ローカルノーマライゼーション)を組み合わせてノーマライゼーションを行っているため、グリッド間での遺伝子発現強度の偏りや感度の揺らぎによる系統誤差と、グリッド内でのスポット位置に依存する歪みを、発現している遺伝子の頻度や外れ値の影響をほとんど受けることなく同時に補正することができる。
【0058】
又、本発明によれば、S−Dプロットにおいて遺伝子発現強度データの和と差を用いることによって、それぞれの蛍光色素の感度の違いが得られ易く、それによる測定誤差を的確に抽出することができるため、蛍光色素の感度の違いによる測定の歪みを効率良く補正することができる。
【図面の簡単な説明】
【図1】本発明におけるマイクロアレイの構造を示す図である。
【図2】本発明の第1の実施の形態の構成を示すブロック図である。
【図3】本発明の第1の実施の形態の動作を示す流れ図である。
【図4】本発明の第2の実施の形態の構成を示すブロック図である。
【図5】チャンネル1で得られたオリジナルデータの遺伝子発現強度の図である。
【図6】チャンネル2で得られたオリジナルデータの遺伝子発現強度の図である。
【図7】チャンネル1で得られたオリジナルデータ(第1グリッドから第4グリッド)の遺伝子発現強度の図である。
【図8】チャンネル2で得られたオリジナルデータ(第1グリッドから第4グリッド)の遺伝子発現強度の図である。
【図9】オリジナルデータに対するS−Dプロットである。
【図10】チャンネル1のオリジナルデータの遺伝子発現強度の図である。
【図11】チャンネル1の第一処理過程後の遺伝子発現強度の図である。
【図12】チャンネル1の第二処理過程後の遺伝子発現強度の図である。
【図13】チャンネル1の第三処理過程後の遺伝子発現強度の図である。
【図14】チャンネル2のオリジナルデータの遺伝子発現強度の図である。
【図15】チャンネル2の第一処理過程後の遺伝子発現強度の図である。
【図16】チャンネル2の第二処理過程後の遺伝子発現強度の図である。
【図17】チャンネル2の第三処理過程後の遺伝子発現強度の図である。
【図18】オリジナルデータに対するS−Dプロットである。
【図19】第一処理過程後のS−Dプロットである。
【図20】第二処理過程後のS−Dプロットである。
【図21】第三処理過程後のS−Dプロットである。
【符号の説明】
1 入力装置
2 データ解析装置
3 出力装置
21 データ規準化手段
22 スポット位置による補正手段
23 S−Dプロットによる補正手段
24 S−D変換手段

Claims (24)

  1. マイクロアレイデータのグローバル及びローカルな歪みに対してより精密な補正をし、さらに蛍光色素の感度の違いによる測定誤差を補正するcDNAマイクロアレイデータの補正システムにおいて、
    各スポットのバックグラウンドノイズの除去及び信頼性を示すフラッグ情報を考慮し、あらかじめ調整されている遺伝子発現強度データを入力する入力装置と、 前記入力された遺伝子発現強度データに対して、グリッド毎の順序統計量を用いて遺伝子発現強度データを規準化し、規準化された規準化遺伝子発現強度データを送出するデータ規準化手段と、前記規準化遺伝子発現強度データに対して、グリッドの座標におけるスポット位置に依存する歪みをノンパラメトリック平滑化法によって推定し、補正した第1の遺伝子発現強度補正データを送出するスポット位置による第1の補正手段と、前記第1の遺伝子発現強度補正データに対してS−D変換を行い、遺伝子発現強度データに潜在しうる蛍光色素の感度の違いによる歪みをノンパラメトリック平滑化法によって推定し、蛍光色素の感度の違いによる歪みが補正された第2の遺伝子発現強度補正データを送出する第2の補正手段とを具備するデータ解析装置と、
    前記第2の遺伝子発現強度補正データを出力する出力装置を
    有することを特徴とするcDNAマイクロアレイデータの補正システム。
  2. さらに、任意の段階で遺伝子発現強度データの歪みを定量化し、S−Dプロット上に視覚化するS−D変換手段を有していることを特徴とする請求項1記載のcDNAマイクロアレイデータの補正システム。
  3. 前記順序統計量は以下の数1(尚、外1は、前記規準化遺伝子発現強度データであり、外2はチャンネルによって得られた全スポットの遺伝子発現強度データであり、L(c)およびM(c)はそれぞれグリッドkにおいて、チャンネルcによって得られた遺伝子発現強度データの25%点および50%点を示す。)で示されることを特徴とする請求項1又は2記載のcDNAマイクロアレイデータの補正システム。
    Figure 2004325419
    【外1】
    Figure 2004325419
    【外2】
    Figure 2004325419
  4. 前記データ規準化手段は、少なくとも2つの遺伝子発現強度データチャンネルによって得られた全スポットの遺伝子発現強度データを規準化したかどうかを判定し、全スポットの遺伝子発現強度データを規準化するまで続けることを特徴とする請求項3記載のcDNAマイクロアレイデータの補正システム。
  5. 前記規準化遺伝子発現強度データは、真の発現強度とスポット位置に依存する歪みとの和によって表されることを特徴とする請求項1記載のcDNAマイクロアレイデータの補正システム。
  6. 前記第1の補正手段は、スポット位置に依存する歪みをx軸、y軸、及び前記x,y軸の交互作用による歪み(それぞれ、外3,外4,外5とする。)の回帰関係で示されるノンパラメトリック回帰モデルにより記述し、以下の数2に示されるノンパラメトリック平滑化法を用いて、スポット位置による歪み(外6)を推定することを特徴とする請求項1記載のcDNAマイクロアレイデータの補正システム。
    Figure 2004325419
    【外3】
    Figure 2004325419
    【外4】
    Figure 2004325419
    【外5】
    Figure 2004325419
    【外6】
    Figure 2004325419
  7. 前記スポット位置による歪みの補正は、以下の数3(尚、外7は補正された真の遺伝子発現強度データである。)に従って行なわれることを特徴とする請求項6記載のcDNAマイクロアレイデータの補正システム。
    Figure 2004325419
    【外7】
    Figure 2004325419
  8. 前記第2の補正手段における前記S−D変換は、以下の数4に従って行なわれることを特徴とする請求項7記載のcDNAマイクロアレイデータの補正システム。
    Figure 2004325419
  9. 前記第2の補正手段は、以下の数5で示されるノンパラメトリック回帰モデルにより記述し、以下の数6及び数7で示されるノンパラメトリック平滑化法を用いて、蛍光色素の感度による測定誤差を推定し、補正を行うことを特徴とする請求項8記載のcDNAマイクロアレイデータの補正システム。
    Figure 2004325419
    Figure 2004325419
    Figure 2004325419
  10. 前記補正の前提として、遺伝子が発現している確率は0.5より小さいと仮定し、各グリッド内の半分以上のスポットで検出される蛍光強度は、バックグラウンドノイズあるいは系統誤差を示しているとすることを特徴とする請求項1記載のcDNAマイクロアレイデータの補正システム。
  11. さらに前記補正の前提として、グリッドにおいて、少なくとも2つの遺伝子発現強度データチャンネルによって得られた蛍光強度の25%点と50%点を、それぞれL(c)およびM(c)とするとき、遺伝子の大半は非発現状態にあり全てのグリッドとチャンネルにおいて蛍光強度の50%点以下の分布は共通であるという前提に基づき、L(c)とM(c)−L(c)は各グリッドおよび各チャンネルで等しいと仮定することを特徴とする請求項10記載のcDNAマイクロアレイデータの補正システム。
  12. マイクロアレイデータのグローバル及びローカルな歪みに対してより精密な補正をし、さらに蛍光色素の感度の違いによる測定誤差を補正するcDNAマイクロアレイデータの補正方法において、
    各スポットのバックグラウンドノイズの除去及び信頼性を示すフラッグ情報を考慮し、あらかじめ調整されている遺伝子発現強度データを入力するステップと、 大半の遺伝子は発現していないことを前提として、前記入力された遺伝子発現強度データに対してグリッド毎の順序統計量を用いて、当該遺伝子発現強度データを規準化するステップと、
    前記規準化された規準化遺伝子発現強度データを出力するステップと、
    前記規準化遺伝子発現強度データに対して、グリッドの座標におけるスポット位置に依存する歪みをノンパラメトリック平滑化法によって推定し、スポット位置に依存したデータの歪みを補正するステップと、
    前記スポット位置に依存したデータ歪みの補正がされた第1の遺伝子発現強度補正データを出力するステップと、
    前記第1の遺伝子発現強度補正データに対して、S−D変換を行い、遺伝子発現強度データに潜在しうる蛍光色素の感度の違いによる歪みをノンパラメトリック平滑化法によって推定し、蛍光色素の感度の違いによる歪みを補正するステップと、
    前記蛍光色素の感度の違いによる歪みの補正がされた第2の遺伝子発現強度補正データを出力するステップとを
    有することを特徴とするcDNAマイクロアレイデータの補正方法。
  13. さらに、任意の段階で遺伝子発現強度データの歪みを定量化し、S−Dプロット上に視覚化するステップを有していることを特徴とする請求項12記載のcDNAマイクロアレイデータの補正方法。
  14. 前記順序統計量は以下の数8(尚、外8は、前記規準化遺伝子発現強度データであり、外9はチャンネルによって得られた全スポットの遺伝子発現強度データであり、L(c)およびM(c)はそれぞれグリッドkにおいて、チャンネルcによって得られた遺伝子発現強度データの25%点および50%点を示す。)で示されることを特徴とする請求項12又は13記載のcDNAマイクロアレイデータの補正方法。
    Figure 2004325419
    【外8】
    Figure 2004325419
    【外9】
    Figure 2004325419
  15. 前記データを規準化するステップにおいて、少なくとも2つの遺伝子発現強度データチャンネルによって得られた全スポットの遺伝子発現強度データを規準化したかどうかを判定し、全スポットの遺伝子発現強度データを規準化するまで続けることを特徴とする請求項14記載のcDNAマイクロアレイデータの補正方法。
  16. 前記規準化遺伝子発現強度データは、真の発現強度とスポット位置に依存する歪みとの和によって表されることを特徴とする請求項15記載のcDNAマイクロアレイデータの補正方法。
  17. 前記スポット位置に依存したデータの歪みを補正するステップにおいて、スポット位置に依存する歪みをx軸、y軸、及び前記x,y軸の交互作用による歪み(それぞれ、外10,外11,外12とする。)の回帰関係で示されるノンパラメトリック回帰モデルにより記述し、以下の数9で示されるノンパラメトリック平滑化法を用いて、スポット位置による歪み(外13)を推定することを特徴とする請求項12記載のcDNAマイクロアレイデータの補正方法。
    Figure 2004325419
    【外10】
    Figure 2004325419
    【外11】
    Figure 2004325419
    【外12】
    Figure 2004325419
    【外13】
    Figure 2004325419
  18. 前記スポット位置による歪みの補正は、以下の数10(尚、外14は補正された真の遺伝子発現強度データである。)に従って行なわれることを特徴とする請求項17記載のcDNAマイクロアレイデータの補正方法。
    Figure 2004325419
    【外14】
    Figure 2004325419
  19. 前記蛍光色素の感度の違いによる歪みを補正するステップにおける前記S−D変換は、以下の数11に従って行なわれることを特徴とする請求項18記載のcDNAマイクロアレイデータの補正方法。
    Figure 2004325419
  20. 前記蛍光色素の感度の違いによる歪みを補正するステップにおいて、以下の数12で示されるノンパラメトリック回帰モデルにより記述し、以下の数13及び数14で示されるノンパラメトリック平滑化法を用いて、蛍光色素の感度による測定誤差を推定し、補正を行うことを特徴とする請求項19記載のcDNAマイクロアレイデータの補正方法。
    Figure 2004325419
    Figure 2004325419
    Figure 2004325419
  21. 前記補正の前提として、遺伝子が発現している確率は0.5より小さいと仮定し、各グリッド内の半分以上のスポットで検出される蛍光強度は、バックグラウンドノイズあるいは系統誤差を示しているとすることを特徴とする請求項12記載のcDNAマイクロアレイデータの補正方法。
  22. さらに前記補正の前提として、グリッドにおいて、少なくとも2つの遺伝子発現強度データチャンネルによって得られた蛍光強度の25%点と50%点を、それぞれL(c)およびM(c)とするとき、遺伝子の大半は非発現状態にあり、全てのグリッドとチャンネルにおいて蛍光強度の50%点以下の分布は共通であるという前提に基づき、L(c)とM(c)−L(c)は各グリッドおよび各チャンネルで等しいと仮定することを特徴とする請求項21記載のcDNAマイクロアレイデータの補正方法。
  23. マイクロアレイデータのグローバル及びローカルな歪みに対してより精密な補正をし、さらに蛍光色素の感度の違いによる測定誤差を補正するためコンピュータに、
    各スポットのバックグラウンドノイズの除去及び信頼性を示すフラッグ情報を考慮し、あらかじめ調整されている遺伝子発現強度データを入力するステップと、 大半の遺伝子は発現していないことを前提として、前記入力された遺伝子発現強度データに対してグリッド毎の順序統計量を用いて、当該遺伝子発現強度データを規準化するステップと、
    前記規準化された規準化遺伝子発現強度データを出力するステップと、
    前記規準化遺伝子発現強度データに対して、グリッドの座標におけるスポット位置に依存する歪みをノンパラメトリック平滑化法によって推定し、スポット位置に依存したデータの歪みを補正するステップと、
    前記スポット位置に依存したデータ歪みの補正がされた第1の遺伝子発現強度補正データを出力するステップと、
    前記第1の遺伝子発現強度補正データに対して、S−D変換を行い、遺伝子発現強度データに潜在しうる蛍光色素の感度の違いによる歪みをノンパラメトリック平滑化法によって推定し、蛍光色素の感度の違いによる歪みを補正するステップと、
    前記蛍光色素の感度の違いによる歪みの補正がされた第2の遺伝子発現強度補正データを出力するステップとを
    を実行させるためのcDNAマイクロアレイデータ補正プログラム。
  24. マイクロアレイデータのグローバル及びローカルな歪みに対してより精密な補正をし、さらに蛍光色素の感度の違いによる測定誤差を補正するためコンピュータに、
    各スポットのバックグラウンドノイズの除去及び信頼性を示すフラッグ情報を考慮し、あらかじめ調整されている遺伝子発現強度データを入力するステップと、 大半の遺伝子は発現していないことを前提として、前記入力された遺伝子発現強度データに対してグリッド毎の順序統計量を用いて、当該遺伝子発現強度データを規準化するステップと、
    前記規準化された規準化遺伝子発現強度データを出力するステップと、
    前記規準化遺伝子発現強度データに対して、グリッドの座標におけるスポット位置に依存する歪みをノンパラメトリック平滑化法によって推定し、スポット位置に依存したデータの歪みを補正するステップと、
    前記スポット位置に依存したデータ歪みの補正がされた第1の遺伝子発現強度補正データを出力するステップと、
    前記第1の遺伝子発現強度補正データに対して、S−D変換を行い、遺伝子発現強度データに潜在しうる蛍光色素の感度の違いによる歪みをノンパラメトリック平滑化法によって推定し、蛍光色素の感度の違いによる歪みを補正するステップと、
    前記蛍光色素の感度の違いによる歪みの補正がされた第2の遺伝子発現強度補正データを出力するステップとを
    を実行させるためのcDNAマイクロアレイデータ補正プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003124585A 2003-04-28 2003-04-28 cDNAマイクロアレイデータの補正システム、方法、プログラム、及び記録媒体 Pending JP2004325419A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003124585A JP2004325419A (ja) 2003-04-28 2003-04-28 cDNAマイクロアレイデータの補正システム、方法、プログラム、及び記録媒体
US10/696,572 US20040219566A1 (en) 2003-04-28 2003-10-30 cDNA microarray data correction system, method, program, and memory medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003124585A JP2004325419A (ja) 2003-04-28 2003-04-28 cDNAマイクロアレイデータの補正システム、方法、プログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2004325419A true JP2004325419A (ja) 2004-11-18

Family

ID=33308149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003124585A Pending JP2004325419A (ja) 2003-04-28 2003-04-28 cDNAマイクロアレイデータの補正システム、方法、プログラム、及び記録媒体

Country Status (2)

Country Link
US (1) US20040219566A1 (ja)
JP (1) JP2004325419A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9543947B2 (en) 2013-06-27 2017-01-10 Renesas Electronics Corporation Semiconductor device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067833A (zh) * 2007-05-09 2007-11-07 冯连元 将临床医学上各种检测或化验结果的正常范围参考值及其实际测量值统一标化的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7418351B2 (en) * 2002-01-31 2008-08-26 Rosetta Inpharmatics Llc Methods for analysis of measurement errors in measured signals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9543947B2 (en) 2013-06-27 2017-01-10 Renesas Electronics Corporation Semiconductor device

Also Published As

Publication number Publication date
US20040219566A1 (en) 2004-11-04

Similar Documents

Publication Publication Date Title
Forster et al. Experiments using microarray technology: limitations and standard operating procedures
Tumor Analysis Best Practices Working Group Expression profiling—best practices for data generation and interpretation in clinical trials
CN103201744B (zh) 用于估算全基因组拷贝数变异的方法
Patruno et al. A review of computational strategies for denoising and imputation of single-cell transcriptomic data
JP2008511058A (ja) コンピュータシステムを用いるデータ品質および/または部分異数染色体の決定
Zhou et al. Match-only integral distribution (MOID) algorithm for high-density oligonucleotide array analysis
CN114724626A (zh) 母体血浆的无创性产前分子染色体核型分析
CN113270141B (zh) 一种基因组拷贝数变异检测整合算法
US20200327957A1 (en) Detection of deletions and copy number variations in dna sequences
Zhang et al. Deconvolution algorithms for inference of the cell-type composition of the spatial transcriptome
McShane et al. Statistical issues in the design and analysis of gene expression microarray studies of animal models
Minnier et al. RNA-Seq and expression arrays: Selection guidelines for genome-wide expression profiling
JP2004325419A (ja) cDNAマイクロアレイデータの補正システム、方法、プログラム、及び記録媒体
EP1190366B1 (en) Mathematical analysis for the estimation of changes in the level of gene expression
Calza et al. Normalization of gene-expression microarray data
Royce et al. [15] Extrapolating Traditional DNA Microarray Statistics to Tiling and Protein Microarray Technologies
Bergemann et al. A statistically driven approach for image segmentation and signal extraction in cDNA microarrays
JP2005038279A (ja) 遺伝子発現状況推定システム、方法、プログラム、及び記録媒体
JP2006277611A (ja) 複数サンプルの遺伝子発現データに対する解析システム、方法、プログラム及び記録媒体
Calciano et al. A predictive microarray-based biomarker for early detection of Alzheimer’s disease intended for clinical diagnostic application
CN117672343B (zh) 测序饱和度评估方法及装置、设备及存储介质
Kreutz Statistical Approaches for Molecular and Systems Biology
Teo Genotype calling for the Illumina platform
Fulci Fast analysis of Spatial Transcriptomics (FaST): an ultra lightweight and fast pipeline for the analysis of high resolution spatial transcriptomics.
Brishty et al. Thorough Assessment on Differential Gene Expression Analysis Methods for RNA-seq Data

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050224

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090617

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100203