JP2003028862A - Dna microarray data correcting method - Google Patents

Dna microarray data correcting method

Info

Publication number
JP2003028862A
JP2003028862A JP2001212910A JP2001212910A JP2003028862A JP 2003028862 A JP2003028862 A JP 2003028862A JP 2001212910 A JP2001212910 A JP 2001212910A JP 2001212910 A JP2001212910 A JP 2001212910A JP 2003028862 A JP2003028862 A JP 2003028862A
Authority
JP
Japan
Prior art keywords
distribution
dna microarray
data
gene
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001212910A
Other languages
Japanese (ja)
Inventor
Masashi Kadowaki
正史 門脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PharmaDesign Inc Japan
Original Assignee
PharmaDesign Inc Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PharmaDesign Inc Japan filed Critical PharmaDesign Inc Japan
Priority to JP2001212910A priority Critical patent/JP2003028862A/en
Publication of JP2003028862A publication Critical patent/JP2003028862A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a DNA microarray data correcting method. SOLUTION: The DNA microarray data correcting method for examining the difference between the gene expression levels of two types of samples on every gene through the use of a DNA microarray includes (A) a process for obtaining the average amounts of expression for every gene on the two types of samples by averaging measurement data for every gene on the two types of samples obtained from the DNA microarray, (B) a process for obtaining the difference between the amounts of expression for every gene on the two types of samples by obtaining differences for every gene from the measurement data on the two types of samples obtained form the DNA microarray, (C) a process for obtaining a simultaneous distribution with the average amounts of expression obtained in the process (A) and the difference between the amounts of expression obtained in the process (B) as random variables, and (D) a process for converting the simultaneous distribution obtained in the process (C) into a previously determined distribution or a statistically expected distribution.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、DNAマイクロアレ
イデータの補正方法、該方法を用いるマイクロアレイデ
ータ補正装置、及び該DNAマイクロアレイデータ補正装
置を組み込んだ遺伝子発現分析装置に関する。
TECHNICAL FIELD The present invention relates to a method for correcting DNA microarray data, a microarray data correction apparatus using the method, and a gene expression analyzer incorporating the DNA microarray data correction apparatus.

【0002】[0002]

【従来の技術】ゲノムプロジェクトに代表される遺伝子
解析研究の進展は、従来のノーザンブロッティングや競
合的RT-PCR等に代わる、効率的な解析手法の必要性を高
めた。遺伝子発現を迅速且つ網羅的に調べることができ
るツールとしてDNAマイクロアレイ(DNAチップともい
う)が開発された。DNAマイクロアレイは、アレイ基板
上に数百〜数万のDNAプローブを整列・固定させ、解析
対象とするmRNAから調製されたターゲットをこれにハイ
ブリダイズさせることによって、各遺伝子の発現変化を
測定する方法である。
2. Description of the Related Art Advances in gene analysis research represented by the Genome Project have increased the need for efficient analysis methods in place of conventional Northern blotting, competitive RT-PCR and the like. A DNA microarray (also referred to as a DNA chip) has been developed as a tool capable of rapidly and comprehensively examining gene expression. A DNA microarray is a method of measuring expression changes of each gene by aligning and fixing hundreds to tens of thousands of DNA probes on an array substrate and hybridizing a target prepared from mRNA to be analyzed to this. Is.

【0003】この方法を用いれば、一度の測定実験によ
って、非常に多くの情報を得ることができるため、ゲノ
ム解析で得られた遺伝子構造情報に基づいて、体系的な
遺伝子発現解析を行うことが可能である。DNAマイクロ
アレイを用いた研究は、まだ始まったばかりであり、特
に生データの処理法に関しては、十分な検討がなされて
いるわけではない。
Using this method, a large amount of information can be obtained by a single measurement experiment. Therefore, systematic gene expression analysis can be performed based on the gene structure information obtained by genome analysis. It is possible. Studies using DNA microarrays are still in their infancy, and the methods for processing raw data have not been thoroughly investigated.

【0004】ところで、通常、DNAマイクロアレイによ
る遺伝子発現解析実験は、二蛍光標識法、すなわち2種
類の細胞に由来するmRNAを抽出・精製し、異なる蛍光物
質(例えば、Cy3,Cy5)で標識した後、DNAマイクロアレ
イ上で競合的ハイブリダイゼーションを行い、異なる励
起波長における各蛍光強度を測定するという工程により
行われる。そして、アレイ上の各スポットから得られた
各蛍光物質の蛍光強度をそれぞれ定量・比較することに
よって、2種類の細胞における各遺伝子発現量の比に関
する情報を得るのが一般的である。
By the way, usually, in a gene expression analysis experiment using a DNA microarray, after two fluorescent labeling methods, that is, mRNAs derived from two types of cells are extracted and purified, and labeled with different fluorescent substances (for example, Cy3 and Cy5). , Competitive hybridization is performed on a DNA microarray, and each fluorescence intensity at different excitation wavelengths is measured. Then, by generally quantifying and comparing the fluorescence intensities of the respective fluorescent substances obtained from the respective spots on the array, it is general to obtain information on the ratio of the gene expression levels in the two types of cells.

【0005】ただし、通常の測定においては、異なるサ
ンプルから別々にmRNAを抽出・精製し、異なる蛍光物質
で標識して検出するため、得られる生データは、必要に
応じて補正を行う必要がある。具体的には、例えば、経
時変化の比較など2種類の細胞の発現量にあまり差がな
いと考えられる場合には、全遺伝子発現量は変化しない
ものと考え、各スポットから得られる蛍光シグナルの総
計や中間値より補正係数を算出し、各スポットシグナル
の蛍光強度を補正する方法[Wilson, M. et al.:Proc. N
atl. Acad. Sci. USA, 96:12833-12838(1999)]が採用さ
れ、その他、2種類の細胞の発現量が異なっていると考
えられる場合には、各細胞における発現量が一定と考え
られる遺伝子(例えば、ハウスキーピング遺伝子)の蛍
光シグナル値より補正係数を算出し、各スポットシグナ
ルの蛍光強度を補正する方法[Heller, R.A. et al.: Pr
oc. Natl. Acad. Sci. USA, 94:2150-2155 (1997)]等が
採用されてきた。
However, in ordinary measurement, mRNAs are separately extracted and purified from different samples and labeled with different fluorescent substances for detection, so that the raw data obtained must be corrected if necessary. . Specifically, for example, when it is considered that there is not much difference in the expression levels of the two types of cells such as comparison of changes over time, it is considered that the total gene expression level does not change, and the fluorescence signal obtained from each spot is Method for calculating the correction coefficient from the total or median value and correcting the fluorescence intensity of each spot signal [Wilson, M. et al.:Proc. N
atl. Acad. Sci. USA, 96: 12833-12838 (1999)], and when the expression levels of the two types of cells are considered to be different, the expression level in each cell is considered to be constant. Method of calculating the correction coefficient from the fluorescence signal value of the gene (eg, housekeeping gene) to be corrected, and correcting the fluorescence intensity of each spot signal [Heller, RA et al .: Pr
oc. Natl. Acad. Sci. USA, 94: 2150-2155 (1997)] and the like have been adopted.

【0006】しかし、通常、DNAマイクロアレイは一枚
のアレイ上に非常に多数のDNAプローブが存在し、上記
のような単純な補正では十分ではない。最近、Yangらは
マイクロアレイにおいて、より厳密な補正を行うため
に、プローブをスポットする際のピンの違いや、発現量
に依存して発現量の分布の平均を補正する方法が有効で
あることを報告した[Yang, Y. H. et al.:Normalizatio
n for cDNA Microarray Data. SPIE BiOS 2001, San Jo
se, California, January 2001]。ところが、このよう
な補正を用いてもなお十分とはいえない。
However, in a DNA microarray, a large number of DNA probes are usually present on one array, and the simple correction as described above is not sufficient. Recently, Yang et al. Have found that in order to perform more precise correction in microarrays, it is effective to correct the difference in pins when spotting the probe and the method of correcting the average distribution of expression levels depending on the expression levels. Reported [Yang, YH et al .: Normalizatio
n for cDNA Microarray Data.SPIE BiOS 2001, San Jo
se, California, January 2001]. However, the use of such correction is still not sufficient.

【0007】[0007]

【発明が解決しようとする課題】本発明は、DNAマイク
ロアレイより得られるデータ(DNAマイクロアレイデー
タともいう)の補正方法、該方法を用いるDNAマイクロ
アレイデータの補正装置、及び該補正装置を組み込んだ
遺伝子発現分析装置を提供することを目的とする。
DISCLOSURE OF THE INVENTION The present invention is directed to a method for correcting data obtained from a DNA microarray (also referred to as DNA microarray data), a DNA microarray data correction apparatus using the method, and gene expression incorporating the correction apparatus. An object is to provide an analyzer.

【0008】[0008]

【課題を解決するための手段】本発明者らは、上記課題
を解決するため鋭意研究を行った結果、一つ一つのデー
タを補正曲線に基づいて補正することにより、単にデー
タ全体を統計的に取り扱う従来の補正方法に比べて精度
の高い補正を行うことが可能であることを見出し本発明
を完成するに至った。すなわち、本発明は、以下の(1)
〜(7)である。
As a result of intensive studies to solve the above-mentioned problems, the inventors of the present invention corrected each data based on a correction curve, and simply statistically calculated the entire data. As a result, they have found that it is possible to perform correction with higher accuracy than the conventional correction method which is dealt with in (1), and thus completed the present invention. That is, the present invention is the following (1)
~ (7).

【0009】(1) 2種類のサンプル間の遺伝子発現レ
ベルの異同を、DNAマイクロアレイを用いて、各遺伝子
毎に調べる場合の、測定データの補正方法であって、以
下の工程:(A) DNAマイクロアレイから得られる2種類
のサンプルの測定データを、各遺伝子毎に平均すること
によって、2種類のサンプル間での各遺伝子の平均発現
量を求める工程、(B) DNAマイクロアレイから得られる
2種類のサンプルの測定データから、各遺伝子毎に測定
データの差をとることによって、2種類のサンプル間の
各遺伝子の発現量の差を求める工程、(C) 工程(A)にお
いて得られる平均発現量と工程(B)において得られる発
現量の差を確率変数とする同時分布を求める工程、及び
(D) 工程(C)おいて得られる同時分布を事前に判明して
いる分布あるいは統計学的に期待される分布へ変換を行
う工程、を包含することを特徴とする前記DNAマイクロ
アレイデータの補正方法。
(1) A method for correcting measurement data in the case of examining the difference in gene expression level between two kinds of samples for each gene using a DNA microarray, which comprises the following steps: (A) DNA A step of obtaining the average expression level of each gene between the two types of samples by averaging the measurement data of the two types of samples obtained from the microarray, for each gene, (B) the two types of samples obtained from the DNA microarray The process of obtaining the difference in the expression level of each gene between two types of samples by taking the difference of the measurement data for each gene from the measurement data of the sample, and (C) the average expression level obtained in step (A) A step of obtaining a joint distribution with the difference in expression amount obtained in step (B) as a random variable, and
(D) a step of converting the simultaneous distribution obtained in step (C) into a distribution known in advance or a distribution expected statistically, correction of the DNA microarray data, Method.

【0010】(2) 同時分布が、条件付き分布であるこ
とを特徴とする上記(1)のDNAマイクロアレイデータの補
正方法。 (3) 条件付き分布が、誤差分布であることを特徴とす
る上記(2)のDNAマイクロアレイデータの補正方法。 (4) 誤差分布が、正規分布であることを特徴とする上
記(3)のDNAマイクロアレイデータの補正方法。
(2) The method for correcting DNA microarray data according to (1) above, wherein the simultaneous distribution is a conditional distribution. (3) The method for correcting DNA microarray data according to (2) above, wherein the conditional distribution is an error distribution. (4) The method for correcting DNA microarray data according to (3) above, wherein the error distribution is a normal distribution.

【0011】(5) 上記(1)〜(4)のいずれかのDNAマイク
ロアレイデータの補正方法を実行するためのプログラム
を記録した記録媒体。 (6) 上記(5)の記録媒体を格納したDNAマイクロアレイ
データ補正装置。 (7) 上記(6)のDNAマイクロアレイデータ補正装置を組
み込んだ遺伝子発現分析装置。以下、本発明を詳細に説
明する。
(5) A recording medium recording a program for executing the method for correcting DNA microarray data according to any one of (1) to (4) above. (6) A DNA microarray data correction device containing the recording medium of (5) above. (7) A gene expression analysis device incorporating the DNA microarray data correction device of (6) above. Hereinafter, the present invention will be described in detail.

【0012】[0012]

【発明の実施の形態】本発明者らは、従来の補正方法の
精度が十分ではなかった理由の一つとして、大量にデー
タを取得するために用意されたDNAマイクロアレイ上の
各プローブの検出精度などの特性が均一ではないにも関
わらず、そこから得られるデータ全体が一つの確率変数
に従うとみなしている点が挙げられることに注目した。
そこで、一つ一つのデータを、以下に記載の方法によっ
て補正することにより、単にデータ全体を統計的に取り
扱う従来の補正方法に比べて高い精度で補正することに
成功した。すなわち、本発明の補正方法は、マイクロア
レイで得られる発現データを、各プローブ毎に平均発現
量および発現量の差を計算し、平均発現量と発現量の差
を確率変数とする同時分布を計算し、その分布を事前に
分かっている分布あるいは統計学的に期待される分布へ
変換を行うことで、発現データを補正する方法である。
ここで、「確率変数」とは、どのような値を具体的に取
るかが確率的に定まるような変数をいい、「同時分布」
とは、2つ以上の確率変数の取りうる値の組とその値の
組の生起確率との対応の様子をいう。本発明の補正方法
をより具体的に説明すると以下のようになる。
BEST MODE FOR CARRYING OUT THE INVENTION One of the reasons why the accuracy of the conventional correction method is not sufficient is that the detection accuracy of each probe on the DNA microarray prepared for acquiring a large amount of data is as follows. Although the characteristics such as are not uniform, we have pointed out that the entire data obtained from them are regarded as subject to one random variable.
Therefore, by correcting each piece of data by the method described below, it has succeeded in correcting with high accuracy as compared with the conventional correction method in which the entire data is simply treated statistically. That is, the correction method of the present invention calculates the expression data obtained by the microarray, calculates the average expression level and the difference between the expression levels for each probe, and calculates the joint distribution using the difference between the average expression level and the expression level as a random variable. Then, the expression data is corrected by converting the distribution into a distribution known in advance or a distribution expected statistically.
Here, the "random variable" is a variable whose value is stochastically determined, specifically, the "simultaneous distribution".
The term "corresponding to a set of values that two or more random variables can take" and the occurrence probability of the set of values. The correction method of the present invention will be described more specifically as follows.

【0013】DNAマイクロアレイにより得られた2種類
のサンプル(例えば、正常マウス由来の細胞サンプルと
特定遺伝子を破壊したマウス由来の細胞サンプル)の同
一遺伝子の発現量のデータをそれぞれX1,Y1とする。こ
こでは、1つのデータ対で説明を行うが、実際には得ら
れたすべてのデータに対して同様な操作を行う必要があ
る。2種類のサンプルは通常一方が調べたいサンプル
で、もう一方が基準となるコントロールのサンプルであ
る。実験系および測定系により発現量の測定値は影響を
受ける。補正曲線が得られている場合には、以下の様に
補正曲線f(x)およびg(x)によって補正が出来る。
The data of the expression level of the same gene in two kinds of samples (for example, a cell sample derived from a normal mouse and a cell sample derived from a mouse in which a specific gene is destroyed) obtained by the DNA microarray are defined as X1 and Y1, respectively. Here, one data pair will be described, but it is actually necessary to perform the same operation on all the obtained data. Of the two types of samples, one is usually the sample to be investigated and the other is the control sample. The measurement value of the expression level is influenced by the experimental system and the measurement system. When the correction curve is obtained, it can be corrected by the correction curves f (x) and g (x) as follows.

【0014】[0014]

【数1】 [Equation 1]

【0015】[0015]

【数2】 [Equation 2]

【0016】ここでX0,Y0は補正によって得られた、実
験系および測定系による影響を受ける前の発現量であ
る。解析においては、2つのサンプル間で発現量に違い
があるかどうかを調べることが重要であり、X1,Y1をそ
のまま解析するよりも変数変換を行い注目すべき変化の
部分と変化と関係ない部分に分ける。その結果注目すべ
き違いのある部分は発現量の差、変化と関係ない部分は
平均発現量として表すことができる。補正前の平均発現
量A1および、発現量の差M1は
Here, X0 and Y0 are the expression levels obtained by the correction before being influenced by the experimental system and the measurement system. In the analysis, it is important to check whether there is a difference in the expression level between the two samples, and rather than analyzing X1 and Y1 as they are, variable conversion is performed and the part of the change that should be noted and the part that is not related to the change Divide into As a result, the part having a notable difference can be expressed as the difference in expression level, and the part unrelated to the change can be expressed as the average expression level. The average expression level A1 before correction and the difference in expression level M1 are

【0017】[0017]

【数3】 [Equation 3]

【0018】[0018]

【数4】 で与えられる。[Equation 4] Given in.

【0019】補正した平均発現量A0および、発現量の差
M0は補正曲線f(x)およびg(x)を用いて、
Corrected average expression level A0 and difference in expression level
M0 uses the correction curves f (x) and g (x),

【0020】[0020]

【数5】 [Equation 5]

【0021】[0021]

【数6】 となる。[Equation 6] Becomes

【0022】ここで、A1の周りでテイラー展開し、1次
までの近似を考えると、
Here, considering Taylor expansion around A1 and approximation up to the first order,

【数7】 となる。ここで、f’(A1)、g’(A1)はf(x),g(x)のx=A1
における微係数である。
[Equation 7] Becomes Here, f '(A1) and g' (A1) are x = A1 of f (x) and g (x)
Is a differential coefficient in.

【0023】ここで、測定データは非常にたくさんの発
現量が一度に得られることを利用して、A1,M1の同時分
布p1(a,m)および、同時分布において確率変数aを固定し
て得られる条件付き分布p1(m|a)を考える。式(7)におい
てM1を確率変数とみなすと、条件付き分布p1(m1|a1)は
補正された条件付き分布p0(m0|a1)に比べて、平均値お
よび分散が変化することが分かる。つまり、実験系およ
び測定系による影響を受ける前の真の分布の平均値と分
散が分かれば、補正関数の値f(A1),g(A1)およびその微
係数f’(A1),g’(A1)が分からなくても平均値と分散の
みで補正が行える。ここでa0とa1はほとんど等しいか、
あるいはp0(a,m)はaの変化に対して大きく変化しない、
つまり
Here, the measurement data is obtained by taking advantage of the fact that an extremely large amount of expression is obtained at one time, and the random distribution a is fixed in the simultaneous distribution p1 (a, m) of A1 and M1 and the simultaneous distribution. Consider the resulting conditional distribution p1 (m | a). When M1 is regarded as a random variable in Expression (7), it can be seen that the conditional distribution p1 (m1 | a1) has a different mean value and variance than the corrected conditional distribution p0 (m0 | a1). In other words, if the mean and variance of the true distribution before being affected by the experimental and measurement systems are known, the correction function values f (A1), g (A1) and their differential coefficients f '(A1), g' Even if you do not know (A1), you can correct it only by the average value and variance. Where a0 and a1 are almost equal,
Or p0 (a, m) does not change much with changes in a,
That is

【0024】[0024]

【数8】 を仮定した。[Equation 8] Was assumed.

【0025】具体的な計算としては式(7)を補正関数と
して用いる。まず、データをA1の大きさに従って区間に
分け、区間毎にM1の平均値と分散を計算しリストを作成
する。平均値と分散の計算には計算する区間のデータだ
けでなくその周辺の区間のデータも利用し平滑化した値
を用いることも出来る。これは、平滑値を用いることで
データの統計誤差の影響を減らすことが出来るため有効
である。平滑化としては局所重み付き最小二乗法などが
ある。得られたリストを基に区間毎に真の分布と平均値
および分散が等しくなるように式(7)を用いて補正を行
う。
As a concrete calculation, the equation (7) is used as a correction function. First, the data is divided into sections according to the size of A1, and the average value and variance of M1 are calculated for each section to create a list. For the calculation of the average value and the variance, not only the data of the section to be calculated but also the data of the section around it can be used to use the smoothed value. This is effective because it is possible to reduce the influence of the statistical error of the data by using the smoothed value. As the smoothing, there is a local weighted least squares method or the like. Based on the obtained list, correction is performed using equation (7) so that the true distribution becomes equal to the mean value and variance for each section.

【0026】以上の計算では、説明をわかりやすくする
ためにテイラー展開を行い高次の項を無視しているが、
一般には非線形な変換になる。条件付き分布p0(m|a)の
平均値や分散だけでなく詳しく分布の形が分かれば、非
線形な変換を行い、更に精度の良い補正が行える。補正
はp1(m|a)をp0(m|a)へ変換するような変換関数を求める
ことで行える。一般に、任意の分布から別の任意の分布
への変換関数は2つの分布の下側確率が等しくなる確立
点どうしを対応づけるリストを作成することで求めるこ
とが出来る。まず、平均発現量A1の分布する区間を2以
上の区間に分ける。区間の幅は均一でも不均一でもよ
い。ここでは均一でdAとしておく。
In the above calculation, Taylor expansion is performed and high-order terms are ignored in order to make the explanation easy to understand.
Generally, it is a non-linear transformation. If not only the average value and the variance of the conditional distribution p0 (m | a) but also the shape of the distribution is known in detail, nonlinear conversion can be performed, and more accurate correction can be performed. The correction can be performed by obtaining a conversion function that converts p1 (m | a) into p0 (m | a). In general, a conversion function from an arbitrary distribution to another arbitrary distribution can be obtained by creating a list that associates probability points where the lower probabilities of two distributions are equal. First, the section in which the average expression level A1 is distributed is divided into two or more sections. The width of the section may be uniform or non-uniform. Here, the value is uniform and dA.

【0027】データのうち平均発現量A1が区間[A,A+dA]
にあるような発現量の差M1の集合を取り出す。取り出し
た測定データを昇順にソートすることで、ソートした順
序が分布の下側確率に対応するリストを作成する。ま
た、取り出した測定データの個数Nと同じ個数からなる
分布p0(m|a)に従う下側確率{(1-0.5)/N,…,(N-0.5)/N}
の確率点のリストを作成する。2つのリストを合わせる
ことで、同じ下側確率をもつ確率点が同じ順番になった
確率点の対応リストが作成できる。このリストが、区間
[A,A+dA]での変換関数となる。このリストをすべてのA1
の区間に対して作成することで、全区間の変換関数を求
めることが出来る。
[0027] Of the data, the average expression level A1 is in the interval [A, A + dA]
The set of expression difference M1 as shown in is extracted. By sorting the retrieved measurement data in ascending order, a list whose sorted order corresponds to the lower probability of the distribution is created. In addition, the lower probability {(1-0.5) / N,…, (N-0.5) / N} according to the distribution p0 (m | a) consisting of the same number as the number N of extracted measurement data
Create a list of probability points for. By combining the two lists, it is possible to create a corresponding list of probability points in which the probability points having the same lower probability are in the same order. This list is the interval
It is the conversion function at [A, A + dA]. This list of all A1
By creating for the section of, the conversion function of all the sections can be obtained.

【0028】また、条件付き分布ではなく同時分布p1
(a,m)場合には、条件付き分布p1(m|a)および条件付き分
布p1(a|m)に関して同時分布が収束するまで、上記の変
換を交互に数回繰り返すことで変換しえる。
Further, the simultaneous distribution p1 is used instead of the conditional distribution.
In the case of (a, m), it is possible to transform by repeating the above transformations several times alternately until the simultaneous distributions of the conditional distribution p1 (m | a) and the conditional distribution p1 (a | m) converge. .

【0029】同時分布p0(a,m)が分かっていない場合に
は、実験系および測定系を考慮して最適な同時分布p0
(a,m)の関数形を仮定することで、分布が分かっている
場合と同じ方法で補正を行うことが出来る。大量のデー
タが一度に得られるDNAマイクロアレイでは、発現量の
差がみられない遺伝子が多く存在する。そのため、分布
の形はそのようなデータによって決定されることを考え
ると、条件付き分布p0(m|a)はX0およびY0に生じた誤差
の差の分布と見なせる。多くの場合、誤差や誤差の差の
分布は正規分布として扱うことが出来る。ただし、これ
は本発明で考える誤差分布が正規分布のみに限られるわ
けではない。
When the joint distribution p0 (a, m) is not known, the optimum joint distribution p0 is determined in consideration of the experimental system and the measurement system.
By assuming the functional form of (a, m), the correction can be performed in the same way as when the distribution is known. In DNA microarrays, where a large amount of data can be obtained at one time, there are many genes whose expression levels do not differ. Therefore, considering that the shape of the distribution is determined by such data, the conditional distribution p0 (m | a) can be regarded as the distribution of the error difference between X0 and Y0. In many cases, the distribution of error and error difference can be treated as a normal distribution. However, this does not mean that the error distribution considered in the present invention is not limited to the normal distribution.

【0030】それに比べて、実験系および測定系の特性
を表す補正曲線f(x)およびg(x)を調べ、適切な関数形を
求めることは実験系および測定系の詳細な評価を行う必
要があり困難である。しかし、本発明ではp0(a,m)の分
布の関数形のみを調べるだけで補正が行え、補正曲線を
求める場合に比べて容易である。かつ、上に示した理論
的根拠により補正曲線を用いた場合と同様の精度の改善
が期待される。真の同時分布を事前に調べる方法とし
て、平均発現量の分布は競合的RT-PCRなどを用いて予備
的にいくつかのターゲットの発現量を正確に測定するこ
とで見積もることができ、また、発現量の差の分布はサ
ンプルを調製する際のmRNAの逆転写の精度および、測定
装置の読みとり精度から見積もることができる。また、
発現量の差の分布の形は多くの場合、誤差分布となり適
切に関数形を仮定することも容易である。
On the other hand, it is necessary to examine the correction curves f (x) and g (x) representing the characteristics of the experimental system and the measurement system and obtain an appropriate functional form for detailed evaluation of the experimental system and the measurement system. And difficult. However, in the present invention, the correction can be performed only by examining the functional form of the distribution of p0 (a, m), which is easier than the case of obtaining the correction curve. Moreover, based on the above-mentioned theoretical grounds, it is expected that the accuracy will be improved in the same manner as when the correction curve is used. As a method of examining the true co-distribution in advance, the distribution of average expression levels can be estimated by preliminarily measuring the expression levels of several targets using competitive RT-PCR, etc. The distribution of the difference in expression amount can be estimated from the accuracy of reverse transcription of mRNA when preparing a sample and the reading accuracy of a measuring device. Also,
In many cases, the distribution form of the difference in expression amount is an error distribution, and it is easy to properly assume the functional form.

【0031】図2で示されるフローチャートを参照して
本発明のDNAマイクロアレイデータ補正装置である図1
の動作について説明する。図1において、細胞A由来の
遺伝子1〜Nの各発現データ1〜Nの記憶手段(101)およ
び、細胞B由来の遺伝子1〜Nの各発現データ1〜Nの記憶
手段(102)からデータX1[i],Y1[i]およびプローブ情報ID
[i]の入力を行う(S1)。以後の計算は補正手段(103)に
て行われる。平均発現量A1[i]および、発現量の差M1[i]
を計算する(S2)。ここで、[i]はi番目の遺伝子を表し、
iは1〜Nまでの値をとる。次にA1[i]を区間に分ける区間
数を入力し(S3)、A1[i]を区間毎に分けたA1[j][k]に代
入し(S4)、対応するM1[i]をM1[j][k]に代入する(S5)。
ここで、[j]はA1[i]のj番目の区間を表し、[k]はその区
間のデータに対応づけられる番号を表す。ここで、分布
の平均値と分散によって補正を行う場合と、分布の関数
形を用いた補正を行う場合とで処理を分ける(S6)。分布
の平均値と分散によって補正を行う場合、分布M0の各区
間jでの平均値M0M[j]と分散M0D[j]を入力し(S7)、分布M
1の各区間jでの平均値M1M[j]と分散M1D[j]を計算し(S
8)、補正した分布を計算しM0[j][k]に代入する (S9)。
分布の関数形を用いた補正を行う場合、各区間のM1[j]
[k]の要素の数をN1[j]に代入し(S10)、分布M0の関数形
を入力し(S11)、各区間でのM0の分布の下側確率{(1-0.
5)/N1[j],…,(N1[j]-0.5)/N1[j]}の確率点のリストをM0
Q[j][k]に代入し(S12)、各区間でのM1の分布M1[j][k]を
昇順にソートしたリストをM1S[j][k]に代入し(S13)、補
正した分布を計算しM0[j][k]に代入する(S14)。このよ
うにして得られたM0[j][k]を一次元配列M0[i]に代入し
(S15)、補正した発現量の差M0[i]およびプローブ情報ID
[i]は出力手段(104)を通じて出力する(S16)。
Referring to the flow chart shown in FIG. 2, the DNA microarray data correction apparatus of the present invention is shown in FIG.
The operation of will be described. In FIG. 1, data from the storage means (101) for each expression data 1-N of genes 1-N derived from cell A and the storage means (102) for each expression data 1-N of genes 1-N derived from cell B are shown. X1 [i], Y1 [i] and probe information ID
Input [i] (S1). The subsequent calculation is performed by the correction means (103). Average expression level A1 [i] and expression level difference M1 [i]
Is calculated (S2). Where [i] is the i-th gene,
i takes a value from 1 to N. Next, input the number of sections that divide A1 [i] into sections (S3), substitute A1 [i] into A1 [j] [k] divided for each section (S4), and obtain the corresponding M1 [i] Substitute for M1 [j] [k] (S5).
Here, [j] represents the j-th section of A1 [i], and [k] represents the number associated with the data in that section. Here, the processing is divided into the case where the correction is performed by the average value and the variance of the distribution and the case where the correction is performed using the functional form of the distribution (S6). When correcting with the mean and variance of the distribution, enter the mean M0M [j] and variance M0D [j] in each section j of the distribution M0 (S7), and enter the distribution M
Calculate the mean M1M [j] and variance M1D [j] in each interval j of 1 (S
8) Calculate the corrected distribution and substitute it into M0 [j] [k] (S9).
When performing correction using the functional form of distribution, M1 [j] of each section
Substituting the number of elements of [k] into N1 [j] (S10), inputting the functional form of the distribution M0 (S11), the lower probability of the distribution of M0 in each interval {(1-0.
5) / N1 [j], ..., (N1 [j] -0.5) / N1 [j]}
Substituting into Q [j] [k] (S12), substituting a list of M1 distributions M1 [j] [k] in ascending order into M1S [j] [k] (S13), and correcting The calculated distribution is calculated and substituted into M0 [j] [k] (S14). Substituting M0 [j] [k] thus obtained into one-dimensional array M0 [i]
(S15), corrected expression difference M0 [i] and probe information ID
[i] is output through the output means (104) (S16).

【0032】なお、以上説明した図2の処理を実現する
ためのプログラムを記録した記録媒体を用意し、同記録
媒体の記録されているプログラムによってコンピュータ
を制御すれば、上記と同様にDNAマイクロアレイデータ
の補正を行うことができることは明白である。この記録
媒体には、半導体メモリ、磁気ディスク装置の他、種々
の記録媒体を用いることができる。
If a recording medium recording a program for realizing the above-described processing of FIG. 2 is prepared and the computer is controlled by the program recorded in the recording medium, the DNA microarray data will be obtained in the same manner as above. It is clear that a correction of can be made. As the recording medium, various recording media other than the semiconductor memory and the magnetic disk device can be used.

【0033】なお、図1に示したDNAマイクロアレイデ
ータ補正装置はDNAマイクロアレイシステムに組み込
み、遺伝子発現分析装置として構築することが可能であ
る。
The DNA microarray data correction device shown in FIG. 1 can be incorporated into a DNA microarray system to construct a gene expression analysis device.

【0034】[0034]

【実施例】以下に、本発明の実施例を示して具体的に説
明するが、本発明の範囲はこれらに限定されるものでは
ない。 〔実施例1〕 本発明の補正方法によるDNAマイクロア
レイデータの補正 本発明の補正方法により、DNAマイクロアレイデータを
補正した。DNAマイクロアレイデータとしては、webサイ
トhttp://www.stat.berkeley.edu/users/terry/zarray/
Html/apodata.htmlに公開されている測定データを使用
した。このデータは、サンプル供給源として、アポリポ
タンパク質AIの遺伝子をノックアウトしたマウスおよび
正常なマウスを用いた実験で得られたものである。具体
的には、一枚のDNAマイクロアレイに対し、異なる蛍光
色素で標識した前記2種類のサンプルのmRNAから調製さ
れたターゲットを競合的ハイブリダイゼーションし、発
現量の違いを相対的に比較したものである。得られるデ
ータは各スポット毎に2種類の蛍光強度であり、発現量
の差が強度の差として反映される。
EXAMPLES Examples of the present invention will be specifically described below, but the scope of the present invention is not limited thereto. [Example 1] Correction of DNA microarray data by the correction method of the present invention DNA microarray data was corrected by the correction method of the present invention. For DNA microarray data, see the website http://www.stat.berkeley.edu/users/terry/zarray/
The measurement data published in Html / apodata.html was used. This data was obtained from an experiment using a knockout mouse of apolipoprotein AI gene and a normal mouse as a sample source. Specifically, the target prepared from the mRNAs of the two kinds of samples labeled with different fluorescent dyes was competitively hybridized with one DNA microarray, and the difference in the expression level was relatively compared. is there. The data obtained are two types of fluorescence intensity for each spot, and the difference in expression level is reflected as the difference in intensity.

【0035】データは各スポット毎に2種類の蛍光強度
が数値化されている(この2種類のデータをCy5,Cy3と
呼ぶ)。補正を行わないデータを図3に示した。図3に
おいて、横軸は、各スポット毎のCy5,Cy3の蛍光強度のL
og2の平均値(平均発現量)であり、以下の式により算
出される。
Two kinds of fluorescence intensity are digitized for each spot in the data (these two kinds of data are referred to as Cy5 and Cy3). The data without correction is shown in FIG. In FIG. 3, the horizontal axis is L of the fluorescence intensity of Cy5 and Cy3 for each spot.
It is the average value (average expression level) of og2, and is calculated by the following formula.

【0036】[0036]

【数9】 [Equation 9]

【0037】縦軸は、各スポット毎のCy5,Cy3の蛍光強
度のLog2の差(発現量の差)であり、以下の式により算
出される。
The vertical axis represents the difference in Log2 of fluorescence intensity of Cy5 and Cy3 for each spot (difference in expression level), which is calculated by the following formula.

【0038】[0038]

【数10】 [Equation 10]

【0039】このデータに対し、同じピンでスポットさ
れたデータ毎にMの局所重み付き最小二乗法による平滑
値を求めMから引いたデータが図4であり、これはYang
ら[Y. H. Yang, S. Dudoit, P. Luu and T. P. Speed.
Normalization for cDNA Microarray Data. SPIE BiOS
2001, San Jose, California, January 2001]の提案す
る解析である。
FIG. 4 shows the data obtained by finding the smoothed value of M by the local weighted least squares method for each data spotted on the same pin and subtracting it from M for this data.
Et al [YH Yang, S. Dudoit, P. Luu and TP Speed.
Normalization for cDNA Microarray Data. SPIE BiOS
2001, San Jose, California, January 2001].

【0040】本発明の補正方法を用いた場合の結果を次
に示す。データMは平均発現量Aに依存せず、平均がゼ
ロで分散も一定であると仮定する。これは発明の実施の
形態で示した正規分布を誤差分布とする自然な仮定であ
る。この仮定の下、まず、Yangらの提案する補正で平均
値をゼロにし、次に、Mの分散をAに依存せず一定にす
るために、Mの絶対値の局所重み付き最小二乗法による
平滑値を求めMをその平滑値で割り分散のA依存性を取
り除いた。更に、全体の分散が補正前のデータと変わら
ないように適切な値を掛けて得られたデータが図5であ
る。
The results of using the correction method of the present invention are shown below. The data M does not depend on the average expression level A, and it is assumed that the average is zero and the variance is constant. This is a natural assumption that the normal distribution shown in the embodiment of the invention is the error distribution. Under this assumption, first, in order to make the average value zero by the correction proposed by Yang et al., And then to make the variance of M constant independent of A, the local weighted least squares method of the absolute value of M is used. A smooth value was obtained and M was divided by the smooth value to remove the A dependence of the variance. Further, FIG. 5 shows data obtained by multiplying by an appropriate value so that the overall variance does not change from the data before correction.

【0041】図4と図5において、菱形(◆)は発現量
の差の絶対値が大きい上位5%のデータである。Yangら
の補正を行った図4に比べて本発明での補正を行った図
5ではAの広い範囲にわたって発現量の差の絶対値が大
きい点を選び出せることが分かる。本発明を用いるとプ
ローブの設計ミスや技術的困難により平均発現量が低く
なってしまったり逆に大きすぎてしまい、発現量の差が
小さいデータに対しても変化の情報を引き出すことが出
来る。
In FIGS. 4 and 5, the diamonds (♦) are the top 5% data in which the absolute value of the difference in expression level is large. In FIG. 5 corrected by the present invention as compared with FIG. 4 corrected by Yang et al., It can be seen that a point where the absolute value of the difference in expression level is large over a wide range of A can be selected. When the present invention is used, the average expression level becomes too low or conversely too large due to a design error of the probe or technical difficulty, and it is possible to extract information of change even for data with a small difference in expression level.

【0042】次に複数のアレイデータを用いてノックア
ウトマウスと正常なマウスで発現量に差が出ている遺伝
子を統計的手法で調べるために各スポット毎にt値を求
め、t値の実際の分布と理論分布であるt分布を用いて
確率点−確率点プロットを行ったのが図6と図7であ
る。なお、「t値」とは、2組のデータの集まりの平均
値が等しいかどうかを検定するt検定をおこなうことで
得られる値であり、t値の絶対値が大きいほどt値から
求まるP値が小さくなる。P値が小さくなればなるほど
2組のデータの集まりの平均値が異なっている確率が高
くなることを意味する。また、t値とP値を対応づける
関数をt分布とよぶ。図6はYangらの提案する補正を行
った場合の結果で、図7が本発明による補正の結果であ
る。2つの図を見比べると本発明による結果の方が、直
線部分と直線からはずれた点の区別がはっきりすること
が分かる。表1にt値が小さい順に12個の遺伝子のt値
およびP値を挙げた。図6では直線の左側に少しずれた
点が4点あり(表1のNo.8,9,10,11)、判別が困難であ
る。図7では4点のうち3点は直線上に乗り1点は直線
からずれていることがはっきりした。この場合、直線か
らずれた1点は、残りの3点とは異なる性質のデータであ
ると判断できる。直線からはずれた点はt分布からはず
れていることを意味し、ノックアウトマウスと正常なマ
ウスで発現量に差があると結論づけられる。つまり、統
計的に有意に発現量が変化しているかどうかを、t検定
および、そのt値の分布のはずれ値の検定で、より精度
の良い判別が出来ることを示している。
Next, using a plurality of array data, the t value was obtained for each spot in order to investigate the gene whose expression level was different between the knockout mouse and the normal mouse by a statistical method, and the actual t value was calculated. 6 and 7 are plots of probability points-probability points using the distribution and the t distribution which is the theoretical distribution. The “t value” is a value obtained by performing a t-test that tests whether or not the average values of two sets of data are equal, and the greater the absolute value of the t-value, the more the P-value obtained from the t-value. The value becomes smaller. It means that the smaller the P value is, the higher the probability that the average values of the two sets of data are different. A function that associates the t value with the P value is called a t distribution. FIG. 6 shows the result of the correction proposed by Yang et al., And FIG. 7 shows the result of the correction according to the present invention. Comparing the two figures, it can be seen that the result according to the present invention clearly distinguishes the straight line portion and the point deviated from the straight line. Table 1 lists t values and P values of 12 genes in ascending order of t value. In FIG. 6, there are four points on the left side of the straight line that are slightly displaced (Nos. 8, 9, 10, and 11 in Table 1), and it is difficult to distinguish them. In FIG. 7, it is clear that 3 out of 4 points are on the straight line and 1 point is off the straight line. In this case, one point deviated from the straight line can be judged to be data having a different property from the remaining three points. A point deviating from the straight line means that it is out of the t distribution, and it can be concluded that there is a difference in the expression level between the knockout mouse and the normal mouse. That is, it is shown that whether or not the expression level is statistically significantly changed can be discriminated with higher accuracy by the t-test and the outlier of the distribution of the t-values.

【0043】以上により、本発明のDNAマイクロアレイ
データ補正方法が従来の補正方法に比べてより高い精度
の補正方法であることが判明した。
From the above, it was found that the DNA microarray data correction method of the present invention has a higher accuracy than the conventional correction method.

【0044】[0044]

【表1】 [Table 1]

【0045】[0045]

【発明の効果】本発明により、DNAマイクロアレイから
得られる生データの、より精度の高い補正方法、該方法
を用いるDNAマイクロアレイデータの補正装置、及び該
補正装置を組み込んだ遺伝子発現分析装置が提供され
る。本発明の方法により、DNAマイクロアレイ等のハー
ドウエアの改良による測定精度の向上と同様の効果が得
られる。本発明の補正方法を現在までに蓄積されている
DNAマイクロアレイの生データに適用することによっ
て、新たに実験をやり直すことなく、既に得られている
データから、より信頼性の高い遺伝子発現情報を入手す
ることが可能である。
EFFECTS OF THE INVENTION The present invention provides a method for correcting raw data obtained from a DNA microarray with higher accuracy, a correction device for DNA microarray data using the method, and a gene expression analyzer incorporating the correction device. It According to the method of the present invention, the same effect as the improvement of measurement accuracy by the improvement of hardware such as a DNA microarray can be obtained. The correction method of the present invention has been accumulated to date.
By applying it to the raw data of the DNA microarray, it is possible to obtain more reliable gene expression information from the already obtained data without performing a new experiment.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のDNAマイクロアレイデータ補正装置の
一態様を示すブロック図である。
FIG. 1 is a block diagram showing one embodiment of a DNA microarray data correction device of the present invention.

【図2】実施例の動作を示すフローチャートを示した図
である。
FIG. 2 is a diagram showing a flowchart showing the operation of the embodiment.

【図3】補正なしの生データの平均発現量と発現量の差
のプロットを示した図である。
FIG. 3 is a diagram showing a plot of the difference between the average expression level and the expression level of raw data without correction.

【図4】平均値を補正したデータの平均発現量と発現量
の差のプロットを示した図である。
FIG. 4 is a diagram showing a plot of the difference between the average expression level and the expression level of the data whose average value is corrected.

【図5】平均値と分散を補正したデータの平均発現量と
発現量の差のプロットを示した図である。
FIG. 5 is a diagram showing a plot of the difference between the average expression level and the expression level of the data in which the average value and the variance are corrected.

【図6】平均値を補正したデータから求めたt値の確率
点−確率点プロットを示した図である。
FIG. 6 is a diagram showing a probability point-probability point plot of t-values obtained from data with corrected average values.

【図7】平均値と分散を補正したデータから求めたt値
の確率点−確率点プロットを示した図である。
FIG. 7 is a diagram showing a probability point-probability point plot of t-values obtained from data obtained by correcting mean values and variances.

【符号の説明】[Explanation of symbols]

101細胞A由来の遺伝子1〜Nの各発現データ1〜Nの記憶
手段 102 細胞B由来の遺伝子1〜Nの各発現データ1〜N
の記憶手段 103 補正手段 104 出力手段
101 Means for storing expression data 1-N of genes 1-N derived from cell A 102 Expression data 1-N of genes 1-N derived from cell B
Storage means 103 correction means 104 output means

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G01N 37/00 102 C12N 15/00 F Fターム(参考) 4B024 AA11 CA01 HA12 HA19 4B029 AA07 AA21 AA23 BB20 CC03 FA10 FA15 4B063 QA01 QA12 QA17 QA18 QQ03 QQ13 QQ42 QR32 QR38 QR56 QR80 QR82 QS25 QS34 QS39 QX02 ─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) G01N 37/00 102 C12N 15/00 FF term (reference) 4B024 AA11 CA01 HA12 HA19 4B029 AA07 AA21 AA23 BB20 CC03 FA10 FA15 4B063 QA01 QA12 QA17 QA18 QQ03 QQ13 QQ42 QR32 QR38 QR56 QR80 QR82 QS25 QS34 QS39 QX02

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 2種類のサンプル間の遺伝子発現レベル
の異同を、DNAマイクロアレイを用いて、各遺伝子毎に
調べる場合の、測定データの補正方法であって、以下の
工程: (A) DNAマイクロアレイから得られる2種類のサンプル
の測定データを、各遺伝子毎に平均することによって、
2種類のサンプル間での各遺伝子の平均発現量を求める
工程、(B) DNAマイクロアレイから得られる2種類のサ
ンプルの測定データから、各遺伝子毎に測定データの差
をとることによって、2種類のサンプル間の各遺伝子の
発現量の差を求める工程、(C) 工程(A)において得られ
る平均発現量と工程(B)において得られる発現量の差を
確率変数とする同時分布を求める工程、及び(D) 工程
(C)おいて得られる同時分布を事前に判明している分布
あるいは統計学的に期待される分布へ変換を行う工程、
を包含することを特徴とする前記DNAマイクロアレイデ
ータの補正方法。
1. A method for correcting measurement data, wherein the difference in gene expression level between two types of samples is examined for each gene using a DNA microarray, which comprises the following steps: (A) DNA microarray By averaging the measurement data of the two types of samples obtained from
The step of obtaining the average expression level of each gene between the two types of samples, (B) by measuring the difference of the measurement data for each gene from the measurement data of the two types of samples obtained from the DNA microarray A step of obtaining a difference in the expression amount of each gene between samples, (C) a step of obtaining a simultaneous distribution using a difference between the average expression amount obtained in step (A) and the expression amount obtained in step (B) as a random variable, And (D) process
(C) converting the joint distribution obtained in advance into a distribution known in advance or a statistically expected distribution,
The method for correcting DNA microarray data, which comprises:
【請求項2】 同時分布が、条件付き分布であることを
特徴とする請求項1記載のDNAマイクロアレイデータの
補正方法。
2. The method for correcting DNA microarray data according to claim 1, wherein the simultaneous distribution is a conditional distribution.
【請求項3】 条件付き分布が、誤差分布であることを
特徴とする請求項2記載のDNAマイクロアレイデータの
補正方法。
3. The method for correcting DNA microarray data according to claim 2, wherein the conditional distribution is an error distribution.
【請求項4】 誤差分布が、正規分布であることを特徴
とする請求項3記載のDNAマイクロアレイデータの補正
方法。
4. The method for correcting DNA microarray data according to claim 3, wherein the error distribution is a normal distribution.
【請求項5】 請求項1〜4のいずれかに記載のDNAマ
イクロアレイデータの補正方法を実行するためのプログ
ラムを記録した記録媒体。
5. A recording medium recording a program for executing the method for correcting DNA microarray data according to any one of claims 1 to 4.
【請求項6】 請求項5記載の記録媒体を格納したDNA
マイクロアレイデータ補正装置。
6. A DNA containing the recording medium according to claim 5.
Microarray data correction device.
【請求項7】 請求項6記載のDNAマイクロアレイデー
タ補正装置を組み込んだ遺伝子発現分析装置。
7. A gene expression analysis device incorporating the DNA microarray data correction device according to claim 6.
JP2001212910A 2001-07-12 2001-07-12 Dna microarray data correcting method Pending JP2003028862A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001212910A JP2003028862A (en) 2001-07-12 2001-07-12 Dna microarray data correcting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001212910A JP2003028862A (en) 2001-07-12 2001-07-12 Dna microarray data correcting method

Publications (1)

Publication Number Publication Date
JP2003028862A true JP2003028862A (en) 2003-01-29

Family

ID=19047982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001212910A Pending JP2003028862A (en) 2001-07-12 2001-07-12 Dna microarray data correcting method

Country Status (1)

Country Link
JP (1) JP2003028862A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006098202A (en) * 2004-09-29 2006-04-13 Fuji Photo Film Co Ltd Method, apparatus and program for correcting fluorescence image
WO2006051670A1 (en) * 2004-11-15 2006-05-18 Sony Corporation Gene expression level standardization method, program, and system
WO2006064631A1 (en) * 2004-12-13 2006-06-22 Sony Corporation Method, program and system for the standardization of gene expression amount
WO2007004693A1 (en) * 2005-06-30 2007-01-11 Canon Kabushiki Kaisha Probe-immobilized carrier storing manufacturing condition data and manufacturing method and apparatus thereof, detecting method of target substance by use of the probe-immobilized carrier, and measuring apparatus, recording medium, kit and system for use in the detecting method
JP2008082876A (en) * 2006-09-27 2008-04-10 Toray Ind Inc Analyzer and correcting method
JP2017091277A (en) * 2015-11-11 2017-05-25 チトセ バイオ エボリューション ピーティーイー リミテッド Gene selection method capable of classifying cell
WO2018168580A1 (en) * 2017-03-13 2018-09-20 日本電気株式会社 Relation search system, information processing device, method, and program

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006098202A (en) * 2004-09-29 2006-04-13 Fuji Photo Film Co Ltd Method, apparatus and program for correcting fluorescence image
WO2006051670A1 (en) * 2004-11-15 2006-05-18 Sony Corporation Gene expression level standardization method, program, and system
JP2006138823A (en) * 2004-11-15 2006-06-01 Sony Corp Method for standardizing expressed amount in gene, program, and system
WO2006064631A1 (en) * 2004-12-13 2006-06-22 Sony Corporation Method, program and system for the standardization of gene expression amount
JP2006170670A (en) * 2004-12-13 2006-06-29 Sony Corp Standardization method for gene expression level, program and system
WO2007004693A1 (en) * 2005-06-30 2007-01-11 Canon Kabushiki Kaisha Probe-immobilized carrier storing manufacturing condition data and manufacturing method and apparatus thereof, detecting method of target substance by use of the probe-immobilized carrier, and measuring apparatus, recording medium, kit and system for use in the detecting method
JP2008082876A (en) * 2006-09-27 2008-04-10 Toray Ind Inc Analyzer and correcting method
JP2017091277A (en) * 2015-11-11 2017-05-25 チトセ バイオ エボリューション ピーティーイー リミテッド Gene selection method capable of classifying cell
WO2018168580A1 (en) * 2017-03-13 2018-09-20 日本電気株式会社 Relation search system, information processing device, method, and program
JPWO2018168580A1 (en) * 2017-03-13 2020-01-23 日本電気株式会社 Relationship search system, information processing apparatus, method and program
JP7103341B2 (en) 2017-03-13 2022-07-20 日本電気株式会社 Relationship search system, information processing device, method and program

Similar Documents

Publication Publication Date Title
Berger et al. Optimized LOWESS normalization parameter selection for DNA microarray data
Brás et al. Improving cluster-based missing value estimation of DNA microarray data
US20050282227A1 (en) Treatment discovery based on CGH analysis
WO2000022173A1 (en) Quantitative analysis of hybridization patterns and intensities in oligonucleotide arrays
Reimers Statistical analysis of microarray data
Roth Quantifying gene expression
US20030065449A1 (en) Calibration of molecular array data
Wu A review of statistical methods for preprocessing oligonucleotide microarrays
JP2003028862A (en) Dna microarray data correcting method
US20070172833A1 (en) Gene expression profile retrieving apparatus, gene expression profile retrieving method, and program
CN104115151A (en) Methods for identifying agents with desired biological activity
US20030194711A1 (en) System and method for analyzing gene expression data
US20030233196A1 (en) Method for processing expression data of genes
Kim et al. Effect of local background intensities in the normalization of cDNA microarray data with a skewed expression profiles
JPWO2021113749A5 (en)
US7881876B2 (en) Methods and systems for removing offset bias in chemical array data
US20070203653A1 (en) Method and system for computational detection of common aberrations from multi-sample comparative genomic hybridization data sets
US20070031883A1 (en) Analyzing CGH data to identify aberrations
EP1190366B1 (en) Mathematical analysis for the estimation of changes in the level of gene expression
Brown et al. Quantification of sources of variation and accuracy of sequence discrimination in a replicated microarray experiment
US6994965B2 (en) Method for displaying results of hybridization experiment
Huang et al. GenXHC: a probabilistic generative model for cross-hybridization compensation in high-density genome-wide microarray data
JP4266575B2 (en) Gene expression data processing method and processing program
Zhang et al. Identical probes on different high-density oligonucleotide microarrays can produce different measurements of gene expression
Park et al. Diagnostic plots for detecting outlying slides in a cDNA microarray experiment