JP4893194B2 - 解析装置、および補正方法 - Google Patents

解析装置、および補正方法 Download PDF

Info

Publication number
JP4893194B2
JP4893194B2 JP2006263011A JP2006263011A JP4893194B2 JP 4893194 B2 JP4893194 B2 JP 4893194B2 JP 2006263011 A JP2006263011 A JP 2006263011A JP 2006263011 A JP2006263011 A JP 2006263011A JP 4893194 B2 JP4893194 B2 JP 4893194B2
Authority
JP
Japan
Prior art keywords
logarithmic
selective binding
ratio
analysis
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006263011A
Other languages
English (en)
Other versions
JP2008082876A (ja
Inventor
史緒里 友田
英雄 秋山
聡子 小園
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toray Industries Inc
Original Assignee
Toray Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toray Industries Inc filed Critical Toray Industries Inc
Priority to JP2006263011A priority Critical patent/JP4893194B2/ja
Publication of JP2008082876A publication Critical patent/JP2008082876A/ja
Application granted granted Critical
Publication of JP4893194B2 publication Critical patent/JP4893194B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Description

本発明は、解析装置、および補正方法に関し、特に、マイクロアレイ実験等において二蛍光標識法等から得られるデータを解析する解析装置、および、そのデータの補正方法に関する。
近年、マイクロアレイ実験やマクロアレイ実験等の技術発展により、膨大な量の遺伝子を網羅的に解析することが可能となった。マイクロアレイ実験等においては、検査対象として膨大な量の遺伝子を扱うため、演算処理装置をベースとした解析装置が用いられる。
解析装置は、マイクロアレイ実験においては複雑な工程等の高度な実験技術に基づく種々の理由に起因する測定誤差や偏り誤差が発生するため、データを補正して解析する手段を備えることが必須となる(例えば、特許文献1)。たとえば、マイクロアレイ実験の代表的な実験解析手法として二蛍光標識法が挙げられるが、二蛍光標識法における測定には、蛍光の平均検出強度に依存した偏り誤差が発生する。そのため、偏り誤差を適切に除去する補正手段を備えているか否かが、解析装置の解析精度を左右する。
従来、解析装置による偏り誤差等の補正手段としては、特許文献1、2または3に記載の補正手段のように、平均検出強度をその値により複数の区画に分け、それぞれの区画で平均値や中央値を算出し差分して補正する手段が存在する。また、特許文献4に記載の補正手段として、平均曲線を用いて補正する手段が公開されている。
しかしながら、従来の解析装置または補正方法では、偏り誤差に起因する差異を十分に除去することができず補正の精度が低いという問題があった。すなわち、特許文献1、2または3に記載の補正方法では、複数の区画に分画し補正を行うため、区画と区画の境界付近で補正の誤差が大きくなってしまうという問題があった。また、特許文献4に記載の補正方法では、平均曲線のデータに対する当てはまり具合が悪いという問題があった。
データに関数を当てはめる方法として回帰分析が考えられるが、請求項5に記載の発明は、遺伝子の機能的関連性を検出しようとするものであり、補正の手段として応用することができないという問題がある。
ここで、回帰分析を用いた従来法における補正処理の例について図1および図2を参照しながら説明する。図1は、従来技術における解析装置の補正処理の一例を示すフローチャートである。
まず、図1に示すように、従来の解析装置において、制御装置は、記憶装置に記憶された検出強度値を読み込む(ステップSA−1)。
つぎに、従来の解析装置において、制御装置は、検出強度値からバックグラウンド値を減算する(ステップSA−2)。例えば、全く結合対象となる被検査物質がないプローブ等を選択結合性物質として用いて担体に接触させ、制御装置は、プローブを配置した部分の検出強度値をバックグラウンド値として減ずるよう構成する等である。
つづいて、従来の解析装置において、制御装置は、記憶装置に記憶された検出強度値に基づいて、下記の数式1および数式2を用いて、2群間における対数比M(k)と対数幾何平均A(k)とに変換する(ステップSA−3)。
M(k)=log2(C1k/C2k) ・・・(数式1)
A(k)=log2(C1k・C2k0.5 ・・・(数式2)
ここで、kは任意の選択結合性物質を表し、C1kおよびC2kは、それぞれ異なる2種類の標識の検出強度値である。
そして、従来の解析装置においては、制御装置は、全選択結合性物質についての対数比または対数幾何平均について、重み付き局所回帰法(Lowess法:LOcally WEighted Scatter plot Smooth)を用いて、誤差推定のためのLowess曲線を求める(ステップSA−4)。
つづいて、従来の解析装置において、制御装置は、得られたLowess曲線に基づいて、対数幾何平均に依存した対数比の偏り誤差を推定する(ステップSA−5)。
最後に、従来の解析装置において、制御装置は、得られた偏り誤差を、各選択結合性物質についての対数比から減算する(ステップSA−6)。
ここで、補正前の選択的結合量に係る2群間の差異は以下のように表すことができる。すなわち、「差異=生物学的要因に基づく差異(生物学的差異)+非生物学的要因に基づく差異(非生物学的差異)」である。そして、補正処理において目的とするのは、非生物学的差異の推定と除去である。
特開2003−256407号公報 特開2005−106755号公報 特開2003−028862号公報 特開2003−185659号公報 国際公開第02/048915号パンフレット
しかしながら、従来法における補正処理を実行した場合、局所回帰の際のウィンドウサイズ(データポイント数)が小さい場合には、生物学的差異を非生物学的差異とみなしてしまうという問題がある。ここで、図2は、上記従来法における補正処理を実行して、補正のためのLowess曲線を求めた場合のMA(横軸:A値、縦軸:M値)プロット図である。
すなわち、図2に示すように、ウィンドウサイズが小さい範囲(8≧A≧9付近、および、A≧12付近)においては、従来法においては、比較的M値の大きいプロットに引っ張られて、Lowess曲線が歪に変形してしまう。すなわち、従来法における補正処理によっては、生物学的差異を非生物学的差異とみなしてしまうという問題がある。
通常の網羅型のマイクロアレイ(搭載遺伝子数:数千〜数万遺伝子)であれば、ウィンドウサイズを小さくしても、生物学的変動(生物学的変動)がない遺伝子が大半であるので、このような問題は発生しない(または無視できるほど小さい)。しかしながら、本出願人が開発したマイクロアレイ(搭載遺伝子数:数百〜1000遺伝子程度)の場合には、網羅型マイクロアレイに比べて全体に占める生物学的差異が期待される遺伝子の割合が高くなるため、従来の補正処理方法では、生物学的差異と偏り誤差等により生ずる非生物学的差異を十分に分離することができず、解析精度が悪いという問題がある。
要約すれば、従来、膨大な数の遺伝子を対象とするマイクロアレイ実験等においては、二色蛍光法等による検出結果を解析しようとする際に、全体のうち2種類の組織または細胞の間で発現量に差がある遺伝子は僅かであるとの考えから、発現変化がデータに含まれることを無視して全遺伝子を対象とする補正用の関数やパラメータを求めてきた。しかしながら、例えば特定疾患専用のマイクロアレイを設計する場合等においては、検査対象となる遺伝子数はコントロールを含めても数百程度に限られるので、全体のうち発現量に差がある目的遺伝子の割合が大きくなり、補正用の関数やパラメータを求める上で標本誤差が大きくなるという問題があった。
本発明は、上記に鑑みてなされたもので、マイクロアレイ実験等から得られるデータから、生物学的差異と偏り誤差により生ずる非生物学的差異を分離することができる補正方法、およびその補正方法を用いて解析精度を高めた解析装置を提供することを目的とする。
このような目的を達成するため、請求項1または請求項5にそれぞれ記載の解析装置または補正方法は、異なる条件の細胞から得られた被検査物質の2群にそれぞれ異なる2種類の標識を付し、多種類の既知の選択結合性物質を整列固定化した担体に当該被検査物質を接触させ、上記選択結合性物質に対する上記被検査物質の選択的結合量を上記標識の検出強度値として測定することにより得られる、上記選択的結合量の上記2群間における差異を検査する、少なくとも記憶装置と制御装置とを備えた解析装置、または当該解析装置において実行される方法であって、上記記憶装置は、上記選択結合性物質毎に上記検出強度値を記憶する検出強度記憶手段を備え、上記制御装置は、上記検出強度記憶手段に記憶された上記検出強度値に基づいて、下記の数式1および数式2を用いて、上記2群間における対数比M(k)と対数幾何平均A(k)とに変換する対数変換手段(ステップ)と、上記対数幾何平均に依存した上記対数比の偏り誤差を、上記2群間において存在比が同一である上記被検査物質に係る上記対数比および上記対数幾何平均の集合について下記の数式3に基づく多項式回帰分析を行うことにより、推定する誤差推定手段(ステップ)と、上記誤差推定手段(ステップ)によって推定された上記偏り誤差を、上記選択結合性物質毎の上記対数比から減ずることにより補正対数比を導出する対数比補正手段(ステップ)と、を備えた(含む)ことを特徴とする。
M(k)=log2(C1k/C2k) ・・・(数式1)
A(k)=log2(C1k・C2k0.5 ・・・(数式2)
(ここで、kは任意の上記選択結合性物質を表し、C1kおよびC2kは、それぞれ異なる上記2種類の標識の上記検出強度値である。)
y=a0+a1x+a22+a33+ ・・・ann+e ・・・(数式3)
(ここで、xは説明変数であり、yは目的変数であり、aは定数であり、eは残差である。)
この発明によれば、記憶装置は、選択結合性物質毎に検出強度値を記憶し、制御装置は、記憶された検出強度値に基づいて、数式1および数式2を用いて、2群間における対数比M(k)と対数幾何平均A(k)とに変換し、対数幾何平均に依存した対数比の偏り誤差を、2群間において存在比が同一である被検査物質に係る対数比および対数幾何平均の集合について数式3に基づく多項式回帰分析を行うことにより、推定し、推定された偏り誤差を、選択結合性物質毎の対数比から減ずることにより補正対数比を導出するので、生物学的差異と偏り誤差により生ずる非生物学差異を分離することができ、解析装置の解析精度を高めることができる。すなわち、本発明によれば、多項式回帰分析を用いるのでデータに対するあてはまり具合がよく、精度よい偏り誤差の推定を行うことができるという作用を奏する。また、多項式回帰は、局所回帰ではないためウィンドウサイズ(データポイント数)の影響を受け難いという作用を奏する。また、本発明によれば、2群間において存在比が同一である被検査物質のみのデータを回帰分析のために用いるので、ウィンドウサイズが小さい場合であっても、生物学的差異を偏り誤差等の非生物学的差異とみなすことがなく、偏り誤差等の非生物学的差異を補正により効率よくデータから除去することができるという作用を奏する。上記これらの作用により、本発明は、解析結果の精度を向上させることができるという効果を奏する。
また、請求項2に記載の解析装置は、請求項1に記載の解析装置において、上記誤差推定手段は、(A)上記目的変数との相関係数が最も大きい上記説明変数から重回帰式に取り入れていき、予測精度の改善がみられる間、この操作を繰り返す変数増加法、(B)最初に全ての上記説明変数を含む上記重回帰式を構成した上で、予測に有効ではない上記説明変数を除去していき、上記予測精度の低下が一定限度以内である間、この操作を繰り返す変数減少法、(C)上記目的変数との上記相関係数が最も大きい上記説明変数から上記重回帰式に取り入れた後に、予測に有効ではない上記説明変数を除去する変数増減法、(D)最初に全ての上記説明変数を含む上記重回帰式を構成した上で、それまでに上記重回帰式に取り入れられている上記説明変数の中から最も予測に有効でない上記説明変数を除き、取り入れられていない上記説明変数の中で予測に有効な上記説明変数を取り入れる変数減増法、のいずれかを用いて上記重回帰式を生成する回帰式生成手段、を更に備えたこと特徴とする。
この発明によれば、上記発明において更に、(A)変数増加法、(B)変数減少法、(C)変数増減法、(D)変数減増法、のいずれかを用いて重回帰式を生成するので、不必要に説明変数を増加させることなく、最適な重回帰式を生成することができる。
また、請求項3に記載の解析装置は、請求項1または2に記載の解析装置において、上記誤差推定手段は、上記1多項式回帰分析において、上記対数変換手段によって変換された上記対数比に対する回帰のあてはまり具合を、(E)下記の数式4に基づいて求める赤池情報量規準AICによって評価する評価法、(F)下記の数式5に基づいて求める自由度調整済み決定係数R2によって評価する評価法、(G)下記の数式6に基づいて求めるマローズのCpによって評価する評価法、のいずれかの評価法によって評価する回帰式評価手段、を更に備えたことを特徴とする。
AIC=−2Ln(L)+2s ・・・(数式4)
(ここで、Lは最大尤度であり、sは自由パラメータの数である。)
2=1−[{Se/(N−p−1)}/{St−(N−1)}] ・・・(数式5)
(ここで、Seは残差平方和であり、Stは総平方和であり、Nはデータ数であり、pは自由度である。)
Cp=Se/σ2−2(p+1)−N ・・・(数式6)
(ここで、Seは上記残差平方和であり、Nは上記データ数であり、pは上記自由度であり、σは誤差分散の推定値である。)
この発明によれば、上記発明において更に、多項式回帰分析において、変換された対数比に対する回帰のあてはまり具合を、(E)赤池情報量規準AICによって評価する評価法、(F)自由度調整済み決定係数R2によって評価する評価法、(G)マローズのCpによって評価する評価法、のいずれかの評価法によって評価するので、対数比に対する回帰のあてはまり具合を適切に評価することができる。
また、請求項4に記載の解析装置は、請求項1乃至3のいずれか一つに記載の解析装置において、上記被検査物質は、上記細胞から抽出したRNAから合成したcDNAまたはaRNAであり、上記標識は、蛍光物質であり、上記選択結合性物質は、DNA断片であり、上記担体上には、疾患の罹患の有無や程度によって発現変動することが期待される目的遺伝子と、発現変動が少ない対照遺伝子と、を検出するための上記DNA断片が配置されていること、を特徴とする。
この発明によれば、上記発明において、被検査物質は、細胞から抽出したRNAから合成したcDNAまたはaRNAであり、標識は、蛍光物質であり、選択結合性物質は、DNA断片であり、担体上には、疾患の罹患の有無や程度によって発現変動することが期待される目的遺伝子と、発現変動が少ない対照遺伝子と、を検出するためのDNA断片が配置されているので、疾患の罹患の有無や程度を検出することができる。
この発明によれば、マイクロアレイ実験等から得られるデータから、回帰分析を用いた補正手段により偏り誤差を推測するので、生物学的差異と偏り誤差により生ずる非生物学的差異を分離することができ、解析精度を高めた解析装置を提供することができる。
以下に、本発明にかかる本解析装置および本補正方法の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。特に、本実施の形態として、本解析装置を疾患関連遺伝子の発現変動を検査する目的で用いた場合を例として示す場合があるが、本発明はこれに限定されるものではない。
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について図3〜図5を参照しながら、詳細に説明する。図3は、MAプロットの例を表す図である。図4は、本発明の基本原理である補正方法を説明する概念図である。図5は、本発明の本実施の形態により補正されたMAプロットの例を表す図である。
本発明は、概略的に、以下の基本的特徴を有する。すなわち、本発明は、異なる条件の細胞から得られた被検査物質の2群にそれぞれ異なる2種類の標識を付し、多種類の既知の選択結合性物質を整列固定化した担体に被検査物質を接触させ、選択結合性物質に対する被検査物質の選択的結合量を標識の検出強度値として測定することにより得られる、選択的結合量の2群間における差異を検査する解析装置であって、少なくとも記憶装置と制御装置とを備える。
ここで、「被検査物質」とは、細胞から直接・間接的に得られる試料のことであり、例えば、ゲノムDNA、RNA、cDNA、aRNA(cDNAまたはその相補配列を鋳型として増幅されたRNA)、タンパク質、糖鎖、脂質などである。また、「標識」とは、検出手段によって検出することができる物質のことであり、「異なる2種類の標識」とは、例えば、蛍光物質であるCy3とCy5の組み合わせ等である。また、「選択結合性物質」とは、ある物質と選択的に結合する物質のことであり、例えば、DNAに対するDNA、DNAに対するRNA、抗原に対する抗体、化学物質に対する酵素などである。
また、異なる2種類の標識を付して2群間における差異を検査する手法とは、例えば、具体的には、二蛍光標識法等が挙げられる。すなわち、二蛍光標識法は、「異なる条件の細胞から得られた被検査物質」として2種類の細胞(例えば、正常細胞とガン細胞)から抽出されたRNAより合成されたcDNAまたはaRNAを用い、「異なる2種類の標識」として例えばCy3とCy5の蛍光物質を用いる。そして、DNAマイクロアレイ担体上で蛍光標識したcDNAまたはaRNAを競合的にハイブリダイゼーションさせ、それぞれの蛍光の励起波長に応じて各々蛍光強度値を測定し、蛍光強度値を定量・比較することによって、異なる条件の細胞における各遺伝子発現量の差異に関する情報を得る手法である。
つぎに、本発明は、選択結合性物質毎に検出強度値を記憶する。
つづいて、本発明は、記憶された検出強度値に基づいて、下記の数式1および数式2を用いて、2群間における対数比M(k)と対数幾何平均A(k)とに変換する。
M(k)=log2(C1k/C2k) ・・・(数式1)
A(k)=log2(C1k・C2k0.5 ・・・(数式2)
ここで、kは任意の選択結合性物質を表し、C1kおよびC2kは、それぞれ異なる2種類の標識の検出強度値である。
ここで、横軸に対数比A、縦軸に対数幾何平均Mのプロットを作成した場合、図3に示すように、対数幾何平均Aに依存して対数比Mの偏り誤差が発生していることがわかる。そこで、つぎに本発明は、偏り誤差を予測し補正する。
すなわち、本発明は、対数幾何平均に依存した対数比の偏り誤差を、2群間において存在比が同一である被検査物質に係る対数比および対数幾何平均の集合について下記の数式3に基づく多項式回帰分析を行うことにより、推定する。
y=a0+a1x+a22+a33+ ・・・ann+e ・・・(数式3)
ここで、xは説明変数であり、yは目的変数であり、aは定数であり、eは残差である。
ここで、図4で示すように、2群間で存在比が同一である対照となる選択結合性物質((具体的には、対照遺伝子等)図中で三角で表す)に係る対数比と対数幾何平均の集合から、図4に概念的に示すように(矢印の先の点線枠内)、多項式回帰分析を行い、多項式回帰式(図4プロット内に点線の曲線で表す)を作成する。
最後に、本発明は、推定された偏り誤差を、選択結合性物質毎の対数比から減ずることにより補正対数比を導出する。図5で示すように、多項式回帰方程式により推定された偏り誤差をM(対数比)から減ずるので、図5において多項式回帰曲線はx軸に並行(y=a(定数))となる。
以上が本発明の概要である。これにより、マイクロアレイ実験等から得られるデータから、回帰分析を用いて補正するので、生物学的差異と偏り誤差により生ずる非生物学的差異を分離することができ、解析精度を高めることができる。
ここで、多項式回帰分析においては、(A)変数増加法、(B)変数減少法、(C)変数増減法、(D)変数減増法、のいずれかを用いて重回帰式を生成してもよい。さらに、多項式回帰分析において、対数比に対する回帰のあてはまり具合を、(E)赤池情報量規準によって評価する評価法、(F)自由度調整済み決定係数によって評価する評価法、(G)マローズのCpによって評価する評価法、のいずれかの評価法によって評価してもよい。
また、ここで、被検査物質は、細胞から抽出したRNAから合成したcDNAまたはaRNAであり、標識は、蛍光物質であり、選択結合性物質は、DNA断片であり、担体上には、疾患の罹患の有無や程度によって発現変動することが期待される目的遺伝子と、発現変動が少ない対照遺伝子と、を検出するためのDNA断片を配置してもよい。すなわち、本解析装置は、対照遺伝子の対数比と対数幾何平均に基づいて偏り誤差を推定し、目的遺伝子の補正対数比に基づいて、疾患の罹患の有無や程度を検出するよう構成してもよい。以上で本発明の概要の説明を終える。
[本解析装置の構成]
まず、本解析装置の構成について説明する。図6は、本発明の本実施の形態が適用される本解析装置の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
図6において解析装置100は、概略的に、解析装置100の全体を統括的に制御するCPU等の制御装置102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶装置106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。ここで解析装置100は、図6に示すように、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に接続されていてもよい。
記憶装置106に格納される各種のデータベースやテーブル(検出強度ファイル106a〜配置ファイル106c)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ等を格納する。
これら記憶装置106の各構成要素のうち、検出強度ファイル106aは、選択結合性物質毎に検出強度値を記憶する検出強度記憶手段である。すなわち、検出強度ファイル106aは、異なる条件の細胞から得られた被検査物質の2群にそれぞれ異なる2種類の標識を付し、多種類の既知の選択結合性物質を整列固定化した担体に標識を付した被検査物質を接触させ、選択結合性物質に対する被検査物質の選択的結合量として測定された標識の検出強度値を記憶する。例えば、二蛍光標識法において、蛍光色素としてCy3(緑)とCy5(赤)を用いた場合、検出強度ファイル106aは、選択結合性物質毎に蛍光強度測定器等によって測定された各励起波長(緑・赤)の蛍光強度値を記憶する。
また、補正対数比ファイル106bは、誤差推定部102bによって推定された偏り誤差を、選択結合性物質毎の対数比から減ずることにより導出された補正対数比を記憶する補正対数比記憶手段である。
また、配置ファイル106cは、担体上の選択結合性物質の配置を記憶する配置記憶手段である。例えば、特定疾患専用のマイクロアレイを担体として用いた場合、配置ファイル106cは、担体上の特定疾患に関連する目的遺伝子や、特定疾患の有無・程度にかかわらず発現変動がない対照遺伝子を検出する選択結合性物質の配置を記憶する。すなわち、具体的には、一枚のバイオチップには、4ブロックあり、1ブロックあたり64(8x8)スポット、合計256遺伝子の発現パターンを検出することができる担体(バイオチップ)を用いたとすると、配置ファイル106cは、個々の遺伝子に対応する選択結合性物質(DNA断片等)が配置された位置(ブロック番号とスポット座標(x−y))をその遺伝子名と対応付けて記憶する。
また、図6において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、プリンタ、記録媒体出力装置等を用いることができる。また、入力装置112としては、キーボード、マウス等の他、バーコードリーダーや蛍光検出装置等を用いることができる。
また、図6において、制御装置102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御装置102は、機能概念的に、対数変換部102a、誤差推定部102b、対数比補正部102e、疾患検出部102f、出力部102gを備えて構成されている。
このうち、対数変換部102aは、検出強度ファイル106aに記憶された検出強度値に基づいて、下記の数式1および数式2を用いて、2群間における対数比M(k)と対数幾何平均A(k)とに変換する対数変換手段である。
M(k)=log2(C1k/C2k) ・・・(数式1)
A(k)=log2(C1k・C2k0.5 ・・・(数式2)
ここで、kは任意の選択結合性物質を表し、C1kおよびC2kは、それぞれ異なる2種類の標識の検出強度値である。
また、誤差推定部102bは、対数幾何平均に依存した対数比の偏り誤差を、2群間において存在比が同一である被検査物質に係る対数比および対数幾何平均の集合について数式3に基づく多項式回帰分析を行うことにより、推定する誤差推定手段である。
y=a0+a1x+a22+a33+ ・・・ann+e ・・・(数式3)
ここで、xは説明変数であり、yは目的変数であり、aは定数であり、eは残差である。
ここで、図6に示すように、誤差推定部102bは、回帰式生成部102c、評価部102dを備えて構成される。このうち、回帰式生成部102cは、(A)変数増加法、(B)変数減少法、(C)変数増減法、(D)変数減増法、のいずれかを用いて回帰式を生成する回帰式生成手段である。また、評価部102dは、回帰のあてはまり具合を、(E)赤池情報量規準によって評価する評価法、(F)自由度調整済み決定係数によって評価する評価法、(G)マローズのCpによって評価する評価法、のいずれかの評価法によって評価する回帰式評価手段である。
また、図6に示すように、対数比補正部102eは、誤差推定部102bによって推定された偏り誤差を、対数比から減ずることにより補正された補正対数比を導出する対数比補正手段である。ここで、対数比補正部102eは、導出された補正対数比を補正対数比ファイル106bに格納するよう構成してもよい。
また、図6に示すように、疾患検出部102fは、補正対数比ファイル106bに格納された、疾患に関連した目的遺伝子を検出するDNA断片についての補正対数比を、所定の指標値と対比して、疾患の罹患の有無もしくは程度を検出する疾患検出手段である。
また、出力部102gは、補正対数比ファイル106bに格納された補正対数比を出力装置114等に出力する出力手段である。ここで、出力部102gは、疾患検出部102fの処理により検出された疾患の罹患の有無もしくは程度を出力してもよい。また、ここで、制御装置102は、出力部102gの処理により、入出力制御インターフェース部108を制御して、補正対数比を出力装置114に出力してもよい。また、出力部102gは、出力装置114として、モニタに出力することに限られず、プリンタや、記録媒体出力装置を介して記録媒体等に出力してもよい。また、出力部102gは、通信制御インターフェース104を制御して、ネットワーク300を介して、外部システム200の外部データベース等の外部記憶装置に出力してもよい。
また、図6において、通信制御インターフェース部104は、解析装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
また、図6に示すように、本実施の形態における本解析システムは、概略的に解析装置100と、疾患に関連する目的遺伝子を検出するマイクロアレイの配置データ等に関する外部データベースや外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されてもよい。
すなわち、図6において、ネットワーク300は、解析装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
また、図6において、外部システム200は、ネットワーク300を介して、解析装置100と相互に接続され、利用者に対して疾患に関連する目的遺伝子を検出するマイクロアレイの配置データ等に関する外部データベースや外部プログラム等を実行するウェブサイトを提供する機能を有する。
また、ここで、外部システム200は、WEBサーバやASPサーバ等として構成していてもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成していてもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
また、図6において、解析装置100の利用者は、ネットワーク300を介して、外部システム200が提供するバイオチップに関する検出強度データベースや、遺伝子配置データベース等の外部データベース、または検査プログラム等の外部プログラムを提供するウェブサイトにアクセスすることによって検出強度値データ、配置データ、解析プログラム、補正プログラム等を入手するようにしてもよい。これにて、本解析装置の構成の説明を終える。
[本解析装置の処理]
次に、このように構成された本実施の形態における本解析装置の処理の一例について、以下に図6および図7を参照しながら詳細に説明する。図7は、本実施の形態における本解析装置100の補正処理の一例を示すフローチャートである。
まず、図7に示すように本解析装置100において、制御装置102は、検出強度ファイル106aに記憶された検出強度値を読み込む(ステップSB−1)。ここで、検出強度値データは、入出力制御インターフェース部108を介して、検出装置によって検出された検出強度値データを格納した外部記録媒体から、読み込んでもよい。また、標識の検出装置から直接入力される場合に限らず、検出強度値データは、ネットワーク300を介して、外部システム200の外部データベース等から取得してもよく、また、ネットワーク300を介して検出装置を制御することにより、検出強度値データを取得してもよい。
つぎに、本解析装置100において、制御装置102は、検出強度値からバックグラウンド値を減算する(ステップSB−2)。例えば、全く結合対象となる被検査物質がないプローブ等を選択結合性物質として用いて担体に固着させ、当該プローブを配置した部分の検出強度値をバックグラウンド値として減ずるように構成してもよい。
つづいて、本解析装置100において、制御装置102は、対数変換部102aの処理により、検出強度ファイル106aに記憶された(バックグラウンドを除去した)検出強度値に基づいて、下記の数式1および数式2を用いて、2群間における対数比M(k)と対数幾何平均A(k)とに変換する(ステップSB−3)。
M(k)=log2(C1k/C2k) ・・・(数式1)
A(k)=log2(C1k・C2k0.5 ・・・(数式2)
ここで、kは任意の選択結合性物質を表し、C1kおよびC2kは、それぞれ異なる2種類の標識の検出強度値である。
ここまでの本実施の形態に係る補正処理の流れは、「背景技術」で示した従来法における補正処理と同一である。以下の処理では、本実施の形態では、目的遺伝子などの検査対象となる2群間で存在比が同一である被検査物質において、対数幾何平均に対する対数比で表される差異を、非生物学的要因によるものと考える。また、本実施の形態にかかる補正処理方法は、局所回帰ではないためウィンドウサイズの影響を受けず、検査対象となる被検査物質における偏り誤差は、多項式曲線上で内挿もしくは補外することにより求めることができる。
つづいて、本解析装置100において、制御装置102は、誤差推定部102bの処理により、対数幾何平均に依存した対数比の偏り誤差を推定するため、2群間において存在比が同一である被検査物質に係る対数比および対数幾何平均を抽出する(ステップSB−4)。
つぎに、本解析装置100において、制御装置102は、誤差推定部102bの処理により、抽出した集合について下記の数式3に基づく多項式回帰分析を行う(ステップSB−5)。
y=a0+a1x+a22+a33+ ・・・ann+e ・・・(数式3)
ここで、xは説明変数であり、yは目的変数であり、aは定数であり、eは残差である。
ここで、制御装置102は、回帰式生成部102cの処理により、下記の(A)〜(D)のいずれかを用いて多項式回帰式を生成する(ステップSB−5)。
(A)目的変数との相関係数が最も大きい説明変数から重回帰式に取り入れていき、予測精度の改善がみられる間、この操作を繰り返す変数増加法。
(B)最初に全ての説明変数を含む重回帰式を構成した上で、予測に有効ではない説明変数を除去していき、予測精度の低下が一定限度以内である間、この操作を繰り返す変数減少法。
(C)目的変数との相関係数が最も大きい説明変数から重回帰式に取り入れた後に、予測に有効ではない説明変数を除去する変数増減法。
(D)最初に全ての説明変数を含む重回帰式を構成した上で、それまでに重回帰式に取り入れられている説明変数の中から最も予測に有効でない説明変数を除き、取り入れられていない説明変数の中で予測に有効な説明変数を取り入れる変数減増法。
つづいて、本解析装置100において、制御装置102は、評価部102dの処理により、多項式回帰分析において、下記の(E)〜(G)のいずれかの評価法によって評価値を算出し、算出した評価値を所定の基準値と比較して、対数比に対する回帰のあてはまり具合を評価する(ステップSB−6)。
(E)下記の数式4に基づいて求める赤池情報量規準AICによって評価する評価法。
AIC=−2Ln(L)+2s ・・・(数式4)
ここで、Lは最大尤度であり、sは自由パラメータの数である。
(F)下記の数式5に基づいて求める自由度調整済み決定係数R2によって評価する評価法。
2=1−[{Se/(N−p−1)}/{St−(N−1)}] ・・・(数式5)
ここで、Seは残差平方和であり、Stは総平方和であり、Nはデータ数であり、pは自由度である。
(G)下記の数式6に基づいて求めるマローズのCpによって評価する評価法。
Cp=Se/σ2−2(p+1)−N ・・・(数式6)
ここで、Seは残差平方和であり、Nはデータ数であり、pは自由度であり、σは誤差分散の推定値である。
そして、本解析装置100において、制御装置102は、上記評価に基づいて、誤差推定部102bの処理により、多項式回帰式の次数を決定し、多項式回帰式を導出する(ステップSB−7)。
さらに、本解析装置100において、制御装置102は、誤差推定部102bの処理により、導出した多項式回帰式を用いて、各選択結合性物質について、偏り誤差を推定する(ステップSB−8)。すなわち、偏り誤差は、多項式曲線上で内挿もしくは補外することにより求めることができる。
最後に、本解析装置100において、制御装置102は、対数比補正部102eの処理により、各選択結合性物質の対数比から推定された偏り誤差を減算して、補正対数比を求める(ステップSB−9)。ここで、制御装置102は、対数比補正部102eの処理により、求めた補正対数比を補正対数比ファイル106bに格納してもよい。また、ここで、制御装置102は、出力部102gの処理により、入出力制御インターフェース部108を制御して、補正対数比を出力装置114に出力してもよい。また、出力部102gは、出力装置114として、モニタに出力することに限られず、プリンタ等の印刷装置に出力してもよく、記録媒体等に出力してもよい。さらに、出力部102gは、通信制御インターフェース104を制御して、ネットワーク300を介して、外部システム200の外部データベース等の外部記憶装置に出力するよう構成してもよい。
これにて、本解析装置100の補正処理の説明を終了する。以上の補正処理を行うことにより、従来法の補正方法と比べて、ウィンドウサイズを小さくしても、2群間で存在比が同一の対照用選択結合性物質について誤差推定のための回帰分析をするので、生物学的差異と偏り誤差により生ずる非生物学的差異を十分に分離することができ、解析精度の向上を図ることができる。
[実施例]
本解析装置を食道ガン診断用DNAチップの解析装置として用いた場合の実施例を、以下に[DNAマイクロアレイの作成]、[ターゲットcDNAの調製]、[ハイブリダイゼーション]、[遺伝子発現量の測定]、[診断用遺伝子変動の検出]の順で、図6および図8〜図12を参照しながら説明する。
まず、本実施の形態に係る本実施例の概要を説明する。本実施例は、「異なる条件の細胞」として、正常細胞と食道ガン細胞を用い、「被検査物質」としてcDNAを用いる。そして、cDNA合成時において、「標識」として蛍光物質で標識する。また、「選択結合性物質」としてDNA断片を担体に整列固定化し、DNAマイクロアレイを作成する。そして、DNAマイクロアレイ上のDNA断片とcDNAをハイブリダイゼーションさせ、ハイブリダイゼーション量(選択的結合量)を蛍光強度値として検出する。そして、本実施の形態における本実施例の本解析装置は、2種類の蛍光物質による蛍光強度値のデータから、対数比と対数幾何平均を求め、偏り誤差を推測し補正する。最後に、補正した対数比から、食道ガンの有無や程度を検査する。
すなわち、本実施の形態に係る本実施例は、基板(担体)上に多数の既知遺伝子DNA断片(既知の選択結合性物質)を高密度に整列固定化し、蛍光色素(標識)で各々標識した異なる2条件の研究対象細胞の遺伝子をハイブリダイズさせ、ハイブリダイゼーション量(選択的結合量)を蛍光強度値(検出強度値)として測定することにより得られる前記既知遺伝子の前記2条件間の発現変動(差異)を検査するシステムであって、前記既知遺伝子の蛍光強度データを入力する入力装置と、以下の(1)〜(3)のステップを含む前記既知遺伝子の2条件間の発現比を導出する解析装置と、前記補正された対数比M(k)を出力する出力装置と、を有することを特徴とする解析システムとして構成される。
(1)ある既知遺伝子kについて取得された前記2条件の蛍光強度データ(Cy5k,Cy3k)から、以下の数式1を用いて対数比M(k)と対数幾何平均A(k)とに変換するステップ、(2)既知遺伝子全てについて2次元にプロットした(A(k),M(k))について、A(k)に依存したM(k)の偏り誤差を、既知遺伝子のうち上記2条件間で発現に差異がみられないことが知られている遺伝子群を用いて、数式3に基づく多項式回帰によって、推定するステップ、(3)全遺伝子に対して推定された偏り誤差を減ずることにより、補正された対数比M(k)を導出するステップ。
M(k)=log2(Cy3k/Cy5k) ・・・(数式1)
A(k)=log2(Cy5k・Cy3k0.5 ・・・(数式2)
y=a0+a1x+a22+a33+ ・・・ann+e ・・・(数式3)
(ここで、xは説明変数であり、yは目的変数であり、aは定数であり、eは残差である。)
以上で、本実施例の概要の説明を終える。
[DNAマイクロアレイの作成]
食道ガンの診断用候補遺伝子153種および、ヒトの多くの組織で発現変動がない(定常発現)と考えられる対照遺伝子107種について、配列の重複をおこさないように配列特異性が高い部位のDNA配列60〜70残基をそれぞれ選択して合成した。これらの合成オリゴDNAを、凹凸構造を持つポリメチルメタクリレート製DNAチップ基板(3D−Gene(商品名)、製造販売 東レ株式会社(会社名)、特開2004−264289参照)の凸部にスポッターを用いてスポットした。ここで、一枚のチップ上には4ブロックあり、1ブロックあたり64(8x8)スポット、合計256遺伝子の発現パターンを検出することができる。
[ターゲットcDNAの調製]
試料として食道ガン患者の食道組織における食道ガン病変部の組織を用いた。おのおのの組織から、Trizol reagent(Invitrogen社(会社名))を用いて、東レ社(会社名)推奨のプロトコールによりtotalRNAを調製した。
上述の方法で得られたtotalRNA 1μgについて、oligo(dT)プライマー及びランダムノナマーを併用し、CyScribe First-Strand cDNA Labeling Kit(商品名)(製造販売 GEヘルスケア社(会社名))を用いてメーカー推奨のプロトコールで逆転写反応を行った。食道ガン組織由来のtotalRNAにはCy3−dUTP(製造販売 GEヘルスケア社(会社名))を、ヒトリファレンスtotalRNA(製造販売 Stratagene社(会社名))にはCy5−dUTP(製造販売 GEヘルスケア社(会社名))を添加して、各社推奨のプロトコールで逆転写反応時にcDNAの標識を行った。標識されたcDNAはQIA quick PCR purification Kit(商品名)(製造販売 QIAGEN社(会社名))で精製してからハイブリダイズに用いた。
[ハイブリダイゼーション]
標識したcDNA0.1μgと上記のDNAチップを用い、42℃で16時間ハイブリダイズを行った。ハイブリダイズ終了後、DNAチップを3xSSC/0.1%SDS、1xSSC、0.1xSSCで順次洗浄した。
[遺伝子発現量の測定]
上述の方法により、ハイブリダイゼーションを行ったDNAチップをAgilentマイクロアレイスキャナー(商品名)(製造販売 Agilent社(会社名))を用いてスキャンした。ヒトリファレンスtotalRNA由来のcDNAのハイブリダイゼーション量は、cDNAがCy5で標識されているため、蛍光物質Cy5の励起波長を選択的に透過するチャンネル1で測定され、Cy5の蛍光強度値として数値化される。一方、食道ガン組織totalRNA由来のcDNAのハイブリダイゼーション量は、cDNAがCy3で標識されているため、蛍光物質Cy3の励起波長を選択的に透過するチャンネル2で測定され、Cy3の蛍光強度値として数値化される。数値化された蛍光強度値は、入力装置112等を介して、本実施の形態に係る本実施例の本解析装置100の検出強度ファイル106aに格納される。
つぎに、異なる2条件の組織検体(癌組織、非癌組織)における遺伝子発現比較を行うため、二色蛍光法で得られた実験結果を図8および図9に示す。ここで、図8は、食道ガン診断用DNAチップに搭載された256遺伝子について、チャンネル1で測定されたCy5の蛍光強度値を表すプロット図である。また、図9は、食道ガン診断用DNAチップに搭載された256遺伝子について、チャンネル2で測定されたCy3の蛍光強度値を表すプロット図を示す。すなわち、図8はチャンネル1(Cy5側)によって得られた非癌組織における遺伝子発現強度を示し、図9はチャンネル2(Cy3側)によって得られた癌組織における遺伝子発現強度を示している。
つづいて、食道ガン組織由来totalRNAの遺伝子発現パターンと、ヒトリファレンスtotalRNAにおける遺伝子発現パターンの差を考察するために、対数変換部102aは、各遺伝子について、それぞれの蛍光強度値から対数幾何平均Aおよび対数比(以下「発現強度比」という)Mを算出した。ある遺伝子giのチャンネル1、2の蛍光強度値をそれぞれIred,i、Igreen,iとすると、AiおよびMiはAi = 0.5 x log2(Igreen,i x Ired,i)、Mi = log2(Igreen,i / Ired, i)と定義される(数式1および数式2)。
ここで、図10は、食道ガン組織totalRNAとヒトリファレンスtotalRNAを食道ガン診断用DNAチップに適用した時の補正前のMAプロット図である。すなわち、図10は、A値(両チャンネルの平均発現強度値)を横軸、M値(チャンネル1に対するチャンネル2の発現強度比)を縦軸にとった散布図であり、遺伝子全体の発現変動を視覚的に表現する。図中において、黒丸は対照遺伝子データを示し、白抜きの四角は食道ガン組織において発現変動が期待される目的遺伝子を示す。図10に示すように、平均発現強度値Aが弱いところほどチャンネル2の強度が高くなる傾向が認められる。すなわちMAプロットからA値に依存した系統的なM値の変動すなわち偏り誤差が認められる。この偏り誤差は、蛍光色素Cy3とCy5の感度の違いにより生じたもので、本来は発現差の少ない遺伝子に発現差があるようにみえることになるため、真の発現強度比Mの検査を妨げるものである。したがって、補正処理を行って偏り誤差を取り除く必要がある。
[診断用遺伝子変動の検出]
まず、従来技術を用いた補正処理による遺伝子変動の検出結果について図11を参照しながら説明し、その後、本実施の形態における本実施例の補正処理よる遺伝子変動の検出結果について図12を参照しながら説明を行う。図11は、従来法を用いて、対数幾何平均Aに対する発現強度比Mの偏り誤差を推定し、補正を行った結果を示すMAプロット図である。一方、図12は、本実施の形態にかかる本実施例による補正方法を用いて、偏り誤差を推定し、補正を行った結果を示すMAプロットである。なお、各MAプロット図において、横軸はA値、縦軸はM値である。
従来法に則した補正方法として、偏り誤差の推定に重み付き局所回帰(LOWESS)を用いた。すなわち、食道ガン組織totalRNAとヒトリファレンスtotalRNAを食道ガン診断用DNAチップに適用し、従来の補正方法として、重み付き局所回帰(LOWESS法)によって補正を行った。重み関数としては、tricube関数を用いた。また、誤差の推定をする遺伝子をga、領域内に含まれる他の遺伝子をgbとし、それぞれのA値をAa、Abとすると、散布図上の2遺伝子の距離dgagbは、dgagb=|Aa−Ab|となる。重み関数はこの距離に依存し、|dgagb|<1のときは、W=(1-|dgagb|3)3とし、|dgagb|≧1のときはW=0とした。また、補正は、回帰式によって推定された各遺伝子giの偏り誤差dmiをM値から差し引くことにより行った。その結果、図11に示すように、従来法では、全遺伝子データを用いて局所回帰を行うことによって、有意差(M≧1)がある5つの遺伝子(図中の三角)が検出された。
一方、本実施の形態にかかる本実施例では、1つの領域に含まれる遺伝子数を103とした。すなわち、本実施例の本解析装置100は、誤差推定部102bの処理により、アレイに搭載されている遺伝子のうち正常組織と食道ガン組織とで遺伝子発現に変化が少ないことが分かっている対照遺伝子のみについて回帰分析を行った。なお、対照遺伝子の配置データは配置ファイル106cに記憶されており、本解析装置100の誤差推定部102bは、配置ファイル106cを参照して103の対照遺伝子群のみについて回帰分析を実行する。
つぎに、本実施例の本解析装置100は、回帰式生成部102cの処理により多項式の次数を、変数減少法を用いて選択し、評価部102dの処理により、赤池情報量規準(AIC)を用いて評価の目安とした。その結果、本実施例では「y=2.9623−0.0233x2+0.003x3−0.0001x4」という回帰式を得た。つづいて、本解析装置100は、対数比補正部102eの処理により、診断用の目的遺伝子giの偏り誤差推定値dmiを、回帰式に目的遺伝子のAi値を代入して得た後、さらにM値から当該推定誤差dmiを減算することにより真のM値を導出し補正した。図12は、本発明の本補正方法によって補正を行った食道ガン組織totalRNAとヒトリファレンスtotalRNAを食道ガン診断用DNAチップに適用した場合のMAプロット図(横軸:A値、縦軸:M値)である。
図12に示すように、本実施例による補正処理後に有意差(|M|≧1)のある診断用目的遺伝子数は7個となり、従来の手法による5個(図11参照)と比較してより検出力が高く、精度の高い補正処理が行われたことが確認できた。これは、従来法の図11では全遺伝子の発現強度差そのものが偏り誤差としてみなされ減算補正されているのに対し、本実施例の図12では偏り誤差だけが補正されていることに起因する。ここで、つづいて、本解析装置100は、検出強度ファイル106aに記憶された補正対数比データを用いて、疾患検出部102fの処理により、診断用の目的遺伝子の変動の検出と疾患の罹患の有無、程度を検出してもよい。
以上説明のように、本発明の本実施例によれば、従来の方法では検出できなかった変動遺伝子を検出することができ、マイクロアレイ実験等から得られるデータから、解析結果の精度を高めることができる。
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
特に、本発明の実施の形態については、選択結合性物質としてDNAを用いて説明したが、これに限られず、選択結合性物質には、抗体などのタンパク質ライブラリや、化合物のライブラリ等を配置してもよい。
また、ここで「担体」の材料にあっては、ガラスに限られず、メンブレンやプラスチックでもよい。
また、上述の実施の形態においては、標識として蛍光化学物質(例えばCy3,Cy5)を用いたが、これに限られず、標識には、蛍光特性を持たない色素や、放射性同位体、GFP・GRPなどのタンパク質、Hisタグ、ビオチン化などを用いることができる。
例えば、解析装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、解析装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データ等を含む情報、データベース構成については、特記する場合を除いて任意に変更することができる。
また、解析装置100に関して、図示の各構成要素は機能概略的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、解析装置100の各装置が備える処理機能、特に制御装置102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。尚、プログラムは、後述する記録媒体に記録されており、必要に応じて解析装置100に機械的に読み取られる。すなわち、ROMまたはHDなどの記憶装置106などは、OS(Operating System)として協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御装置を構成する。
また、このコンピュータプログラムは、解析装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
記憶装置106に格納される各種のデータベース等(検出強度ファイル106a〜配置ファイル106c)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやデータベースやウェブページ用ファイル等を格納する。
また、解析装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。
以上詳述に説明したように、本発明によれば、マイクロアレイ実験等から得られるデータから、回帰分析を用いた補正手段により偏り誤差を推測するので、生物学的差異と偏り誤差により生ずる非生物学的差異を分離することができ、解析精度を高めた解析装置を提供することができるので、特に、医療分野、バイオ産業分野等に利用可能である。
従来技術における解析装置の補正処理の一例を示すフローチャートである。 重み付き局所回帰法(LOWESS法)を用いて、補正のためのLowess曲線を求めた場合のMA(横軸:A値、縦軸:M値)プロット図である。 MAプロットの例を示す概念図である。 本発明の基本原理である補正方法を説明する概念図である。 本発明によって補正された場合のMAプロットの例を表す図 本発明の本実施の形態が適用される本解析装置の構成の一例を示すブロック図である。 本実施の形態における本解析装置100の補正処理の一例を示すフローチャートである。 食道ガン診断用DNAチップに搭載された256遺伝子について、チャンネル1で測定されたCy5による蛍光強度値を表すプロット図である。 食道ガン診断用DNAチップに搭載された256遺伝子について、チャンネル2で測定されたCy3による蛍光強度値を表すプロット図である。 食道ガン組織totalRNAとヒトリファレンスtotalRNAを食道ガン診断用DNAチップに適用した時の補正前のMAプロット図である。 従来法を用いて、対数幾何平均Aに対する発現強度比Mの偏り誤差を推定し、補正を行った結果を示すMAプロット図である。 本実施の形態にかかる本実施例による補正方法を用いて、偏り誤差を推定し、補正を行った結果を示すMAプロット図である。
符号の説明
100 解析装置
102 制御装置
102a 対数変換部
102b 誤差推定部
102c 回帰式生成部
102d 評価部
102e 対数比補正部
102f 疾患検出部
102g 出力部
104 通信制御インターフェース部
106 記憶装置
106a 検出強度ファイル
106b 補正対数比ファイル
106c 配置ファイル
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (5)

  1. 異なる条件の細胞から得られた被検査物質の2群にそれぞれ異なる2種類の標識を付し、多種類の既知の選択結合性物質を整列固定化した担体に当該被検査物質を接触させ、上記選択結合性物質に対する上記被検査物質の選択的結合量を上記標識の検出強度値として測定することにより得られる、上記選択的結合量の上記2群間における差異を検査する、少なくとも記憶装置と制御装置とを備えた解析装置であって、
    上記記憶装置は、
    上記選択結合性物質毎に上記検出強度値を記憶する検出強度記憶手段を備え、
    上記制御装置は、
    上記検出強度記憶手段に記憶された上記検出強度値に基づいて、下記の数式1および数式2を用いて、上記2群間における対数比M(k)と対数幾何平均A(k)とに変換する対数変換手段と、
    M(k)=log2(C1k/C2k) ・・・(数式1)
    A(k)=log2(C1k・C2k0.5 ・・・(数式2)
    (ここで、kは任意の上記選択結合性物質を表し、C1kおよびC2kは、それぞれ異なる上記2種類の標識の上記検出強度値である。)
    上記対数幾何平均に依存した上記対数比の偏り誤差を、上記2群間において存在比が同一である上記被検査物質に係る上記対数比および上記対数幾何平均の集合について下記の数式3に基づく多項式回帰分析を行うことにより、推定する誤差推定手段と、
    y=a0+a1x+a22+a33+ ・・・ann+e ・・・(数式3)
    (ここで、xは説明変数であり、yは目的変数であり、aは定数であり、eは残差である。)
    上記誤差推定手段によって推定された上記偏り誤差を、上記選択結合性物質毎の上記対数比から減ずることにより補正対数比を導出する対数比補正手段と、
    を備えたことを特徴とする解析装置。
  2. 請求項1に記載の解析装置において、
    上記誤差推定手段は、
    (A)上記目的変数との相関係数が最も大きい上記説明変数から重回帰式に取り入れていき、予測精度の改善がみられる間、この操作を繰り返す変数増加法、
    (B)最初に全ての上記説明変数を含む上記重回帰式を構成した上で、予測に有効ではない上記説明変数を除去していき、上記予測精度の低下が一定限度以内である間、この操作を繰り返す変数減少法、
    (C)上記目的変数との上記相関係数が最も大きい上記説明変数から上記重回帰式に取り入れた後に、予測に有効ではない上記説明変数を除去する変数増減法、
    (D)最初に全ての上記説明変数を含む上記重回帰式を構成した上で、それまでに上記重回帰式に取り入れられている上記説明変数の中から最も予測に有効でない上記説明変数を除き、取り入れられていない上記説明変数の中で予測に有効な上記説明変数を取り入れる変数減増法、
    のいずれかを用いて上記重回帰式を生成する回帰式生成手段、
    を更に備えたこと特徴とする解析装置。
  3. 請求項1または2に記載の解析装置において、
    上記誤差推定手段は、
    上記多項式回帰分析において、上記対数変換手段によって変換された上記対数比に対する回帰のあてはまり具合を、
    (E)下記の数式4に基づいて求める赤池情報量規準AICによって評価する評価法、
    AIC=−2Ln(L)+2s ・・・(数式4)
    (ここで、Lは最大尤度であり、sは自由パラメータの数である。)
    (F)下記の数式5に基づいて求める自由度調整済み決定係数R2によって評価する評価法、
    2=1−[{Se/(N−p−1)}/{St−(N−1)}] ・・・(数式5)
    (ここで、Seは残差平方和であり、Stは総平方和であり、Nはデータ数であり、pは自由度である。)
    (G)下記の数式6に基づいて求めるマローズのCpによって評価する評価法、
    Cp=Se/σ2−2(p+1)−N ・・・(数式6)
    (ここで、Seは上記残差平方和であり、Nは上記データ数であり、pは上記自由度であり、σは誤差分散の推定値である。)
    のいずれかの評価法によって評価する回帰式評価手段、
    を更に備えたことを特徴とする解析装置。
  4. 請求項1乃至3のいずれか一つに記載の解析装置において、
    上記被検査物質は、上記細胞から抽出したRNAから合成したcDNAまたはaRNAであり、
    上記標識は、蛍光物質であり、
    上記選択結合性物質は、DNA断片であり、
    上記担体上には、疾患の罹患の有無や程度によって発現変動することが期待される目的遺伝子と、発現変動が少ない対照遺伝子と、を検出するための上記DNA断片が配置されていること、
    を特徴とする解析装置。
  5. 異なる条件の細胞から得られた被検査物質の2群にそれぞれ異なる2種類の標識を付し、多種類の既知の選択結合性物質を整列固定化した担体に当該被検査物質を接触させ、上記選択結合性物質に対する上記被検査物質の選択的結合量を上記標識の検出強度値として測定することにより得られる、上記選択的結合量の上記2群間における差異を検査する、少なくとも記憶装置と制御装置とを備えた解析装置において実行される補正方法であって、
    上記記憶装置は、上記選択結合性物質毎に上記検出強度値を記憶する検出強度記憶手段を備えており、
    上記制御装置は、
    上記検出強度記憶手段に記憶された上記検出強度値に基づいて、下記の数式1および数式2を用いて、上記2群間における対数比M(k)と対数幾何平均A(k)とに変換する対数変換ステップと、
    M(k)=log2(C1k/C2k) ・・・(数式1)
    A(k)=log2(C1k・C2k0.5 ・・・(数式2)
    (ここで、kは任意の上記選択結合性物質を表し、C1kおよびC2kは、それぞれ異なる上記2種類の標識の上記検出強度値である。)
    上記対数幾何平均に依存した上記対数比の偏り誤差を、上記2群間において存在比が同一である上記被検査物質に係る上記対数比および上記対数幾何平均の集合について下記の数式3に基づく多項式回帰分析を行うことにより、推定する誤差推定ステップと、
    y=a0+a1x+a22+a33+ ・・・ann+e ・・・(数式3)
    (ここで、xは説明変数であり、yは目的変数であり、aは定数であり、eは残差である。)
    上記誤差推定ステップにおいて推定された上記偏り誤差を、上記選択結合性物質毎の上記対数比から減ずることにより補正対数比を導出する対数比補正ステップと、
    を備えたことを特徴とする補正方法。
JP2006263011A 2006-09-27 2006-09-27 解析装置、および補正方法 Expired - Fee Related JP4893194B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006263011A JP4893194B2 (ja) 2006-09-27 2006-09-27 解析装置、および補正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006263011A JP4893194B2 (ja) 2006-09-27 2006-09-27 解析装置、および補正方法

Publications (2)

Publication Number Publication Date
JP2008082876A JP2008082876A (ja) 2008-04-10
JP4893194B2 true JP4893194B2 (ja) 2012-03-07

Family

ID=39353895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006263011A Expired - Fee Related JP4893194B2 (ja) 2006-09-27 2006-09-27 解析装置、および補正方法

Country Status (1)

Country Link
JP (1) JP4893194B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4650702B2 (ja) 2008-08-21 2011-03-16 ソニー株式会社 遺伝子分類方法、遺伝子分類プログラム及び遺伝子分類装置
WO2013025909A1 (en) 2011-08-16 2013-02-21 Instrumentation Laboratory Company Extrapolation of interpolated sensor data to increase sample throughput
US8560251B2 (en) * 2011-08-16 2013-10-15 Instrumentation Laboratory Company System and method of increasing sample throughput by estimation of a sensor endpoint
JP5845154B2 (ja) * 2012-08-08 2016-01-20 国立研究開発法人農業・食品産業技術総合研究機構 生体数モデル生成装置、生体数モデル生成方法、サイトメーター、および、プログラム
JP7010293B2 (ja) * 2017-08-08 2022-01-26 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム
DE102019132963B4 (de) * 2019-12-04 2021-08-26 Hanon Systems Strommessanordnung
CN112462078A (zh) * 2020-11-16 2021-03-09 三诺生物传感股份有限公司 一种用于荧光免疫分析仪台间差校准的方法
CN117740748B (zh) * 2023-12-20 2024-08-20 湖南省计量检测研究院 一种bod在线快速检测方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002221104A1 (en) * 2000-12-11 2002-06-24 Chugai Seiyaku Kabushiki Kaisha Method of detecting relation between genes
JP2003028862A (ja) * 2001-07-12 2003-01-29 Pharma Design Inc Dnaマイクロアレイデータの補正方法
JP2003185659A (ja) * 2001-12-18 2003-07-03 Crc Solutions Corp Dnaマイクロアレイによる遺伝子発現解析方法
JP3983569B2 (ja) * 2002-02-28 2007-09-26 独立行政法人科学技術振興機構 多変量解析システム、発現プロファイル解析方法、コンピュータプログラム、コンピュータ読み取り可能な記憶媒体
JP2005106755A (ja) * 2003-10-01 2005-04-21 Research Organization Of Information & Systems マイクロアレイ実験等から得られるデータの新規解析方法

Also Published As

Publication number Publication date
JP2008082876A (ja) 2008-04-10

Similar Documents

Publication Publication Date Title
JP4893194B2 (ja) 解析装置、および補正方法
Brandes et al. Genome-wide prediction of disease variant effects with a deep protein language model
US6950755B2 (en) Genotype pattern recognition and classification
Bravo et al. Model-based quality assessment and base-calling for second-generation sequencing data
JP5650083B2 (ja) 多重プローブターゲット相互作用パターンの自動分析:パターンマッチング及び対立遺伝子同定
US20120197623A1 (en) Methods and systems for nucleic acid sequence analysis
US20050159896A1 (en) Apparatus and method for analyzing data
JP4505589B2 (ja) 周期判定装置、周期判定方法および周期判定プログラム
Arrigo et al. Automated scoring of AFLPs using RawGeno v 2.0, a free R CRAN library
JP2011520206A (ja) 医療分析システム
JP2019080501A (ja) 品質評価方法、品質評価装置、プログラム、記録媒体、および品質管理試料
WO2018158412A1 (en) Method for identifying expression distinguishers in biological samples
Wu A review of statistical methods for preprocessing oligonucleotide microarrays
KR101967248B1 (ko) 개인의 유전 정보를 분석하는 방법 및 장치
KR20140090296A (ko) 유전 정보를 분석하는 방법 및 장치
JPWO2008007630A1 (ja) 蛋白質探索方法及び装置
WO2019132010A1 (ja) 塩基配列における塩基種を推定する方法、装置及びプログラム
JPWO2006088208A1 (ja) 生体の生理変化の予測方法および装置
Adolfsson et al. Whole exome sequencing of FFPE samples—expanding the horizon of forensic molecular autopsies
JP5213009B2 (ja) 遺伝子発現変動解析方法及びシステム、並びにプログラム
Chong et al. SeqControl: process control for DNA sequencing
EP3552127B1 (en) Methods for detecting variants in next-generation sequencing genomic data
Valdes et al. Methods to detect transcribed pseudogenes: RNA-Seq discovery allows learning through features
KR20150125030A (ko) 림프절 전이 또는 구강암 진단용 유전자 발굴 방법
JP4109873B2 (ja) プローブ設計方法及び情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees