JP4666237B2 - 遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置 - Google Patents

遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置 Download PDF

Info

Publication number
JP4666237B2
JP4666237B2 JP2008179256A JP2008179256A JP4666237B2 JP 4666237 B2 JP4666237 B2 JP 4666237B2 JP 2008179256 A JP2008179256 A JP 2008179256A JP 2008179256 A JP2008179256 A JP 2008179256A JP 4666237 B2 JP4666237 B2 JP 4666237B2
Authority
JP
Japan
Prior art keywords
ratio
gene
expression level
maximum
minimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008179256A
Other languages
English (en)
Other versions
JP2010017112A (ja
Inventor
直也 佐塚
剛 浅川
哲也 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008179256A priority Critical patent/JP4666237B2/ja
Priority to US12/496,041 priority patent/US8396673B2/en
Priority to CN2009101500812A priority patent/CN101624628B/zh
Publication of JP2010017112A publication Critical patent/JP2010017112A/ja
Application granted granted Critical
Publication of JP4666237B2 publication Critical patent/JP4666237B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Description

本発明は、バイオアッセイ用の基盤などを用いて得られた遺伝子発現量に係る技術分野に属するものである。
従来、設計された複数のDNAプローブと、サンプル細胞から抽出されたmRNAを逆転写酵素で変換したcDNAとの相補鎖の形成量を蛍光強度により測定し、当該測定結果からサンプル細胞に発現している遺伝子発現量を検出する技術がある。
この遺伝子発現量は、異なった条件下や異なった細胞間で相互比較して、その差異を抽出、解析することで有用性を発揮する。この相互比較では、そもそも比較可能であるかという点と、比較した際に相互間にどの程度の差異があれば有意な差異と認められるかという点が重要な要素となる。
前者の点に関して、既存の解析手法では一応の注意が払われており、マイクロアレイチップ間の規格化手法が数多く提案されている。しかしながら、後者の点に関しては、一般には、増加した遺伝子発現量だけに着目し、しかも比較対象の基準であるコントロールに対して2 倍という経験的な値を基準とし、その値よりも大きければ増加という変化があったものとされる(例えば非特許文献1参照)。
Ido Amit, Ami Citri,Tal Shay,他、A module of negativefeedback regulators defines growth factor signaling、NATURE GENETICS、VOLUME39,NUMBER4,APRIL,2007、p.503-512
一方、減少変化した遺伝子発現量は、増加変化した遺伝子発現量と同様に、生物学的な意義を精査する上では重要な要素である。しかしながら、減少変化する遺伝子発現量については、当該分野では着目されずに破棄されているか、または解析の対象外とされる状況にある。
本発明は以上の点を考慮してなされたもので、従来よりも詳細に遺伝子を解析させ得る遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置を提案しようとするものである。
かかる課題を解決するため本発明は、遺伝子検定方法であって、同一遺伝子における複数の測定時刻の発現量を示す時系列データを、複数の標的遺伝子についてそれぞれ取得する取得ステップと、時系列データに示される発現量を、基準とすべき測定時刻の発現量との比率に変換する変換ステップと、複数の標的遺伝子における時系列データごとに、最小となる比率と、最大となる比率とを抽出する抽出ステップと、最小となる比率の個数を測定時刻の時系列として表す分布でピークをとる第1の比率と、最大となる比率の逆数の個数を測定時刻の時系列として表す分布でピークをとる第2の比率との少なくとも一方を分類ボーダーとして、複数の標的遺伝子を分類する分類ステップとを有する。
また本発明は、遺伝子検定プログラムであって、取得部に対して、同一遺伝子における複数の測定時刻の発現量を示す時系列データを、複数の標的遺伝子についてそれぞれ取得することを実行させ、演算部に対して、時系列データに示される発現量を、基準とすべき測定時刻の発現量との比率に変換すること、複数の標的遺伝子における時系列データごとに、最小となる比率と、最大となる比率とを抽出すること、最小となる比率の個数を測定時刻の時系列として表す分布でピークをとる第1の比率と、最大となる比率の逆数の個数を測定時刻の時系列として表す分布でピークをとる第2の比率との少なくとも一方を分類ボーダーとして、複数の標的遺伝子を分類すること実行させる。
また本発明は、遺伝子検定装置であって、同一遺伝子における複数の測定時刻の発現量を示す時系列データを、複数の標的遺伝子についてそれぞれ取得する取得部と、時系列データに示される発現量を、基準とすべき測定時刻の発現量との比率に変換する変換部と、複数の標的遺伝子における時系列データごとに、最小となる比率と、最大となる比率とを抽出する抽出部と、最小となる比率の個数を測定時刻の時系列として表す分布でピークをとる第1の比率と、最大となる比率の逆数の個数を測定時刻の時系列として表す分布でピークをとる第2の比率との少なくとも一方を分類ボーダーとして、複数の標的遺伝子を分類する分類部とを有する
細胞内では各種物質が一定量に保つこと(ホメオスタシス)が一般に知られていることから、遺伝子発現量も一定量に保つ機能が存在するものと考えられる。一方、本発明により抽出される最小値の個数分布でピークは、対象とされる複数の遺伝子に対する発現量が細胞内でそれぞれ最小となるときのピークを示すものである。したがって、このピークは、標的細胞では恒常性によりもとに復帰し得る下位臨界点をもつ遺伝子が密集する部分という生物学的な意味を有すると考えることができ、このことからも、標的細胞において有意に減少したか否かのボーダーとして生物学的に意義のあるものとなる。
本発明は、このピークをとる値をボーダーとした場合、そのボーダーよりも低い最小値をとる遺伝子を、有意に減少した遺伝子とすることが可能となる。有意に減少した遺伝子を分類可能ということは、標的細胞において減少傾向にある遺伝子を着目せずに全て破棄していた従来に比べると、該標的細胞について網羅解析する上で極めて有用となる。
一方、本発明により抽出される最大値の逆数の個数分布でピークは、対象とされる複数の遺伝子に対する発現量が細胞内でそれぞれ最大となるときのピークを示すものである。したがって、このピークは、標的細胞では恒常性によりもとに復帰し得る上位臨界点をもつ遺伝子が密集する部分という生物学的な意味を有しているものと考えることができ、標的細胞において有意に増加したか否かのボーダーとして生物学的に意義のあるものとなる。
本発明は、このピークをとる値をボーダーとした場合、そのボーダーよりも高い最大値をとる遺伝子を、有意に増加した遺伝子とすることが可能となる。有意に増加した遺伝子を分類可能ということは、標的細胞での各遺伝子の発現動向を無視して、おおざっぱに発現量がコントロールの2倍となる遺伝子に着目していた従来に比べると、該標的細胞について網羅解析する上で極めて有用となる。
以下図面について本発明の一実施の形態を詳述する。
(1)遺伝子解析システムの全体構成
図1において、本実施の形態による遺伝子解析システム1の全体構成を示す。この遺伝子解析システム1には、蛍光強度読取装置3と、遺伝子検定装置4とが含まれた構成とされる。
蛍光強度読取装置3は、測定ステージを有し、該測定ステージには核酸チップCPがセットされる。核酸チップCPは、標的細胞における全遺伝子に対応する核酸プローブが配される基盤である。
この核酸チップCPでは、例えば図2に示すように、核酸プローブに(長波線で示す部分)対して、標的生物の細胞から抽出され、標識物質(黒丸で示す部分)を付加された標的核酸(短波線で示す部分)が与えられ、相補鎖の形成反応(以下、これをハイブリダイゼーションとも呼ぶ)が行われる。
核酸プローブは、一般には、特定の遺伝子における全塩基配列に対となるヌクレオチドではなく、当該遺伝子において特異的とされる複数の塩基配列部分にそれぞれ対となるヌクレオチド断片(以下、これをプローブセットとも呼ぶ)としてデザインされる。また、各プローブセットに対するコントロールもデザインされる。プローブセットとコントロールとは、対ごとに、核酸チップCPに割り当てられた所定の領域に配列される。ちなみに、プローブ断片は、具体的には、18〜60[mer]程度のDNA(deoxyribonucleic acid) 断片、cDNA(complementary DNA) 断片又はPNA(peptide nucleic acid)などが適用される。
一方、標的核酸は、核酸プローブとのハイブリダイゼーション対象とされる1本鎖のヌクレオチドである。一般に、標的核酸は、mRNA(pre-mRNAを含む)又はその断片そのものが用いられるのではなく、該mRNA又はその断片を逆転写酵素により変換したものが用いられる。
他方、標識物質は、一般に、ビオチンまたはFITC(fluorescein isothiocyanate)等の蛍光色素とされるが、これに限定されるものではなく、例えば放射性同位元素等としてもよい。
蛍光強度読取装置3(図1)は、測定指令が与えられた場合、測定ステージにセットされる核酸チップCPに対して、標的核酸に付加される標識物質の励起光を照射する。核酸チップCPに配される各遺伝子に対応する核酸プローブが標的核酸と相補鎖を形成している場合、該標的核酸に付加された標識物質が励起光により発光する。この発光量は、標的核酸と核酸プローブとの相補鎖の形成量と相関があり、該核酸プローブと相補鎖が形成される標的核酸の量が多いほど発光量が強くなる。
また蛍光強度読取装置3は、励起光を照射した後に核酸プローブ及びコントロールでの発光量を読み取り、読み取った発光量のデータ(以下、これを蛍光強度データと呼ぶ)を出力するようになされている。
遺伝子検定装置4は、例えば図3に示すように、継代した標的細胞から所定期間ごとに抽出される標的核酸と、同一の製品番号でなる別の核酸チップCPの核酸プローブとのハイブリダイゼーション結果から、読取時間t(mは自然数)ごとに標的生物における細胞での遺伝子G(nは自然数)の発現量GEを取得する。
そして遺伝子検定装置4は、遺伝子発現量GEから、遺伝子の分類に関するボーダー値(以下、これを分類ボーダー値とも呼ぶ)を決定し、該決定した分類ボーダー値と遺伝子発現量GEとを用いて遺伝子Gを分類するようになされている。
(2)遺伝子検定装置の回路構成
次に、遺伝子検定装置4の構成について説明する。この遺伝子検定装置4は、図4に示すように、該遺伝子検定装置4全体の制御を司るCPU(Central Processing Unit)10に対して各種ハードウェアを接続することにより構成される。
具体的には、例えば、ROM(Read Only Memory)11、CPU10のワークメモリとなるRAM(Random Access Memory)12、操作部13、記憶部14、インターフェース15及び表示部16がバス17を介して接続される。
ROM11には、遺伝子発現量を検定するためのプログラム(以下、これを遺伝子検定プログラムとも呼ぶ)が格納され、またインターフェイス15は、蛍光強度読取装置3に対して有線又は無線を通じてアクセス可能とされる。
CPU10は、ROM11に格納された遺伝子検定プログラムをRAM12に展開した場合、該遺伝子検定プログラムに基づいて記憶部14、インターフェース15及び表示部16を適宜制御し、遺伝子検定処理を実行するようになされている。
(3)遺伝子検定プログラムに基づくCPUの処理内容
遺伝子検定プログラムをRAMに展開したCPU10は、機能的には、図4に示したように、蛍光強度取得部21、発現量演算部22、基準決定部23及び分類部24の各部に分けることができる。
蛍光強度取得部21は、操作部13から、核酸チップCPに対する蛍光強度の読取要求を待ち受け、該読取要求を受けた場合、インターフェース15を用いて、該インターフェース15に接続される蛍光強度読取装置3に対して読取要求する。
また蛍光強度取得部21は、読取要求の応答として、蛍光強度読取装置3から蛍光強度を取得した場合、例えば取得日付及び取得番号を、当該核酸チップCPに関する識別子のデータ(以下、これをチップ識別データと呼ぶ)として生成するようになされている。
発現量演算部22は、蛍光強度取得部21が蛍光強度データを取得した場合、該蛍光強度データに基づいて、プローブセットごとに遺伝子発現量を算出し、該算出した各プローブセットでの遺伝子発現量を示すデータ(以下、これを発現量データと呼ぶ)をチップ識別データと関連付けて、記憶部14に保存するようになされている。
遺伝子発現量は、標的細胞内において発現している遺伝子を示す推定量であり、標的核酸と核酸プローブとの相補鎖の形成量に相関する発光量から、該発光量の割合として算出される。
この実施の形態の場合、遺伝子発現量は、Affymetrix社のMAS(Micro Array Suite)と呼ばれるデータ解析ソフトウェアのバージョン5を用いて算出される。
ここで、このMAS5を、1つのプローブセットに着目して簡単に説明する。MAS5では、(1)プローブセットにおける各プローブ断片での発光量から、局所的な物理的影響(バックグランド)が排除される。(2)各プローブ断片(パーフェクトマッチプローブと呼ばれる)の発光量が、当該プローブ断片と対応する断片コントロール(ミスマッチプローブと呼ばれる)との差に応じて適宜補正される。(3)各プローブ断片(パーフェクトマッチプローブと呼ばれる)の発光量が対数変換により遺伝子発現量として算出される。
詳細には、I.S.Kohane/A.T.Kho/A.J.Butte 星田有人著、統合ゲノミクスのためのマイクロアレイデータアナリシス、シュプリンガー・ジャパン出版、p.58−74を参照されたい。
基準決定部23は、操作部13から、分類ボーダー値の決定開始要求を待ち受け、該決定開始要求を受けた場合、2以上のチップ識別データ(または当該チップ識別データに関連付けられる発現量データ)が記憶部14に保存されている否かを認識する。
ここで、2以上のチップ識別データ(または発現量データ)が記憶部14に存在しない場合、このことは、標的細胞に対する遺伝子発現量の時間変化の情報が取得されていないことを意味する。この場合、基準決定部23は、その旨を、例えば表示部16を介して通知する。
これに対して、2以上のチップ識別データ(または発現量データ)が記憶部14に存在する場合、基準決定部23は、該記憶部14に保存される全てのチップ識別データと、該チップ識別データに関連付けられた発現量データとを用いて分類ボーダー値を決定する。
すなわち、基準決定部23は、例えば図5に示すように、各読取時間tのうち基準とすべき例えば読取時間tを決定し(図5(A))、各読取時間tの遺伝子発現量GEを、基準として決定した読取時間tの遺伝子発現量との比率に変換する(図5(B))。この結果、初期の遺伝子発現量を基準としたときの、当該遺伝子Gでの変化の割合が得られることとなる。ちなみに、図5における各遺伝子発現量GEの値は便宜的に示したものであり、実際の数値ではない。
また基準決定部23は、例えば図6に示すように、遺伝子Gごとに、最大となる比率(以下、これを最大発現量比率とも呼ぶ)GEnMAXと、最小となる比率(以下、これを最小発現量比率とも呼ぶ)GEnMINとを抽出する。
そして基準決定部23は、各遺伝子Gにおける最大発現量比率GEnMAXの逆数の個数分布でピークをとる比率(以下、これを最大逆比率分布ピーク値とも呼ぶ)と、各遺伝子Gにおける最小発現量比率GEnMINの個数分布でピークをとる比率(以下、これを最小比率分布ピーク値とも呼ぶ)とを分類ボーダー値として決定する。なお、最大発現量比率GEnMAXの「逆数」の分布としたのは、最小発現量比率の分布幅と同一とするためである。
ここで、実験結果を図7〜図10に示す。図7はE−GEOD−1036をサンプルとし、K562細胞に対してheminを刺激として与えたときの所定測定時間ごとの最大発現量比率GEnMAXの逆数の個数分布(図7(A))と、最小発現量比率GEnMINの個数分布(図7(B))を示したものである。この実験での測定時間は、0,6,12,24,48,72〔hour〕経過時点であり、遺伝子数は6936〔個〕である。
また図8はE−GEOD−6013をサンプルとし、A549細胞に対してアスベストを刺激として与えたときの所定測定時間ごとの最大発現量比率GEnMAXの逆数の個数分布(図8(A))と、最小発現量比率GEnMINの個数分布(図8(B))、および、A549細胞に対して刺激を与えずに所定測定時間ごとの最大発現量比率GEnMAXの逆数の個数分布(図8(C))と、最小発現量比率GEnMINの個数分布(図8(D))を示したものである。この実験での測定時間は、0,1,6,24,48〔hour〕,7〔days〕経過時点である。またこの実験での遺伝子数は、図8(A)及び図8(B)では16896〔個〕であり、図8(C)及び図8(D)では16453〔個〕である。
また図9はE−GEOD−6013をサンプルとし、Beas2B細胞に対してアスベストを刺激として与えたときの所定測定時間ごとの最大発現量比率GEnMAXの逆数の個数分布(図9(A))と、最小発現量比率GEnMINの個数分布(図9(B))、および、Beas2B細胞に対して刺激を与えずに所定測定時間ごとの最大発現量比率GEnMAXの逆数の個数分布(図9(C))と、最小発現量比率GEnMINの個数分布(図9(D))を示したものである。この実験での測定時間は、0,1,6,24,48〔hour〕経過時点である。またこの実験での遺伝子数は、図9(A)及び図9(B)では16896〔個〕であり、図9(C)及び図9(D)では18159〔個〕である。
また図10はE−GEOD−5264をサンプルとし、3人のヒト気管支上皮細胞における所定測定時間ごとの最大発現量比率GEnMAXの逆数の個数分布(図10(A)、図10(C)、図10(E))と、最小発現量比率GEnMINの個数分布(図10(B)、図10(D)、図10(F))を示したものである。この実験での測定時間は、図10(A)及び図10(B)では0,1,4,8,10,14,21,28〔days〕であり、図10(C)及び図10(D)では0,4,8,10,12,14,17,21,28〔days〕であり、図10(E)及び図10(F)では0,1,2,4,8,10,12,14,17,21,28〔days〕である。またこの実験での遺伝子数は、図10(A)及び図10(B)では16238〔個〕であり、図10(C)及び図10(D)では16047〔個〕であり、図10(E)及び図10(F)では15854〔個〕である。
なお、図7〜図9及び図10(A)、図10(C)、図10(E)における比率は0〜1を10分割したもの、つまり「1」は0以上0.1未満、「2」は0.1以上0.2未満、……、「10」は0.9以上1未満である。一方、図10(B)、図10(D)、図10(F)における比率は0〜1を20分割したもの、つまり「1」は0以上0.05未満、「2」は0.05以上0.1未満、……、「20」は0.95以上1未満である。
これら図7〜図10からも明らかなように、最小発現量比率の分布と、最大発現量比率の逆数の分布とは一定ではなくピークを有していることが分かる。ただし、最大発現量比率の逆数の分布では、基準「1」を最大値として扱う関係上、0.9(又は0.95)以上1未満における比率部分以外のピークが対象とされる。
最小発現量比率の分布と、最大発現量比率の逆数の分布の形状は細胞種によって異なるが、当該分布には細胞種にかかわらずピークが出現するということが本出願人により確認されている。
また、これらピークをとる比率は、細胞種にかかわらず、最小発現量比率の分布及び最大発現量比率の逆数の分布ともに、「0.7」を中心とする一定の範囲内に収まることも本出願人により確認されている。
細胞内では各種物質が一定量に保たれていることが一般に知られ(ホメオスタシス)、また細胞内におけるATP(アデノシン3リン酸)量と同調して、mRNAの構成材料となるCTP,GTP,UTPも一定となることが示唆されている(例えば、Faziol I. Ataullakhanov & Victor M. Vitvitsky, What determines the intracellular ATP oncentration, Bioscience Reports vol.22, Nos5&6,October & December 2002, p.501-p.511)。
このことから、細胞内では遺伝子発現量も一定量に保つ機能が存在するものと考えられる。一方、最小比率分布ピーク値は、対象とされる複数の遺伝子に対する発現量が細胞内でそれぞれ最小となるときのピークを示すものである。そうすると、このピークは、標的細胞では恒常性によりもとに復帰し得る下位臨界点をもつ遺伝子が密集する部分という生物学的な意味を有すると考えられる。このことからも、このピークは、標的細胞において有意に減少したか否かの減少ボーダーとして生物学的に意義のあるものということができる。
他方、最大逆比率分布ピーク値は、対象とされる複数の遺伝子に対する発現量が細胞内でそれぞれ最大となるときのピークを示すものである。このピークは、標的細胞では恒常性によりもとに復帰し得る上位臨界点をもつ遺伝子が密集する部分という生物学的な意味を有すると考えられる。このことからも、このピークは、標的細胞において有意に増加したか否かの増加ボーダーとして生物学的に意義のあるものということができる。
分類部24は、基準決定部23によって分類ボーダー値として決定された最小比率分布ピーク値及び最大逆比率分布ピーク値を用いて、遺伝子を各種グループに分類する。
具体的には、最大発現量比率GEnMAX>最大逆比率分布ピーク値、かつ、最小発現量比率GEnMIN>最小比率分布ピーク値となる比率をもつ遺伝子は、有意に増加した遺伝子グループとして割り当てる。この遺伝子グループに属する遺伝子は、概略的には例えば図11に示すような発現動向となる。
一方、最小発現量比率GEnMIN<最小比率分布ピーク値、かつ、最大発現量比率GEnMAX<最大逆比率分布ピーク値となる比率をもつ遺伝子は、有意に減少した遺伝子グループとして割り当てる。この遺伝子グループに属する遺伝子の発現量は、概略的には例えば図12に示すような発現動向となる。
他方、最大発現量比率GEnMAX<最大逆比率分布ピーク値、かつ、最小発現量比率GEnMIN>最小比率分布ピーク値となる比率をもつ遺伝子は、増減の乏しい遺伝子グループとして割り当てる。この遺伝子グループに属する遺伝子は、概略的には例えば図13に示すような発現動向となる。
また、最大発現量比率GEnMAX>最大逆比率分布ピーク値、かつ、最小発現量比率GEnMIN<最小比率分布ピーク値となる比率をもつ遺伝子は、有意に増減する乃至実験不良の遺伝子グループとして割り当てる。有意に増減する遺伝子は、概略的には例えば図14に示すような発現動向となる。
また分類部24は、遺伝子を各種グループに分類した場合、当該分類結果を例えばグラフとして適宜表示部16に表示するようになされている。
(4)遺伝子検定処理手順
次に、遺伝子検定プログラムに基づくCPU10の処理手順について、図15及び図16に示すフローチャートを用いて説明する。
すなわちCPU10は、例えば電源投入操作をトリガーとしてこの遺伝子検定処理手順を開始し、ステップSP1において核酸チップCPでの蛍光強度の読取要求を待ち受け、ステップSP2において分類ボーダー値の決定開始要求を待ち受ける。
CPU10は、蛍光強度の読取要求を受けた場合、ステップSP3に進んで、蛍光強度読取装置3に対して測定を開始させ、当該測定結果として蛍光強度読取装置3から与えられる蛍光強度データを取得する。そしてCPU10は、蛍光強度データから遺伝子発現量を示す発現量データを生成し、これを記憶部14に保存した後にステップSP1に戻る。
一方、CPU10は、分類ボーダー値の決定開始要求を受けた場合、ステップSP4に進んで、記憶部14に保存されているデータに基づいて、分類ボーダー値の決定に要する条件を満たすか否かを判定する。
CPU10は、記憶部14に2以上の発現量データが存在していない場合には、ステップSP5に進んで、分類ボーダー値の決定ができない旨及びその原因を通知し、ステップSP1に戻る。
これに対してCPU10は、記憶部14に2以上の発現量データが存在する場合には、ステップSP6に進んで、各遺伝子発現量GEを、読取期間tのいずれかを基準として、比率に変換し(図5)、次のステップSP7において、遺伝子ごとに、最大発現量比率GEnMAX及び最小発現量比率GEnMINを抽出する(図6)。
またCPU10は、続くステップSP8に進んで、最小比率分布ピーク値を減少ボーダーとして、最大逆比率分布ピーク値を増加ボーダーとしてそれぞれ決定した後(図7、図8)、続くステップSP9〜ステップSP15において遺伝子を分類する。
すなわちCPU10は、ステップSP9に進んで、対象とすべき遺伝子Gを決定し、該決定した遺伝子Gの最大発現量比率GEnMAXと、ステップSP8で決定した増加ボーダー(最大逆比率分布ピーク値)とを比較する。
またCPU10は、対象とした遺伝子の最大発現量比率GEnMAXが増加ボーダーよりも大きいものとなる場合にはステップSP10に進み、該最大発現量比率GEnMAXが増加ボーダーよりも小さいものとなる場合にはステップSP11に進む。そしてCPU10は、このステップSP10又はステップSP11において、対象とした遺伝子Gの最小発現量比率GEnMINと、ステップSP8で決定した減少ボーダー(最小比率分布ピーク値)とを比較する。
ここで、ステップSP9での比較結果として、最大発現量比率GEnMAXが増加ボーダーよりも大きいものとなり、ステップSP10での比較結果として、最小発現量比率GEnMINが減少ボーダーよりも小さいものとなる場合、CPU10は、ステップSP12に進んで、このとき対象とした遺伝子Gを、有意に増減する乃至実験不良の遺伝子グループとして割り当てる(図14)。
一方、ステップSP9での比較結果として、最大発現量比率GEnMAXが増加ボーダーよりも大きいものとなり、ステップSP10での比較結果として、最小発現量比率GEnMINが減少ボーダーよりも大きいものとなる場合、CPU10は、ステップSP13に進んで、このとき対象とした遺伝子Gを、有意に増加した遺伝子グループとして割り当てる(図11)。
他方、ステップSP9での比較結果として、最大発現量比率GEnMAXが増加ボーダーよりも小さいものとなり、ステップSP11での比較結果として、最小発現量比率GEnMINが減少ボーダーよりも小さいものとなる場合、CPU10は、ステップSP14に進んで、このとき対象とした遺伝子Gを、有意に減少した遺伝子グループとして割り当てる(図12)。
また、ステップSP9での比較結果として、最大発現量比率GEnMAXが増加ボーダーよりも小さいものとなり、ステップSP11での比較結果として、最小発現量比率GEnMINが減少ボーダーよりも大きいものとなる場合、CPU10は、ステップSP15に進んで、このとき対象とした遺伝子Gを、増減の乏しい遺伝子グループとして割り当てる(図13)。
このようにしてCPU10は、ステップSP16において全ての遺伝子Gを分類したと判定するまで、上述のステップSP9乃至ステップSP15の分類ループを繰り返す。一方、CPU10は、ステップSP16において全ての遺伝子Gを分類したと判定した場合、この遺伝子検定処理手順を終了するようになされている。
(5)動作及び効果
以上の構成において、この遺伝子検定装置4は、標的となる複数の遺伝子Gに対する各読取時間tでの発現量GEを示すデータを取得し(図3)、該各遺伝子Gの遺伝子発現量GEを、読取時間tの遺伝子発現量との比率に変換する(図5(B))。
そして遺伝子検定装置4は、遺伝子Gごとに、最小となる比率(最小発現量比率GEnMIN)と、最大をなる比率(最大発現量比率GEnMAX)とを抽出する(図6)。
この後、遺伝子検定装置4は、最大となる比率の個数分布(図7(A))でピークをとる比率(最大逆比率分布ピーク値)と、最小となる比率の逆数の個数分布(図7(B))でピークをとる比率(最小比率分布ピーク値)を用いて、各遺伝子Gを分類する。
最小比率分布ピーク値は、上述したように、標的細胞では恒常性によりもとに復帰し得る下位臨界点をもつ遺伝子が密集する部分という生物学的な意味を有すると考えることができる。つまりこの遺伝子検定装置4では、各遺伝子Gにおける発現動向全体のなかで、下位臨界点をもつであろう遺伝子群が多い発現部分が減少ボーダーとされる。
したがって、標的細胞での各遺伝子Gの発現動向を無視して、減少傾向にある遺伝子を着目せずに全て破棄していた従来に比べると、この遺伝子検定装置4は、標的細胞において、網羅解析すべき発現動向が減少する遺伝子として有意となるものを提示することが可能となる。このことは、遺伝子を網羅解析する(生物学的な意義を精査する)上では極めて有用となる。
一方、最大逆比率分布ピーク値は、上述したように、標的細胞では恒常性によりもとに復帰し得る上位臨界点をもつ遺伝子が密集する部分という生物学的な意味を有すると考えることができる。つまりこの遺伝子検定装置4では、各遺伝子Gにおける発現動向全体のなかで、上位臨界点をもつであろう遺伝子群が多い発現部分が増加ボーダーとされる。従来では増加傾向にある遺伝子とされる基準はおおよそコントロールの2倍、当該比率に換算すれば「0.5」で固定とされていた。
したがって、標的細胞での各遺伝子Gの発現動向を無視して、おおざっぱに発現量がコントロールの2倍となる遺伝子に着目していた従来に比べると、この遺伝子検定装置4は、標的細胞において、網羅解析すべき発現動向の大きい遺伝子として有意となるものを提示することが可能となる。このことも、遺伝子を網羅解析する(生物学的な意義を精査する)上では極めて有用となる。
これに加えて、各遺伝子Gの発現量GEから、分類基準としての最小比率分布ピーク値と、最大逆比率分布ピーク値とが求められるため、当該基準を得るためのコントロールがなくても、発現量データ間におけるボーダーを決定することが可能となる。このことは、操作性や精度等の観点からみると極めて有用となる。
また、この遺伝子検定装置4では、これら最小比率分布ピーク値及び最大逆比率分布ピーク値の双方を用いているので、最大発現量比率GEnMAX<最大逆比率分布ピーク値、かつ、最小発現量比率GEnMIN>最小比率分布ピーク値となる比率をもつ遺伝子を、増減の乏しい遺伝子グループとして割り当てることもできる。加えて、最大発現量比率GEnMAX>最大逆比率分布ピーク値、かつ、最小発現量比率GEnMIN<最小比率分布ピーク値となる比率をもつ遺伝子を、有意に増減する乃至実験不良の遺伝子グループとして割り当てることもできる。なお、有意に増減する乃至実験不良である可能性を示唆できるということは、遺伝子を網羅解析する(生物学的な意義を精査する)上では極めて有用となる。
また、この遺伝子検定装置4は、発現量データとして、複数の核酸プローブごとに、標的核酸との相補鎖形成量がセンサ(蛍光強度読取装置3)によって読み取られ、該読み取られた物理量(発光量)が、当該核酸プローブに対するコントロールでの物理量(発光量)の差に応じて補正された後に割合として変換されたものを対象とする。
センサ(蛍光強度読取装置3)から読み取られた物理量(発光量)そのものを対象とする場合に比して、バックグラウンド(局所的な物理的影響)等が排除されるので、発現量データは要求される相補鎖形成量に近似した信頼性の高いものとなる。
したがって、この遺伝子検定装置4は、センサ(蛍光強度読取装置3)から読み取られた物理量(発光量)そのものを対象とする場合に比して、分類基準としての最小比率分布ピーク値と、最大逆比率分布ピーク値とを極めて信頼性が高いものとして得ることができる。このことは、本出願人による実験結果からも確認されている。
なお、核酸プローブは、標的細胞での遺伝子の発現動向を加味した上で、分類基準としての最小比率分布ピーク値及び最大逆比率分布ピーク値を得るものであるから、その細胞における遺伝子に対応するプローブ数が多いほど、当該最小比率分布ピーク値及び最大逆比率分布ピーク値の信頼性はあがる。したがって、核酸プローブ数は、標的細胞において発現され得る総遺伝子に対応する数とすれば、最小比率分布ピーク値及び最大逆比率分布ピーク値の信頼性については最も高いものとなる。
以上の構成によれば、各遺伝子Gにおける最小発現量比率GEnMINの個数分布(図7(B))でピークをとる比率(最小比率分布ピーク値)と、各遺伝子Gにおける最大発現量比率GEnMAXの逆数の個数分布(図7(A))でピークをとる比率(最大逆比率分布ピーク値)を用いて、各遺伝子Gを分類するようにしたことにより、従来よりも詳細に遺伝子を解析させ得る遺伝子検定装置4を実現できる。
(6)他の実施の形態
複数の標的遺伝子における発現量を示す、比較対象とすべき2以上のデータを取得する取得形態として、上述の実施の形態では、標的細胞における複数の遺伝子Gにおける読取時間tあたりの発現量GEを示す発現量データが取得された(図3)。しかしながら、取得形態はこの実施の形態に限定されるものではない。
例えば、ある刺激を標的細胞に与えた場合における発現量GEを示すデータと、該刺激とは異なる刺激を標的細胞に与えた場合における発現量GEを示すデータとを取得するといった形態も適用可能である。もっとも、ある刺激を標的細胞に与えた場合における読取時間tあたりの発現量GEを示す発現量データと、該刺激とは異なる刺激を標的細胞に与えた場合における読取時間tあたりの発現量GEを示すデータとを取得することも可能である。
また例えば、ある標的細胞に刺激を与えた場合における発現量GEを示すデータと、該標的細胞とは異なる細胞に該刺激と同じ刺激を与えた場合における発現量GEを示すデータとを取得するといった形態も適用可能である。なお、標的細胞は、異生物の同一組織であっても、同生物の異組織であってもよい。
また、発現量データは、上述の実施の形態では、蛍光強度読取装置3から読み取られた蛍光強度から遺伝子発現量を算出することにより得られた。しかしながら、この形態に限定されるものではない。
例えば、標的細胞で発現される各mRNAを抽出し、これらをリアルタイムPCR(Polymerase Chain Reaction)を用いて、一定量に増殖することにより直接的に取得するといった形態も適用可能である。
また例えば、データ格納媒体から蛍光強度を示すデータを読み取り、該読み取った蛍光強度から遺伝子発現量を算出することにより得るといった形態も適用可能である。また例えば、データ格納媒体から遺伝子発現量を示すデータを読み取ることにより取得するといった形態も適用可能である。この形態を適用した場合、例えば遠方となる様々な実験場所で得られたデータを用いて、より多くの遺伝子発現量から分類基準を求めることが可能となり、この結果、より一段と網羅的な解析を行うことができる。
なお、データ格納媒体としては、例えばフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、DVD(Digital Versatile Disc)等のパッケージメディアや、データが一時的若しくは永続的に格納される半導体メモリや磁気ディスク等がある。またこれらデータ格納媒体からデータを取得する方法としては、ローカルエリアネットワークやインターネット、ディジタル衛星放送等の有線又は無線の通信媒体を利用することができる。
また、読取量として、上述の実施の形態では光学的に発光量を読み取るようにした。しかしながら、読取量はこの実施の形態に限定されるものではない。例えば、電磁学的に電気量又はインピーダンス量等を適用することもできる。要は、所定の物理量を読み取るセンサによって読み取られた読取量を適用することができる。なお、核酸チップCPとしては、例えば、Affymetrix社製、スタンフォード型等を適用することができ、これら以外のものを適用することもできる。
また、読取場所として、上述の実施の形態では核酸チップCPが対象とされた。しかしながら、読取場所はこれに限定されるものではない。例えば、組織切片を適用することができ、これ以外の場所も適用することができる。
また、遺伝子発現量の演算手法として、上述の実施の形態ではMASが適用された。しかしながら、演算手法はこれに限定されるものではない。例えば、RMA等の既知のデータ解析ソフトウェア、その他の新規の演算手法を適用することができる。このことは既に本出願人により確認されている。要は、センサから読み取られた、相補鎖の形成量を示すデータを統計学的手法を用いて補正するものであればよい。
本発明は、遺伝子実験、医薬の創製又は患者の経過観察などのバイオ産業上において利用可能である。
遺伝子解析システムの全体構成を示す概略図である。 核酸チップでのハイブリダイゼーションの説明に供する略線図である。 標的細胞における各読取時間での遺伝子発現量の取得の説明に供する略線図である。 遺伝子検定装置の構成を示すブロック図である。 各遺伝子における発現量に対する基準との比率への変換の説明に供する略線図である。 各遺伝子における最大及び最小をとる発現量比率の抽出の説明に供する略線図である。 実験結果(1)を示すグラフである。 実験結果(2)を示すグラフである。 実験結果(3)を示すグラフである。 実験結果(4)を示すグラフである。 発現量が有意に増加する遺伝子の発現動向を示す概略図である。 発現量が有意に減少する遺伝子の発現動向を示す概略図である。 発現量の増減が乏しい遺伝子の発現動向を示す概略図である。 発現量が有意に増減する遺伝子の発現動向を示す概略図である。 遺伝子検定処理手順(1)を示すフローチャートである。 遺伝子検定処理手順(2)を示すフローチャートである。
符号の説明
1……遺伝子解析システム、3……蛍光強度読取装置、4……遺伝子検定装置、10……CPU、11……ROM、12……RAM、13……操作部、14……記憶部、15……インターフェイス、16……表示部、21……蛍光強度取得部、22……発現量演算部、23……基準決定部、24……分類部、CP……核酸チップ、G〜G……遺伝子、GE〜GE……遺伝子発現量。

Claims (9)

  1. 同一遺伝子における複数の測定時刻の発現量を示す時系列データを、複数の標的遺伝子についてそれぞれ取得する取得ステップと、
    上記時系列データに示される発現量を、基準とすべき測定時刻の発現量との比率に変換する変換ステップと、
    複数の標的遺伝子における時系列データごとに、最小となる比率と、最大となる比率とを抽出する抽出ステップと、
    上記最小となる比率の個数を測定時刻の時系列として表す分布でピークをとる第1の比率と、上記最大となる比率の逆数の個数を測定時刻の時系列として表す分布でピークをとる第2の比率との少なくとも一方を分類ボーダーとして、上記複数の標的遺伝子を分類する分類ステップと
    を有する遺伝子検定方法。
  2. 上記分類ステップでは、
    上記最小となる比率の個数を測定時刻の時系列として表す分布で、規定値を中心とする一定の範囲内となったピークをとる第1の比率と、上記最大となる比率の逆数の個数を測定時刻の時系列として表す分布で、上記規定値を中心とする一定の範囲内となったピークをとる第2の比率との少なくとも一方を分類ボーダーとする
    請求項1に記載の遺伝子検定方法。
  3. 上記変換ステップでは、
    上記時系列データに示される発現量を、初期の測定時刻の発現量との比率に変換する
    請求項1又は請求項2に記載の遺伝子検定方法。
  4. 上記最大となる比率が上記第1の比率よりも小さく、かつ、上記最小となる比率が上記第2の比率よりも大きい条件を満たす標的遺伝子以外の標的遺伝子を、有意に変化した遺伝子グループとして割り当てる
    請求項1に記載の遺伝子検定方法。
  5. 上記最大となる比率が上記第1の比率よりも小さく、かつ、上記最小となる比率が上記第2の比率よりも小さい条件を満たす標的遺伝子を、減少した遺伝子グループとして割り当てる
    請求項2に記載の遺伝子検定方法。
  6. 上記最大となる比率が上記第1の比率よりも大きい条件を満たす標的遺伝子を、増加した遺伝子グループとして割り当てる
    請求項2に記載の遺伝子検定方法。
  7. 上記最大となる比率が上記第1の比率よりも大きく、かつ、上記最小となる比率が上記第2の比率よりも小さい条件を満たす標的遺伝子を、増減した遺伝子グループとして割り当てる
    請求項2に記載の遺伝子検定方法。
  8. 取得部に対して、同一遺伝子における複数の測定時刻の発現量を示す時系列データを、複数の標的遺伝子についてそれぞれ取得すること
    を実行させ、
    演算部に対して、上記時系列データに示される発現量を、基準とすべき測定時刻の発現量との比率に変換すること、
    複数の標的遺伝子における時系列データごとに、最小となる比率と、最大となる比率とを抽出すること、
    上記最小となる比率の個数を測定時刻の時系列として表す分布でピークをとる第1の比率と、上記最大となる比率の逆数の個数を測定時刻の時系列として表す分布でピークをとる第2の比率との少なくとも一方を分類ボーダーとして、上記複数の標的遺伝子を分類すること
    を実行させる遺伝子検定プログラム。
  9. 同一遺伝子における複数の測定時刻の発現量を示す時系列データを、複数の標的遺伝子についてそれぞれ取得する取得部と、
    上記時系列データに示される発現量を、基準とすべき測定時刻の発現量との比率に変換する変換部と、
    複数の標的遺伝子における時系列データごとに、最小となる比率と、最大となる比率とを抽出する抽出部と、
    上記最小となる比率の個数を測定時刻の時系列として表す分布でピークをとる第1の比率と、上記最大となる比率の逆数の個数を測定時刻の時系列として表す分布でピークをとる第2の比率との少なくとも一方を分類ボーダーとして、上記複数の標的遺伝子を分類する分類部と
    を有する遺伝子検定装置。
JP2008179256A 2008-07-09 2008-07-09 遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置 Expired - Fee Related JP4666237B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008179256A JP4666237B2 (ja) 2008-07-09 2008-07-09 遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置
US12/496,041 US8396673B2 (en) 2008-07-09 2009-07-01 Gene assaying method, gene assaying program, and gene assaying device
CN2009101500812A CN101624628B (zh) 2008-07-09 2009-07-09 基因检测方法和基因检测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008179256A JP4666237B2 (ja) 2008-07-09 2008-07-09 遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置

Publications (2)

Publication Number Publication Date
JP2010017112A JP2010017112A (ja) 2010-01-28
JP4666237B2 true JP4666237B2 (ja) 2011-04-06

Family

ID=41505479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008179256A Expired - Fee Related JP4666237B2 (ja) 2008-07-09 2008-07-09 遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置

Country Status (3)

Country Link
US (1) US8396673B2 (ja)
JP (1) JP4666237B2 (ja)
CN (1) CN101624628B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108323184A (zh) * 2015-05-28 2018-07-24 因姆内克斯普雷斯私人有限公司 验证生物标志物测量
CN105825078B (zh) * 2016-03-16 2019-02-26 广东工业大学 基于基因大数据的小样本基因表达数据分类方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010044132A1 (en) * 2000-05-12 2001-11-22 Houts Thomas M. Method for calculating and estimating the statistical significance of gene expression ratios

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101124341A (zh) * 2004-12-17 2008-02-13 国立大学法人东京大学 具有不同表达量的基因的鉴定方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010044132A1 (en) * 2000-05-12 2001-11-22 Houts Thomas M. Method for calculating and estimating the statistical significance of gene expression ratios

Also Published As

Publication number Publication date
US8396673B2 (en) 2013-03-12
CN101624628A (zh) 2010-01-13
US20100009370A1 (en) 2010-01-14
JP2010017112A (ja) 2010-01-28
CN101624628B (zh) 2013-06-12

Similar Documents

Publication Publication Date Title
WO2021067514A1 (en) Systems and methods for identifying morphological patterns in tissue samples
CA2877436C (en) Systems and methods for generating biomarker signatures
CN105468893A (zh) 辅助大肠癌的再发风险诊断的计算机系统、程序及方法
JP4666237B2 (ja) 遺伝子検定方法、遺伝子検定プログラム及び遺伝子検定装置
JPWO2002001477A1 (ja) 遺伝子発現データの処理方法および処理プログラム
JP2013531313A (ja) 複雑ネットワークにおけるシステム全体の動特性の定量化のためのシステム
US7068828B2 (en) Biochip image analysis system and method thereof
JP4174775B2 (ja) 生命情報解析装置、生命情報解析方法および生命情報解析プログラム
JP4487218B2 (ja) 遺伝子発現量解析方法、遺伝子発現量解析プログラム及び遺伝子発現量解析装置
JP4650702B2 (ja) 遺伝子分類方法、遺伝子分類プログラム及び遺伝子分類装置
JP2010046011A (ja) 遺伝子発現量正規化方法、遺伝子発現量正規化プログラム及び遺伝子発現量正規化装置
CN109863503B (zh) 用于单分子定量的系统和方法
JP4266575B2 (ja) 遺伝子発現データの処理方法および処理プログラム
JP2006506605A (ja) mRNAの絶対量を測定する方法及びシステム
JP2010113413A (ja) 遺伝子制御ネットワーク解析装置、遺伝子制御ネットワーク解析方法及び遺伝子制御ネットワーク解析プログラム
EP1267295A1 (en) A method and system for analyzing gene expression data using a smooth response surface algorithm
JP2003079934A (ja) ゲノム情報占い方法及びゲノム情報占い装置
KR20070086142A (ko) 유전자 발현량 규격화 방법, 프로그램 및 시스템
Wildsmith et al. Gene expression analysis using microarrays
KR100437253B1 (ko) 마이크로어레이 모사 이미지 생성 시스템 및 그 방법
US20140024546A1 (en) Systems and methods for normalizing gene expression profiles of biological samples having a mixed cell population
Analytics Microarray data analysis of GSE75676 GEO data of corneal Endothelium of Patients with Fuchs’ Dystrophy and comparison with Normal patients Brief Analysis using R Bioconductor Approach.” And “Analysis of proteomics using MaxQuant software
JP2009276204A (ja) 遺伝子発現解析方法、遺伝子発現解析装置及びプログラム
CN117672343A (zh) 测序饱和度评估方法及装置、设备及存储介质
Wildsmith et al. Gene Expression Analysis

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100506

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101008

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101216

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101229

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees