JP2006302064A - 生体情報処理装置および方法、プログラム、記録媒体、並びにdnaチップ - Google Patents
生体情報処理装置および方法、プログラム、記録媒体、並びにdnaチップ Download PDFInfo
- Publication number
- JP2006302064A JP2006302064A JP2005124572A JP2005124572A JP2006302064A JP 2006302064 A JP2006302064 A JP 2006302064A JP 2005124572 A JP2005124572 A JP 2005124572A JP 2005124572 A JP2005124572 A JP 2005124572A JP 2006302064 A JP2006302064 A JP 2006302064A
- Authority
- JP
- Japan
- Prior art keywords
- biological material
- probe
- biological
- index
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title description 82
- 239000012620 biological material Substances 0.000 claims abstract description 118
- 230000014509 gene expression Effects 0.000 claims abstract description 117
- 238000006243 chemical reaction Methods 0.000 claims abstract description 50
- 238000004364 calculation method Methods 0.000 claims abstract description 41
- 238000000018 DNA microarray Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 25
- 230000000295 complement effect Effects 0.000 claims description 24
- 239000006185 dispersion Substances 0.000 claims description 16
- 230000001174 ascending effect Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 1
- 239000000523 sample Substances 0.000 abstract description 300
- 238000009396 hybridization Methods 0.000 abstract description 113
- 108090000623 proteins and genes Proteins 0.000 abstract description 110
- 238000012545 processing Methods 0.000 abstract description 44
- 230000008878 coupling Effects 0.000 abstract description 23
- 238000010168 coupling process Methods 0.000 abstract description 23
- 238000005859 coupling reaction Methods 0.000 abstract description 23
- 239000000126 substance Substances 0.000 abstract description 19
- 230000008569 process Effects 0.000 description 65
- 230000005284 excitation Effects 0.000 description 46
- 238000010195 expression analysis Methods 0.000 description 45
- 238000013461 design Methods 0.000 description 42
- 238000012795 verification Methods 0.000 description 35
- 239000000758 substrate Substances 0.000 description 15
- 239000004065 semiconductor Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 239000000138 intercalating agent Substances 0.000 description 11
- 238000013500 data storage Methods 0.000 description 10
- 238000005259 measurement Methods 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000012706 support-vector machine Methods 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012938 design process Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 238000004166 bioassay Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 101150024653 61 gene Proteins 0.000 description 1
- 101150088993 62 gene Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 108091023043 Alu Element Proteins 0.000 description 1
- YBTVCUSZMGXJNW-FDNBCEJMSA-N C1=C2OCOC2=CC(/C=C\2/C(=C/C=3C=C4OCOC4=CC=3)/COC/2=O)=C1 Chemical compound C1=C2OCOC2=CC(/C=C\2/C(=C/C=3C=C4OCOC4=CC=3)/COC/2=O)=C1 YBTVCUSZMGXJNW-FDNBCEJMSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶ。
【解決手段】 ハイブリダイズ率計算部64は、第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、第2の生体物質に生体反応する第3の生体物質との結合の強さを表す結合強度に基づいて、第3の生体物質が第2の生体物質のうちの第1の生体物質と選択的に生体反応する傾向を表す指数を計算する。プローブ候補選択部65は、指数に基づいて、第1の生体物質の発現を検出するための第3の生体物質を選択する。本発明は、生体物質に関する情報を処理する生体情報処理装置に適用できる。
【選択図】図3
【解決手段】 ハイブリダイズ率計算部64は、第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、第2の生体物質に生体反応する第3の生体物質との結合の強さを表す結合強度に基づいて、第3の生体物質が第2の生体物質のうちの第1の生体物質と選択的に生体反応する傾向を表す指数を計算する。プローブ候補選択部65は、指数に基づいて、第1の生体物質の発現を検出するための第3の生体物質を選択する。本発明は、生体物質に関する情報を処理する生体情報処理装置に適用できる。
【選択図】図3
Description
本発明は生体情報処理装置および方法、プログラム、記録媒体、並びにDNAチップに関し、特に、生体物質に関する情報を処理するか、または生体物質を検出する生体情報処理装置および方法、プログラム、記録媒体、並びにDNAチップに関する。
近年、DNA(deoxyribonucleic acid)チップ若しくはDNAマイクロアレイ(以下、本明細書では両者を区別する必要がない場合、まとめて単にDNAチップと称する)の実用化が進んでいる。DNAチップは、多種・多数のDNAオリゴ鎖を、検出用核酸として基板表面に集積して固定したものである。DNAチップを用いて、基板表面のスポットに固定されたプローブと、細胞などから採取したサンプル中のターゲットとのハイブリダイゼーションを検出することにより、採取した細胞内における遺伝子発現を網羅的に解析することができる。
DNAチップを用いた遺伝子発現解析におけるハイブリダイゼーション検出技術の向上に伴い、単に、遺伝子発現の有無を検出するだけでなく、遺伝子発現量の定量的な測定が可能になりつつある。例えば、ハイブリダイゼーション検出の際に蛍光強度を定量的に測定することにより、遺伝子発現量を示す定量的な数値を取得する技術は、一部実用化されている。
従来、1つのエレメントに対して、エレメントの濃度(スポット中に含まれるエレメントの量)が異なるものを複数個チップ上にスポッティングするものもある(例えば、特許文献1参照)。
しかしながら、複数の遺伝子それぞれの発現量の定量的な測定には、測定しようとする遺伝子の数と同じ回数の測定の実施が必要であった。測定しようとする遺伝子の数より少ない回数の測定で、遺伝子それぞれの発現量を定量的に測定することは極めて困難であった。
また、このような場合の測定に用いるプローブを選ぶことは、困難であるだけでなく、極めて手間のかかる作業を必要とした。
本発明はこのような状況に鑑みてなされたものであり、複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶことができるようにするものである。また、複数の遺伝子それぞれの発現量を定量的に測定することができるようにするものである。
本発明の第1の側面は、第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、第2の生体物質に生体反応する第3の生体物質との結合の強さを表す結合強度に基づいて、第3の生体物質が第2の生体物質のうちの第1の生体物質と選択的に生体反応する傾向を表す指数を計算する計算手段と、指数に基づいて、第1の生体物質の発現を検出するための第3の生体物質を選択する選択手段とを備える生体情報処理装置である。
本発明の第1の側面においては、第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、第2の生体物質に生体反応する第3の生体物質との結合の強さを表す結合強度に基づいて、第3の生体物質が第2の生体物質のうちの第1の生体物質と選択的に生体反応する傾向を表す指数が計算され、指数に基づいて、第1の生体物質の発現を検出するための第3の生体物質が選択される。
計算手段は、結合強度の分散である指数を計算するようにすることができる。
選択手段は、指数に基づいて、第1の生体物質と最も選択的に生体反応する第3の生体物質を選択するようにすることができる。
選択手段は、第1の生体物質について、結合強度の分散である指数であって、最も値の大きい指数に対応する第3の生体物質を選択するようにすることができる。
選択手段は、複数の第1の生体物質について、それぞれ、結合強度の分散である指数であって、最も値の大きい指数に対応する第3の生体物質を選択して、さらに、選択した第3の生体物質の指数の小さい順に、第1の生体物質について、第3の生体物質を選択するようにすることができる。
選択手段は、所定の数の第1の生体物質と、所定の数の第3の生体物質との生体反応の確率を示す、指数を要素とする行列に基づいて、第1の生体物質のそれぞれの生体反応の確率が最大となるように、第3の生体物質を選択するようにすることができる。
計算手段は、第1の生体物質の所定の部分と相補的な構造の第3の生体物質について、指数を計算するようにすることができる。
計算手段は、第1の生体物質の先頭から部分までの距離を考慮した結合強度に基づいて、指数を計算するようにすることができる。
本発明の第2の側面は、第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、第2の生体物質に生体反応する第3の生体物質との結合の強さを表す結合強度から計算された、第3の生体物質が第2の生体物質のうちの第1の生体物質と選択的に生体反応する傾向を表す指数に基づき選択された、第1の生体物質の発現を検出するための第3の生体物質が固定されているDNAチップである。
本発明の第2の側面においては、第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、第2の生体物質に生体反応する第3の生体物質との結合の強さを表す結合強度から計算された、第3の生体物質が第2の生体物質のうちの第1の生体物質に選択的に生体反応する傾向を表す指数に基づき選択された、第1の生体物質の発現を検出するための第3の生体物質が固定されている。
以上のように、本発明の第1の側面によれば、DNAチップに固定するプローブを選択することができる。特に、複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶことが可能になる。
本発明の第2の側面によれば、遺伝子の発現を測定することができる。特に、複数の遺伝子それぞれの発現量を定量的に測定することが可能になる。
以下に本明細書において使用する用語の意味を説明する。
プローブとは、DNAチップなどのバイオアッセイ用の基板に固定された生体物質であって、ターゲットと生体反応するものをいう。
ターゲットとは、DNAチップなどのバイオアッセイ用の基板に固定された生体物質に生体反応する生体物質をいう。
生体物質とは、蛋白質、核酸、糖などの生体内において生成される物質の他、相互に相補的な塩基配列を有する遺伝子またはそれから派生する物質を含む。
生体反応とは、2以上の生体物質が生化学的に反応することをいう。その代表例は、ハイブリダイゼーションである。
ハイブリダイゼーションとは、相補的な塩基配列構造を備える核酸間の相補鎖(二本鎖)形成反応をいう。
図1は、遺伝子発現量の定量的な測定の処理のうち、実際に測定する前に事前作業する生体情報処理装置の構成例を表している。この生体情報処理装置1は、プローブ設計部11、DNAチップ作成部12、変換式取得部13、並びに結合強度行列取得部14により構成されている。
プローブ設計部11は、プローブを設計する。DNAチップ作成部12は、DNAチップを作成する。変換式取得部13は、変換式を取得する。結合強度行列取得部14は、結合強度行列を取得する。
図2は、プローブ設計部11の構成例を表している。プローブ設計部11は、発現解析用プローブ設計部31、ハイブリダイズ検証用プローブ設計部32、発現標準化用コントロールプローブ設計部33、並びに細胞数計数用コントロールプローブ設計部34により構成されている。
発現解析用プローブ設計部31は、発現解析用プローブを設計する。ハイブリダイズ検証用プローブ設計部32は、ハイブリダイズ検証用プローブを設計する。発現標準化用コントロールプローブ設計部33は、発現標準化用コントロールプローブを設計する。細胞数計数用コントロールプローブ設計部34は、細胞数計数用コントロールプローブを設計する。
次に、発現解析用プローブ設計部31を構成する発現解析用プローブ設計装置51について説明する。
図3は、発現解析用プローブ設計装置51の構成例を表している。発現解析用プローブ設計装置51は、遺伝子データベース61、遺伝子配列取得部62、入力部63、ハイブリダイズ率計算部64、プローブ候補選択部65、並びに出力部66により構成されている。
遺伝子データベース61は、各種の生物種の遺伝子の配列の情報を記録する。遺伝子配列取得部62は、入力部63からの、ユーザの指示に基づいて、遺伝子データベース61から遺伝子の配列の情報を取得する。入力部63は、生物種(cell line)または観測対象とする遺伝子ID群などを特定する、ユーザからの指示を入力する。
ハイブリダイズ率計算部64は、プローブ候補と、発現が予測される遺伝子群とがハイブリダイズする率であるハイブリダイズ率を計算する。プローブ候補選択部65は、ハイブリダイズ率に基づいて、プローブ候補を選択する。
出力部66は、選択したプローブ候補を示す情報であるプローブ配列群を出力する。
図4を参照して、遺伝子の発現量を定量的に測定する生体情報の処理を説明する。ステップS11において、実際に測定する前の事前作業が行われ、ステップS12において、遺伝子の発現量が定量的に測定される、実験過程が行われる。
次に、図5を参照して、図4のステップS11の事前作業の処理について説明する。ステップS31において、プローブ設計部11は、プローブを選択することにより、プローブを設計する。
ステップS32において、DNAチップ作成部12は、ステップS31の処理で設計されたプローブを固定したDNAチップを作成する。ステップS33において、変換式取得部13は、DNAチップに所定の励起光を照射して得られた蛍光の蛍光強度とそれに対応する、プローブとターゲットとのハイブリダイズ量との関係を一義的に決定する変換式(必ずしも式を構成せずとも、変換のためのデータであってもよい)である蛍光強度−ハイブリダイズ量変換式を取得する。ステップS34において、結合強度行列取得部14は、作成したDNAチップに、合成した所定のターゲットを所定の量ずつ滴下して、蛍光強度を取得することにより、複数のプローブの量と、これに結合する複数のターゲットのそれぞれの量との関係を示すプローブ−ターゲット結合強度行列を取得する。
図6は、図5のステップS31のプローブ設計の処理を説明するフローチャートである。ステップS51において、発現解析用プローブ設計部31(発現解析用プローブ設計装置51)は、発現解析用プローブを設計する。ステップS52において、ハイブリダイズ検証用プローブ設計部32は、ハイブリダイズ検証用プローブを設計する。
ハイブリダイズ検証用プローブとしては、実験対象としている生物種にない遺伝子配列が用いられる。例えば、実験対象が動物である場合(発現解析用プローブが動物の遺伝子である場合)には、ハイブリダイズ検証用プローブとして植物の葉緑素遺伝子が用いられ、ターゲットとしては、その相補配列が用いられる。すなわち、このハイブリダイズ検証用プローブと、ターゲットは、発現解析用プローブとそのターゲットのハイブリダイズとは無関係に、確実にハイブリダイズを起こすものが用いられる。しかも、その実験対象とは全く異なる種のものが用いられるため、ハイブリダイズ検証用プローブが充分ハイブリダイズしている場合には、この実験において(測定において)ハイブリダイズが確実に起きていることを検証することができる。逆に、ハイブリダイズ検証用プローブが充分ハイブリダイズしていない場合には、この測定は何らかの原因によりハイブリダイズが発生し難い環境になっている可能性がある。そこで、ハイブリダイズ検証用プローブの蛍光値を測定することで、その蛍光値が、例えばあらかじめ設定されている基準値以上であれば、正しいハイブリダイズ処理が行われていることを検証することができる。
図7は、発現解析用プローブの設計およびハイブリダイズ検証用プローブの設計を説明する図である。実験対象生物(被検体)の遺伝子情報を記録している遺伝子データベース61から、実験対象生物において発現する可能性のある遺伝子である発現可能遺伝子81の配列を示す情報が読み出される。発現可能遺伝子81には、観測の対象となる遺伝子である観測対象遺伝子82が含まれる。観測対象遺伝子82におけるプローブ認識部位83の相補配列が発現解析用プローブの配列とされる。
すなわち、n個の観測対象遺伝子821乃82nにおけるプローブ認識部位831乃至83n-2の相補配列が発現解析用プローブの配列とされる。例えば、プローブ認識部位83n-1および83n-2のように、1つの観測対象遺伝子82に対して複数のプローブ認識部位83を設けるようにしてもよい。このような場合でも、後述する結合強度行列として取得した実際のハイブリダイゼーションの分布を用いて、観測対象遺伝子82の発現量が推定されるので、推定の精度が低下することはなく、むしろ、1つの観測対象遺伝子82に対して複数のプローブ認識部位83を設けることで、推定の精度がより高くなる。
実験対象生物(被検体)と異なる生物種(実験対象生物にない遺伝子配列をもつ生物種)の遺伝子情報を記録している遺伝子データベース84から、ハイブリダイズ検証用遺伝子85としての、その生物種の遺伝子の配列を示す情報が読み出される。ハイブリダイズ検証用遺伝子85の一部分がプローブ認識部位86として選択される。
ハイブリダイズ検証用遺伝子85のプローブ認識部位86は、発現可能遺伝子81の配列と異なる配列とされる。例えば、プローブ認識部位86の相補配列のプローブと、発現可能遺伝子81の全てとの特異性が取得され、特異性の分散の和が大きいものが、プローブ認識部位86とされ、ハイブリダイズ検証用プローブは、プローブ認識部位86の相補配列とされる。
なお、ハイブリダイズ検証用プローブは、実験対象としている生物種にない遺伝子配列を独自に設計して用いるようにしてもよい。
図8は、特異的ハイブリダイズおよび非特異的ハイブリダイズを説明する図である。ターゲット1011とプローブ1021とが相補的な配列を有し、ターゲット1012とプローブ1022とが相補的な配列を有している場合の、ターゲット1011およびターゲット1012と、プローブ1021およびプローブ1022とのハイブリダイズを考えると、ハイブリダイズの分布は、確率と考えることができる。この考えに基づいて、ターゲット1011および1012と、プローブ1021および1022とにおける結合を示す結合強度を導入することができる。
結合強度a1 1は、ターゲット1011とプローブ1021とが結合する確率を示し、結合強度a2 2は、ターゲット1012とプローブ1022とが結合する確率を示す。結合強度a2 1は、ターゲット1011とプローブ1022とが結合する確率を示し、結合強度a1 2は、ターゲット1012とプローブ1022とが結合する確率を示す。
なお、結合強度aは、0以上1以下の値となる。
ターゲット1011とプローブ1021とのハイブリダイズおよびターゲット1012とプローブ1022とのハイブリダイズを、特異的ハイブリダイズと称する。ターゲット1011とプローブ1022とのハイブリダイズおよびターゲット1012とプローブ1022とのハイブリダイズを、非特異的ハイブリダイズと称する。
ここで、結合強度を用いて、プローブへのハイブリダイズを表すモデルを導入することができる。
・・・(1)
式(1)において、左辺の行列は、それぞれのプローブ種が配置されているスポットの蛍光強度ベクトルを示し、sは、標準化パラメータを示す。右辺の左側の行列は、結合強度を要素とするプローブ−ターゲット結合強度行列である。右辺の右側の行列は、遺伝子の発現量を示す遺伝子発現量ベクトルを示す。すなわち、それぞれのプローブ種が配置されているスポットの蛍光強度ベクトルは、標準化パラメータ、プローブ−ターゲット結合強度行列、および遺伝子発現量ベクトルを掛け算したものとして表すことができる。
なお、特異性は、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率で示される。特異性は、非特異的ハイブリダイズよりも、特異的ハイブリダイズがおきる性状とも言える。特異性を最大にするとは、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率を最も大きくすることとも言える。
特異性指数は、特異性を示す指数であり、1つのプローブについての、特異的ハイブリダイズの確率と非特異的ハイブリダイズの確率との関係を示す。
図6に戻り、ステップS53において、発現標準化用コントロールプローブ設計部33は、発現標準化用コントロールプローブを設計する。ステップS54において、細胞数計数用コントロールプローブ設計部34は、細胞数計数用コントロールプローブを設計する。
発現標準化用コントロールプローブおよび細胞数計数用コントロールプローブにより、データを標準化する処理が行われる。
発現標準化用コントロールプローブによる標準化は、次のようにして行われる。すなわち、発現標準化用コントロールプローブは、DNAチップの発現解析用反応槽のあらかじめ定められた所定の複数の位置(例えば、発現解析用反応槽の4隅と略中央の5ヶ所)に分散して配置されている。そして、この各位置に配置された発現標準化用コントロールプローブの蛍光値に基づいて、補正用曲面が、例えば、Bスプライン曲面に基づいて演算され、その補正用曲面によって得られる蛍光値により各ピクセルの蛍光値を割り算することで正規化が行われる。この正規化により、発現解析用反応槽内のスポットの位置によるハイブリダイゼーションのばらつきが補正される。
また、細胞数計数用コントロールプローブによる標準化は、細胞数計数用コントロールプローブに対するハイブリダイズ量の値(細胞数計数用コントロールプローブに基づく蛍光値)により、細胞数計数用反応槽上の各スポット上のピクセルの蛍光値を割り算することにより行われる。細胞数計算用コントロールプローブとしては、発現解析用プローブを抽出した生体のゲノム中の反覆配列(例えば、人間でいえばAlu配列)が用いられる。この処理により、取得された遺伝子の発現量を一定の細胞数当たりの値に換算することができる。
次に、図9のフローチャートを参照して、図6のステップS51の発現解析用プローブ設計の処理を説明する。ステップS71において、ハイブリダイズ率計算部64は、プローブ候補の特性指数を計算する。
ステップS72において、ハイブリダイズ率計算部64は、プローブ開始位置とその特異性指数を観測対象遺伝子82毎のスタックに格納する。ステップS73において、プローブ候補選択部65は、スタックから特異性指数が最大となるプローブ候補を返す手続きpop()を作成する。すなわち、pop()は、1つのスタックから、そのスタックに格納されている特異性指数のうち、最大の特異性指数をプローブ候補として返す手続きである。
ステップS74において、プローブ候補選択部65は、pop()を用いて各スタックからの観測対象遺伝子82数分のプローブ候補を取得する。
ここで、プローブ候補として、プローブ候補全体の特異性が最大になるプローブ候補を取得することが好ましい。特異性が最大になるとは、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率が最も大きくなることをいう。
しかしながら、式(3)に基づいてプローブ候補を選択する手法における計算量は膨大になってしまう。
そこで、個々のプローブ候補の特異性を最大にすることを考える。図10で示されるように個々のプローブとターゲットのそれぞれとの結合強度について分散をとった場合に、その和が最大となるプローブを求めるようにプローブ候補が選択される。例えば、プローブp2に対するターゲットg1乃至gmとの結合強度ベクトルa2の各々の要素(a2 1乃至a2 m)に対して分散をとった場合に、分散の和が最大となるプローブp2が選択される。
このような考えに基づいて、ステップS74において、プローブ候補選択部65は、1つのスタックから、そのスタックに格納されている特異性指数のうち、最大の特異性指数をプローブ候補として返すpop()を用いて各スタックからの観測対象遺伝子82数分のプローブ候補を取得する。
ステップS75において、プローブ候補選択部65は、プローブ候補の数が予め定めたプローブ数に達するまで、特異性指数が最小となるプローブ候補を取得したスタックからプローブ候補をさらに取得する。
プローブ候補選択部65は、取得したプローブ候補をプローブ配列群として、出力部66に出力させる。
図11を参照して、図9のステップS71のプローブ候補の特異性指数の計算の処理を説明する。ステップS91において、ハイブリダイズ率計算部64は、変数iの初期値を1とし、変数iを1ずつインクリメントして、変数iが観測対象遺伝子数Gon以下である間、それぞれの変数iについて、ステップS92乃至ステップS96の処理を繰り返し実行させるように処理を制御する。観測対象遺伝子数Gonは、観測対象遺伝子82の数を示す。変数iは、i番目の観測対象遺伝子82iを示す。
ステップS92において、ハイブリダイズ率計算部64は、変数Liに、lng(gi)−plを計算した結果を設定する。遺伝子塩基長lng(gi)は、i番目の観測対象遺伝子82iの遺伝子の塩基の長さを示す値である。プローブ塩基長plは、プローブの塩基の長さを示す値である。すなわち、変数Liには、観測対象遺伝子82iの遺伝子塩基長からプローブ塩基長を引き算した値が設定される。
ステップS93において、ハイブリダイズ率計算部64は、変数kの初期値を0とし、変数kを1ずつインクリメントして、変数kが変数Li未満である間、それぞれの変数kについて、ステップS94乃至ステップS96の処理を繰り返し実行させるように、処理を制御する。変数kは、観測対象遺伝子82iの開始点からの距離を示す。
ステップS93において、変数kが変数Li以上になったと判定された場合、ステップS91に戻り、上述した処理を繰り返す。
ステップS94において、ハイブリダイズ率計算部64は、変数jの初期値を1とし、変数jを1ずつインクリメントして、変数jが発現が予測される遺伝子数Gwn以下である間、それぞれの変数jについて、ステップS95の処理を繰り返し実行させるように処理を制御する。発現が予測される遺伝子数Gwnは、発現可能遺伝子81の数を示す。変数jは、j番目の発現可能遺伝子81jを示す。なお、遺伝子数Gwnは、観測対象遺伝子数Gon以下である。また、プローブの数pnは、観測対象遺伝子数Gon以下である。
ステップS95において、ハイブリダイズ率計算部64は、変数kおよび変数jに対応する結合指数ekjに、Sep(k)×Hom(gi(k,pl),gj)を計算した結果を設定する。結合指数ekjは、ハイブリダイズ率に対応する。結合指数ekjは、結合強度aの推定値とも言える。
結合強度Hom(gi(k,pl),gj)は、gi(k,pl)で示される塩基配列のプローブと、j番目の発現可能遺伝子81jであるターゲットgjとの結合の強さを示す値である。すなわち、gi(k,pl)は、開始点kにおける遺伝子候補である。
脱落係数Sep(k)は、変数kで示される距離であって、開始点からの距離に依存した結合強度を補正する値である。
プローブpおよびターゲットgについての結合強度Hom(p,g)は、例えば、式(4)で示される。
・・・(4)
ここで、lng(g)は、ターゲットgの遺伝子長を示し、plは、プローブ長を示す。pkは、プローブpのk番目の塩基種を示し、gsは、ターゲットのs番目の塩基種を示す。W(Lg,Lp)は、ターゲットgの長さLgおよびプローブpの長さLpに依存した重みを示す。
ここで、lng(g)は、ターゲットgの遺伝子長を示し、plは、プローブ長を示す。pkは、プローブpのk番目の塩基種を示し、gsは、ターゲットのs番目の塩基種を示す。W(Lg,Lp)は、ターゲットgの長さLgおよびプローブpの長さLpに依存した重みを示す。
E(b1,b2)は、塩基種ペアであるb1とb2との結合強度を示す。E(b1,b2)は、具体的には、E(A,T)=E(T,A)=E(C,G)=E(G,C)=1であり、それ以外の組み合わせは、0である。なお、Aは、アデニンを示し、Tは、チミンを示し、Cは、シトニンを示し、Gはグアニンを示す。
図12で示されるように、結合強度Hom(p,g)は、プローブ102と、発現可能遺伝子81の部分81Aであって、発現可能遺伝子81の開始点からの距離81Bを0から(遺伝子長lng(g)−1)まで変化させた位置の塩基を先頭とする、プローブ長plと同じ長さの部分81Aとの結合の強さの総和に対応する値を示す。
ステップS95におけるプローブgi(k,pl)は、i番目の観測対象遺伝子82iの、開始点からの距離kの位置を先頭とし、プローブ塩基長plと同じ長さの部分の相補塩基配列を示す。なお、距離kは、変数kで示され、プローブ塩基長plは、変数plで示される。
このように、ステップS95において、1から、発現が予測される遺伝子数Gwnまで変化させた変数j(すなわち、発現可能遺伝子81j)と、0から、変数Li(lng(gi)−pl)まで変化させた変数kについて、変数jと変数kの組み合わせに対する結合指数ekjを計算する。すなわち、図13で示されるように、発現可能遺伝子81のそれぞれと、i番目の観測対象遺伝子82iのプローブ塩基長plと同じ長さの部分の相補塩基配列との結合指数ekjを計算する。この場合、観測対象遺伝子82iにおけるプローブ塩基長plと同じ長さの部分の先頭の位置は、観測対象遺伝子82iの開始点からlng(gi)−plまで、順に変えられる。
ここで、脱落係数Sep(k)について説明する。
図14は、RNA増幅を説明する図である。発現可能遺伝子81であるmRNA131から逆転写により、mRNA131と相補配列のDNA132が生成される。そして、DNA132を基にして、二本鎖cDNA133が生成される。二本鎖cDNA133における、DNA132の相補配列は、テンプレート134として用いられる。酵素を用いてテンプレート134から、テンプレート134との相補配列(mRNA131と相補配列)のcRNA135が生成される。
この場合、酵素は、開始点から順にテンプレート134をなぞってcRNA135を転写するが、cRNA135の転写中に、テンプレート134から脱落する場合がある。酵素のテンプレート134から脱落する確率は、テンプレート134の開始点から離れる程、大きくなる。
そこで、図14で示されるRNA増幅によって増幅されたcRNA135をターゲットとする場合、酵素のテンプレート134から脱落する確率を補正して、被検体における発現の量を正確に測定するため、脱落係数Sep(k)を結合強度Hom(gi(k,pl),gj)に乗じた値が結合指数ekjとされる。
脱落係数Sep(k)は、例えば、式(5)で算出される。
Sep(k)=1−ck{lng(gi)−pl}-1
・・・(5)
cは、1未満の定数である。
Sep(k)=1−ck{lng(gi)−pl}-1
・・・(5)
cは、1未満の定数である。
図15で示されるように、脱落係数Sep(k)は、開始点からの距離を示す変数kが0の場合、1となり、変数kがlng(gi)である場合、1−cとなり、変数kに応じて線形に変化する。
なお、RNA増幅しないで発現量を求める場合、脱落係数Sep(k)を用いずに、結合強度Hom(gi(k,pl),gj)がそのまま結合指数ekjとされる。
ステップS94において、変数kが変数Li以上となったと判定された場合、ステップS96に進む。
ステップS96において、ハイブリダイズ率計算部64は、結合平均強度eおよび特異性指数eikを算出し、ステップS93に戻り、上述した処理を繰り返す。
ステップS91において、変数iが観測対象遺伝子数Gonを超えたと判定された場合、処理は終了する。
このように、観測対象遺伝子82の塩基配列から、プローブ塩基長plの塩基配列を抽出した部分と相補的な塩基配列であるプローブgi(k,pl)のそれぞれについて、特異性指数eikが算出される。すなわち、1つの観測対象遺伝子82iについて、変数Liの数だけ、特異性指数eikが算出される。
ステップS72においては、このように1つの観測対象遺伝子82iについて算出された特異性指数eikが、その観測対象遺伝子82iに対応するスタックに、プローブ開始位置(k)と共に格納される。
そして、全ての観測対象遺伝子82について、所定の数の特異性指数eikが算出されることになる。
従って、全ての観測対象遺伝子82について、個々に対応するスタックの全てに、それぞれの観測対象遺伝子82についての、所定の数の特異性指数eikがプローブ開始位置と共に格納されることになる。
図16は、特異性指数eikと結合強度aとの関係を説明する図である。特異性を最大にするために、特異性指数eikが最大となるプローブを採用する。特異性指数eikは、結合強度ベクトルの要素の分散値に対応する。
図16で示されるように、m個の観測対象遺伝子82をターゲットg1乃至gmとし、観測対象遺伝子82以外のf個の発現可能遺伝子81をターゲットg1+1乃至gm+fとし、n個のハイブリダイズ検証用プローブをプローブp1乃至pnとした場合、ターゲットg1乃至gm+fと、プローブp1乃至pnとの結合強度行列は、結合強度a1 1乃至an m+fを要素とする。
例えば、結合強度a2 1はターゲットg1とプローブp2との結合の確率を示し、結合強度a2 2はターゲットg2とプローブp2との結合の確率を示し、同様に、結合強度a2 3乃至a2 m+fは、それぞれ、ターゲットg3乃至gm+fとプローブp2との結合の確率を示すので、ターゲットg1乃至gm+fのそれぞれとプローブp2との結合の確率は、結合強度行列の要素のうちの、結合強度a2 1乃至a2 m+fを要素とする結合強度ベクトルa2により表される。
結合強度行列の1行の要素の分散値は、対応するプローブpが特定のターゲットgと結合する傾向を示す。結合強度行列の1行の要素の分散値がより大きくなると、対応するプローブpが特定のターゲットgと結合する傾向が強くなる。例えば、結合強度行列の2行目の要素である結合強度a2 1乃至a2 m+fの分散値の分散値は、プローブp2がターゲットg1乃至gm+fのうちの特定のターゲットgと結合する傾向を示す。例えば、結合強度行列の2行目の要素である結合強度a2 1乃至a2 m+fの分散値の分散値がより大きくなると、プローブp2がターゲットg1乃至gm+fのうちの特定のターゲットgと結合する傾向が強くなる。より詳しく説明すれば、結合強度a2 1乃至a2 m+fのうち、結合強度a2 2が最大で、結合強度行列の2行目の要素である結合強度a2 1乃至a2 m+fの分散値がより大きくなると、プローブp2がターゲットg2と結合し、ターゲットg1およびターゲットg3乃至gm+fに結合しない傾向が強くなる。
例えば、プローブp2がターゲットg2にのみ結合し、プローブp2がターゲットg1およびターゲットg3乃至gm+fに結合しない場合の結合強度a2 1乃至a2 m+fの分散値(すなわち、結合強度a2 1が1で、それ以外が0であるときの分散値)と、プローブp2がターゲットg1乃至gm+fに同じ確率で結合する場合の結合強度a2 1乃至a2 m+fの分散値(すなわち、総ての結合強度aが一定で平均値に等しい)とを比較すると、結合強度aが0以上1以下の値なので、プローブp2がターゲットg2にのみ結合し、プローブp2がターゲットg1およびターゲットg3乃至gm+fに結合しない場合の結合強度a2 1乃至a2 m+fの分散値は、プローブp2がターゲットg1乃至gm+fに同じ確率で結合する場合の結合強度a2 1乃至a2 m+fの分散値より大きい。
すなわち、ターゲットg2にのみ結合し、ターゲットg1およびターゲットg3乃至gm+fに結合しない傾向が最も強いプローブp2を選択するには、結合強度a2 1乃至a2 m+fのうち結合強度a2 2が最大となり、結合強度a2 1乃至a2 m+fの分散値がより大きくなるプローブp2を選択すればよい。
分散値がより大きくなるプローブpを選択することにより、特定のターゲットについて、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率を最も大きく、すなわち、特異性を最大にできる。
上述したように、ステップS95において、結合強度aに対応する結合指数ekjが算出され、ステップS96において、プローブのそれぞれについて、結合指数ekjの分散である特異性指数eikが算出される。
特異性指数eikを基にして、複数の観測対象遺伝子82の発現を観測するための複数の発現解析用プローブを選ぶことができる。
次に、図17を参照して、図9のステップS73乃至ステップS75の処理をより詳細に説明する。
ステップS121において、プローブ候補選択部65は、変数iの初期値を1とし、変数iを1ずつインクリメントして、変数iが、n以下である間、それぞれの変数iについて、ステップS122乃至ステップS124の処理を繰り返し実行させるように処理を制御する。例えば、nは、観測対象遺伝子数Gonとされる。
ステップS122において、プローブ候補選択部65は、特異性指数ei1乃至eiLi乃至から最大の特異性指数eikと、対応するkを取り出す手続きpop(e)を作成する。すなわち、手続きpop(e)によれば、1つの観測対象遺伝子82iに対応するスタックに格納されている特異性指数ei1乃至eiLiのうち、最大の特異性指数eikと、対応するkとが取り出される。
ステップS123において、プローブ候補選択部65は、手続きpop(e(gi))によって、観測対象遺伝子82iに対応するスタックから、そのスタックに格納されている特異性指数eのうち、最大の特異性指数eikを取り出すと共に、対応するkを取り出す。プローブ候補選択部65は、抽出した最大の特異性指数eikを変数diに設定して、配列(i,di,k)を生成する。
なお、手続きpop(e)によって、最大の特異性指数eikと、対応するkとが取り出された場合、プローブ候補選択部65は、最大の特異性指数eikが抽出されたスタックから、取り出された特異性指数eikに対応するプローブと共通する塩基配列を有するプローブに対応する特異性指数を削除する。例えば、図18で示されるように、観測対象遺伝子82iに対応するスタックに、プローブ102iのそれぞれに対応する特異性指数ei0乃至特異性指数eiLi-1が格納されている場合、手続きpop(e)によって、観測対象遺伝子82iに対応するスタックから最大の特異性指数eikが取り出されたとき、プローブ候補選択部65は、観測対象遺伝子82iに対応するスタックから、取り出された特異性指数eikに対応するプローブ102ikと共通する塩基配列を有するプローブ102i(k-1)に対応する特異性指数ei(k-1)およびプローブ102i(k+1)に対応する特異性指数ei(k+1)を削除する。
ステップS124において、プローブ候補選択部65は、プローブgi(k,pl)をプローブ群に加え、ステップS121に戻り上述した処理を繰り返す。
ステップS123およびステップS124の処理はn回繰り返されるので、n個の配列(i,di,k)が生成され、n個のプローブgi(k,pl)がプローブ群に加えられることになる。
ステップS121において、変数iが観測対象遺伝子数Gonを超えたと判定された場合、ステップS125に進む。
ステップS125において、プローブ候補選択部65は、変数jの初期値をn+1とし、変数jを1ずつインクリメントして、変数jが、所定の定数m以下である間、それぞれの変数jについて、ステップS126乃至ステップS131の処理を繰り返し実行させるように処理を制御する。
ステップS126において、プローブ候補選択部65は、配列(i,di,k)(0≦i≦n)から最小となるdiと、これに対応するiを取り出す。ステップS127において、プローブ候補選択部65は、diが0に等しいか否かを判定し、diが0に等しくないと判定された場合、ステップS128に進み、プローブ候補選択部65は、手続きpop(e(gi))によって、観測対象遺伝子82iに対応するスタックから、そのスタックに格納されている特異性指数eのうち、最大の特異性指数eikを取り出すと共に、対応するkを取り出す。プローブ候補選択部65は、抽出した最大の特異性指数eikを変数diに設定して、配列(i,di,k)を生成する。
ステップS129において、プローブ候補選択部65は、popできなかったか否か(最大の特異性指数eikおよび対応するkを取り出すことができなかったか否か)を判定し、popできなかった(最大の特異性指数eikおよび対応するkを取り出すことができなかった)と判定された場合、ステップS130に進み、配列(i,di,k)を削除して、ステップS126に戻り、上述した処理を繰り返す。
ステップS129において、popできた(最大の特異性指数eikおよび対応するkを取り出すことができた)と判定された場合、ステップS131に進み、プローブ候補選択部65は、プローブgi(k,pl)をプローブ群に加え、ステップS125に戻り、上述した処理を繰り返す。
ステップS125において、変数jが、所定の定数mを超えたと判定された場合、またはステップS127において、diが0に等しいと判定された場合、処理は終了する。
図19で示されるように、ステップS123の処理において、それぞれのスタックにおいて最大の特異性指数eikおよび対応するkiが取り出され(1≦i≦Gon)、ステップS124の処理において、プローブgi(ki,pl)がプローブ群に加えられる。そして、ステップS128の処理において、それぞれのスタックから取り出された特異性指数eikのうち、最も小さい特異性指数eikが取り出されたスタックから、さらに、そのスタックにおいて最大の特異性指数eikおよび対応するkiが取り出され、ステップS131の処理において、取り出されたkiに対応するプローブgi(ki,pl)がプローブ群に加えられる。
図20は、ステップS125乃至ステップS131の処理で取り出されるプローブと、結合強度aとの関係を説明する図である。図20において、m個の観測対象遺伝子82をターゲットg1乃至gmとし、観測対象遺伝子82以外のf個の発現可能遺伝子81をターゲットg1+1乃至gm+fとし、n個のハイブリダイズ検証用プローブをプローブp1乃至pnとする。
ステップS123の処理において、m個の観測対象遺伝子82のそれぞれに対応するスタックから、スタックにおいて最大の特異性指数eikおよび対応するkiが取り出され、ステップS124の処理において、最大の特異性指数eikに対応するプローブgi(ki,pl)がプローブ群に加えられるので、m個のプローブと、結合強度行列の、結合強度a1 1乃至am m+fである要素とが決まる。
スタックにおいて最大の特異性指数eikのうち、最小の特異性指数eikを選ぶことは、現在プローブ群に加えられているプローブについての結合強度行列の全ての行ベクトル要素の分散値eikの中で最小となる、ターゲットg1乃至gmのいずれかを選択することを意味する。他の値に比較して分散値eikが小さいということは、特異性が小さいことを示し、他のターゲットに比較して、そのターゲットがプローブと結合する確率が小さいと言える。
そこで、既に選択されているプローブと結合する確率が、他のターゲットに比較して小さいターゲットを検出するためのプローブをさらに選択する。
例えば、図20で示されるように、現在プローブ群に加えられているプローブについての結合強度行列の全ての行ベクトル要素の分散値eikの中で最小となるターゲットg2が選択されると、ターゲットg2について、結合強度a’2 1乃至a’2 m+fであるベクトル要素の分散値が最大になるプローブがさらに選択されて、プローブ群に加えられる。すなわち、ターゲットg2に対するスタックから、さらに、そのスタックにおいて最大の特異性指数eikが選択され、対応するプローブがプローブ群に加えられる。
このようにすることで、所定の個数の観測対象遺伝子82をより確実に検出できるようになる。
なお、上述したように、ステップS123の処理において、手続きpop(e)によって、最大の特異性指数eikおよび対応するkiが取り出されると、取り出された特異性指数eikに対応するプローブと共通する塩基配列を有するプローブに対応する特異性指数が削除されるので、ステップS131の処理において、プローブ群に加えられるプローブの塩基配列は、既にプローブ群に加えられているプローブの塩基配列と重複することがない。これにより、より正確に、ターゲットを検出することができるようになる。
このように、DNAチップに固定するプローブを選択することができる。特に、より少ない回数の測定で、複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶことが可能になる。
次に、実験過程の処理および実験過程の処理を実行する装置について説明する。
遺伝子発現量の定量的な測定は、図21に示される実験過程処理装置301により行われる。
実験過程処理装置301は、調整部321、ハイブリダイズ部322、取得部323、発現量推定部324、標準化部325、出力部326、および記憶部327により構成されている。
調整部321はターゲットの調整を行う。ハイブリダイズ部322はプローブとターゲットとのハイブリダイズを行う。取得部323は蛍光強度を取得する。発現量推定部324は発現量の推定処理を行う。標準化部325はデータの標準化を行う。出力部326は発現プロファイルデータを出力する。記憶部327は発現プロファイルデータを記憶する。
図22は、図21の実験過程処理装置301の一部を構成する生体情報処理装置の構成例を表している。この生体情報処理装置331は、DNAチップ351、ピックアップ部361、蛍光強度取得部362、励起光強度計算部363、ハイブリダイズ量推定部364、発現量計算部365、標準化部366、出力部367、発現プロファイルデータ記憶部368、表示部369Aを有するユーザインターフェース(UI)部369、蛍光強度−ハイブリダイズ量変換式記憶部370、並びに機械的学習部371により構成されている。
なお、実験過程処理装置301の取得部323、発現量推定部324、標準化部325、出力部326および記憶部327が、生体情報処理装置331により構成されている。具体的には、取得部323は、ピックアップ部361、蛍光強度取得部362、励起光強度計算部363、および蛍光強度−ハイブリダイズ量変換式記憶部370により構成され、発現量推定部324は、ハイブリダイズ量推定部364、発現量計算部365、および機械的学習部371により構成され、標準化部325は標準化部366により構成され、出力部326は出力部367により構成され、記憶部327は発現プロファイルデータ記憶部368により構成される。
DNAチップ351は、スポット352とガイド353を有している。図23は、DNAチップ351のより詳細な構成例を表している。
DNAチップ351は、その基板351A上に、発現解析用反応槽501と細胞数計数用反応槽502を有している。基板351Aの図中下側の端部には、直線状の開始位置ガイド353Aが設けられ、図中上側の端部には、終了位置ガイド353Bが設けられている。図22のガイド353は、具体的には、この開始位置ガイド353Aと終了位置ガイド353Bにより構成される。
発現解析用反応槽501と細胞数計数用反応槽502は、この開始位置ガイド353Aと終了位置ガイド353Bの間に配置されている。
発現解析用反応槽501には、反応領域としての複数のスポット352が形成されており、各スポット352には、生体物質(第3の生体物質)としてのハイブリダイズ検証用プローブ511、発現解析用プローブ512、並びに発現標準化用コントロールプローブ513が固定されている。発現解析用反応槽501にサンプルが滴下された場合、ハイブリダイズ検証用プローブ511には、その塩基と相補的構成を有する塩基を有する生体物質(第2の生体物質)としてのターゲット511Aがハイブリダイズする。同様に、発現解析用プローブ512には、その塩基と相補的構成を有する塩基を有する生体物質としてのターゲット512Aがハイブリダイズする。
なお、発現解析用プローブ512は、発現解析用プローブ設計装置51により設計される。
また、発現標準化用コントロールプローブ513には、その塩基と相補的構成の塩基を有する生体物質としてのターゲット513Aがハイブリダイズする。
細胞数計数用反応槽502においては、生体物質としてのハイブリダイズ検証用プローブ514と細胞数計数用コントロールプローブ515が、それぞれ反応領域としてのスポット352に取り付けられている。細胞数計数用反応槽502にサンプルが滴下された場合、ハイブリダイズ検証用プローブ514には、その塩基と相補的構成の塩基を有する生体物質としてのターゲット514Aがハイブリダイズし、細胞数計数用コントロールプローブ515には、その塩基と相補的構成の塩基を有する生体物質としてのターゲット515Aがハイブリダイズする。
ハイブリダイズした(生体反応した)生体物質としてのプローブとターゲットには、インターカレータ516が結合されている。インターカレータ516は励起光が照射されると蛍光を発生する。
図23には、このように、各プローブに対してターゲットがハイブリダイズした状態が示されている。なお、図23には便宜上、1つのスポット352に1つのプローブのみが示されているが、実際には1つのスポット352に対して同一種類の複数のプローブが固定されている。また、各反応槽には同一種類のプローブが固定された任意の数のスポットが、予め定められた所定の位置に配置されている。
図22のピックアップ部361は、蛍光強度取得用ピックアップ391、ガイド信号取得用ピックアップ392、コントロール部393、対物座標計算部394、および畳み込み展開部395で構成されている。
蛍光強度取得用ピックアップ391は、図23のDNAチップ351の発現解析用反応槽501と細胞数計数用反応槽502の画像を取得するピックアップである。これに対して、ガイド信号取得用ピックアップ392は、開始位置ガイド353Aと終了位置ガイド353Bを読み取るためのピックアップである。
蛍光強度取得用ピックアップ391は、対物レンズ411、プリズム412、半導体レーザ413、およびフォトダイオード414を有している。半導体レーザ413より出射されたレーザ光(励起光)は、プリズム412を介して対物レンズ411に入射され、対物レンズ411は、入射されたレーザ光を基板351A(スポット352)上に照射する。対物レンズ411はまた、スポット352からの光をプリズム412を介してフォトダイオード414に入射する。各スポット352には、複数のプローブが固定されており、プローブとターゲットがハイブリダイゼーションした場合、さらに両者にはインターカレータ516が結合される。すなわち、プローブとターゲットがハイブリダイゼーションしていない場合には、両者の間にインターカレータ516は存在せず、ハイブリダイゼーションした場合においてのみ、両者の間にインターカレータ516が存在する。インターカレータ516は、励起光が照射されると蛍光を発生する。対物レンズ411により集光された蛍光はプリズム412により励起光と分離されて、フォトダイオード414に入射される。
ハイブリダイゼーションしている量が多ければ、それだけインターカレータ516の量も多く、したがって、そこから発生する蛍光量も多い。したがって、蛍光の強度に基づいて、ハイブリダイゼーションの状態を測定する(ハイブリダイゼーションの情報を得る)ことが可能となる。
コントロール部393は、半導体レーザ413の電流制御を行い、その励起光の強度を調整する。また、コントロール部393は、フォトダイオード414の出力(電流量変化)を読み取る。
畳み込み展開部395は、フォトダイオード414より出力された電流量変化に基づく信号をコントロール部393から受け取り、ピクセル単位の画像データを生成する。
ガイド信号取得用ピックアップ392は、対物レンズ421、プリズム422、半導体レーザ423、およびフォトダイオード424により構成されている。半導体レーザ423は、コントロール部393からの制御に基づいて、レーザ光を発生する(このレーザ光は、ガイド検出光として機能する)。プリズム422は、半導体レーザ423からのレーザ光を対物レンズ421に入射し、対物レンズ421はこのレーザ光を基板351Aに照射する。対物レンズ421は、基板351Aからの反射光を受光し、プリズム422はこの反射光を照射光から分離してフォトダイオード424に出射する。フォトダイオード424は、プリズム422より入射された反射光を光電変換し、ガイド信号としてコントロール部393に出力する。コントロール部393は、フォトダイオード424より入力されたガイド信号を対物座標計算部394に出力する。ガイド353(開始位置ガイド353Aと終了位置ガイド353B)は、基板351Aの他の領域に較べて反射率が高く(または低く)なるように形成されている。対物座標計算部394は、コントロール部393を介して、ガイド信号取得用ピックアップ392より供給されたガイド信号のレベルに基づいて、開始位置ガイド353Aと終了位置ガイド353Bの位置、並びに開始位置ガイド353Aから終了位置ガイド353Bに向けて等速度で移動されるガイド信号取得用ピックアップ392の位置(座標)を計算する。
コントロール部393は、対物座標計算部394により計算されたガイド信号取得用ピックアップ392の位置に基づいて、蛍光強度取得用ピックアップ391(対物レンズ411)の位置を制御する。ガイド信号取得用ピックアップ392と蛍光強度取得用ピックアップ391は、相互に所定の位置関係に固定されており、蛍光強度取得用ピックアップ391を図23における開始位置ガイド353Aと終了位置ガイド353Bの間における所定の位置に配置することは、とりもなおさずガイド信号取得用ピックアップ392を開始位置ガイド353Aと終了位置ガイド353Bの間の所定の位置に配置することになる。
蛍光強度取得部362は、蛍光強度取得用ピックアップ391のフォトダイオード414が出力した各スポット352(その座標(x,y))からの蛍光強度(pfx,y)の入力を受け、この蛍光強度に関するデータをハイブリダイズ量推定部364の励起光強度推定部441に出力する。蛍光強度取得部362はまた、蛍光強度取得用ピックアップ391の対物レンズ411の基板351A上の対物座標(x,y)、対物面積半径(r)、並びに励起光強度を制御する制御信号をコントロール部393に出力する。コントロール部393は、この制御信号に基づいて対物レンズ411を制御する。これにより、対物レンズ411が基板351A上の所定の座標(x,y)に配置され、対物レンズ411より出射されるレーザ光の照射範囲の半径(対物面積半径)(r)が所定の値に制御され、そのレーザ光の強度(励起光強度)が所定の値に調整される。
蛍光強度取得部362は、コントロール部393から供給された蛍光強度を、励起光強度計算部363に出力する。励起光強度計算部363は、蛍光強度−ハイブリダイズ量変換式記憶部370に記憶されている変換式に基づいて、プリスキャン時に蛍光強度取得部362から入力された蛍光強度に基づいて、最適な励起光強度を計算し、その計算して得られた励起光強度を蛍光強度取得部362に出力する。本スキャン時、蛍光強度取得部362は、この励起光強度計算部363からの励起光強度に基づいて半導体レーザ413の電流を制御し、所定の強さの励起光を半導体レーザ413より出射させる。
ハイブリダイズ量推定部364は、励起光強度推定部441、作成部442、画像処理部443、検証部444、並びにハイブリダイズ量計算部445により構成されている。
反応領域の画像情報を入力する入力手段としての励起光強度推定部441は、蛍光強度取得部362より供給された蛍光強度に基づく画像データ、または発現プロファイルデータ記憶部368にあらかじめ記憶されている発現プロファイルデータなどの画像情報の入力を受け、必要に応じて励起光強度を推定する処理を行う。作成部442は励起光強度推定部441からのデータに基づいて、蛍光強度からハイブリダイズ量を一義的に決定する式hybridize(pf)を作成する。画像処理部443は、作成部442より入力された画像データを処理し、検証部444とユーザインターフェース部369に出力する。ユーザインターフェース部369は、画像処理部443より入力された画像を表示部369Aに表示する。画像処理部443は、ユーザインターフェース部369を介して、ユーザより指示される入力に基づいて、DNAチップ351の画像からデブリ(観測を行う上において障害となる物質)の成分を除去し、各スポット352毎の画像へ分解する処理を行う。
検証部444は、画像処理部443より入力された画像データのうち、ハイブリダイズ検証用プローブ511,514のスポット352におけるハイブリダイズ量に基づいて、ハイブリダイズが正しく行われていることを検証する。
ハイブリダイズ量計算部445は、スポット内領域を分割し、スポット内領域単位でハイブリダイズ値と信頼度の計算を行い、スポット単位でのハイブリダイズ値と信頼度を出力する。
発現量計算部365は、ハイブリダイズ量計算部445からの出力に基づいて、プローブに対するターゲットの結合強度を求めることで、蛍光強度に対応する発現量を推定する。標準化部366は発現標準化用コントロールプローブ513と細胞数計数用コントロールプローブ515を利用した標準化処理を行う。出力部367は標準化されたデータを発現プロファイルデータ記憶部368に供給する。発現プロファイルデータ記憶部368は、出力部367より供給されたデータを、発現プロファイルデータとして記憶する。発現プロファイルデータ記憶部368に記憶されたデータは、必要に応じて、ユーザインターフェース部369に供給され、表示部369Aに表示される。発現量計算部365より出力されたデータも必要に応じて、表示部369Aに表示される。
蛍光強度−ハイブリダイズ量変換式記憶部370は、変換式取得部13によって取得された、蛍光強度とそれに対応する、プローブとターゲットとのハイブリダイズ量との関係を一義的に決定する変換式である蛍光強度−ハイブリダイズ量変換式をあらかじめ記憶している。
機械的学習部371は、機械的学習の手段としてのSVM(Support Vector Machine)461とスポット除去パターンデータベース462を有している。SVM461は学習モード時、ユーザインターフェース部369と発現プロファイルデータ記憶部368からのデータに基づいて学習を行い、学習結果をスポット除去パターンデータベース462に記憶させる。SVM461はまた、判定モード時、発現プロファイルデータ記憶部368からのデータを、スポット除去パターンデータベース462に記憶されているパターンに基づいて判定し、その判定結果をハイブリダイズ量計算部445に出力する。
なお、SVMについては、Nello Cristianini, John Shawe-Taylor, An Introduction to Support Vector Machines and other kernel-based learning methods, Cambridgeに詳細な説明がある。
また、機械的学習としては、SVMのほかにニューラルネットワークなどを採用することも可能である。
次に、図21の実験過程処理装置301による、図4のステップS12の実験過程の処理を、図24のフローチャートを参照して説明する。
最初に、ステップS311において、調整部321はターゲットを調整する。具体的には、細胞が含まれるサンプルが取り出され、その中から蛋白質を変性させて除去する処理が行われ、RNA(ribonucleic acid)の抽出、断片化、並びにDNA(deoxyribonucleic acid)の抽出、断片化によりターゲット(発現解析用プローブ512に対するターゲット512A)が生成される。
ステップS312において、ハイブリダイズ部322はハイブリダイズする処理を実行する。具体的には、ステップS311の処理で生成されたターゲットが入った溶液に、さらにハイブリダイズ検証用プローブ511,514に対するターゲット511A,514A、発現標準化用コントロールプローブ513に対するターゲット513A、並びに細胞数計数用コントロールプローブ515に対するターゲット515Aが加えられ、この溶液を発現解析用反応槽501と細胞数計数用反応槽502に滴下することで、ターゲットとプローブとがハイブリダイズされる。そして、インターカレータ516が導入され、ハイブリダイズしたターゲットとプローブに結合され、図23に示されるようなDNAチップ351が得られる。同図に示されるように、発現解析用反応槽501のスポット352では、発現解析用プローブ512に対してターゲット512Aがハイブリダイズしている他、発現標準化用コントロールプローブ513に対してターゲット513Aがハイブリダイズしており、ハイブリダイズ検証用プローブ511に対してターゲット511Aがハイブリダイズしている。そして、それらの2本鎖結合したプローブとターゲットの間にはインターカレータ516が結合している。
同様に、細胞数計数用反応槽502のスポット352においても、ハイブリダイズ検証用プローブ514に対してターゲット514Aがハイブリダイズしており、細胞数計数用コントロールプローブ515に対してターゲット515Aがハイブリダイズしている。そして、これらのハイブリダイズしたプローブとターゲットの間にも、インターカレータ516が結合されている。
なお、発現解析用プローブ512は、図6のステップS51の発現解析用プローブ設計の処理において設計されたものである。
ステップS313において、取得部323は蛍光強度を取得する。具体的には、蛍光強度取得部362は、コントロール部393を介して蛍光強度取得用ピックアップ391を駆動し、半導体レーザ413にレーザ光を励起光として出射させる。この励起光は、プリズム412を介して対物レンズ411に入射され、対物レンズ411は、これを基板351A上の発現解析用反応槽501に照射する。
インターカレータ516は励起光が照射されると蛍光を発生する。この蛍光が対物レンズ411により集光され、プリズム412を介してフォトダイオード414に入射される。フォトダイオード414は蛍光に対応する電流を出力する。コントロール部393は、この電流に対応する信号を畳み込み展開部395により画像信号に変換させ、変換により生成された蛍光強度に対応する信号を、蛍光強度取得部362に出力する。
コントロール部393は、対物レンズ411の位置を開始位置ガイド353Aから終了位置ガイド353Bの方向に向けて移動させる。このとき、ガイド信号取得用ピックアップ392の半導体レーザ423が出射するガイド検出光としてのレーザ光が、プリズム422を介して対物レンズ421に入射され、対物レンズ421がこのガイド検出光を基板351Aに照射する。ガイド検出光の反射光の強度は、開始位置ガイド353Aと終了位置ガイド353Bに照射されたとき強くなる。この反射光が対物レンズ421を介してプリズム422に入射され、プリズム422からフォトダイオード424に入射される。対物座標計算部394はコントロール部393を介してフォトダイオード424からのガイド信号を取得し、この信号に基づいて、ガイド信号取得用ピックアップ392(したがって、それと一体化している蛍光強度取得用ピックアップ391)が基板351Aの開始位置ガイド353Aと終了位置ガイド353Bの間のいずれの位置に位置するのか、その座標を計算する。コントロール部393はその座標に基づいてガイド信号取得用ピックアップ392(蛍光強度取得用ピックアップ391)を開始位置ガイド353Aから終了位置ガイド353Bまで一定の速度で移動させる(走査させる)。
このようにして、蛍光強度取得用ピックアップ391が、図23において、開始位置ガイド353Aから終了位置ガイド353Bの位置まで移動されるとともに、さらに、その走査位置が、開始位置ガイド353A(終了位置ガイド353B)と平行な方向(図中x座標方向)に1ピッチ分だけ移動され、新たな移動位置において同様に、開始位置ガイド353Aから終了位置ガイド353Bまで移動される。このようにして、発現解析用反応槽501と細胞数計数用反応槽502の全体が走査され、各座標における画像信号が蛍光強度取得用ピックアップ391より出力される。
ステップS314において、発現量推定部324は発現量推定処理を実行する。この発現量推定処理の詳細は、図25を参照して後述するが、この処理によりハイブリダイズ量と信頼度の計算が行われ、発現量が計算される。
次に、ステップS315において、標準化部325(標準化部366)により、データを標準化する処理が行われる。この標準化としては、発現標準化用コントロールプローブ513による標準化と、細胞数計数用コントロールプローブ515による標準化が行われる。
さらに、ステップS316において、出力部326(出力部367)は、発現プロファイルデータを出力する。具体的には、以上のようにして得られた画像データが、記憶部327(発現プロファイルデータ記憶部368)に供給され、記録される。
次に、図25のフローチャートを参照して、図24のステップS314の発現量推定処理について説明する。ステップS331において、励起光強度推定部441は画像情報を入力する。具体的には、蛍光強度取得部362より画像情報が入力される。ステップS332において、励起光強度推定部441は、ステップS331で入力された画像情報に励起光強度情報があるか(含まれているか)を判定する。
励起光強度推定部441が蛍光強度取得部362より入力する画像情報は、セットとなる画像の枚数の他、各スポットの画像の励起光強度、縦横ピクセル数、および蛍光画像により構成されている画像データと、スポット位置テンテンプレート画像、スポット数、プローブ遺伝子インデックスなどにより構成されている共通データとからなる。
したがって、少なくとも蛍光強度取得部362より供給される画像情報の場合、画像データに励起光強度が含まれているので、励起光強度情報があると判定される。これに対して、発現プロファイルデータ記憶部368からそこに記憶されている発現プロファイル画像が供給される場合、それが蛍光強度取得部362から供給され、記憶された画像である場合には上述したように励起光強度情報が存在するが、そうでない場合(他の装置から供給された画像データである場合)には、励起光強度情報が存在しないことがある。
ステップS332において、励起光強度情報が存在しないと判定された場合、ステップS333において、励起光強度推定部441は、励起光強度を推定する処理を実行する。
この励起光強度を推定する処理は、少なくとも2つの異なる強度の励起光に基づいて測定が行われた画像情報(画像データ)である場合に実行可能となる。励起光強度情報が存在する場合、または存在しないとしても、異なる少なくとも2つの励起光強度に基づく画像情報(画像データ)が存在しない場合、励起光強度を推定することができない。このため、これらの場合には、ステップS333の処理はスキップされる。
次に、ステップS334において、作成部442は、入力された画像情報が複数の励起光強度で撮影した画像の画像情報かを判定する。複数の励起光強度で撮影した画像の画像情報である場合には、ステップS335において、作成部442は、蛍光強度に基づいてハイブリダイズ量を決定する式(8)(hybridize(pf))を作成する。
ステップS334において、入力された画像データは、複数の励起光強度で撮影した画像の画像データではないと判定された場合には、ステップS335の処理は実行できないのでスキップされる。
式hybridizee(pf)は、各スポットの蛍光強度とハイブリダイズ量の関係を規定する。蛍光強度が与えられると対応するハイブリダイズ量は関数に基づき一義的に決定される。ただし、励起光強度が変化すると、蛍光強度のレベルも変化する。
式(8)中の式hybridizes(pfs)と式hybridizew(pfw)は、それぞれ、得られたデータのうちの、励起光強度が強い方の式hybridizee(pf)と、弱い方の式hybridizee(pf)を表している。
次に、ステップS336において、画像処理部443は画像処理を行う。この処理により、DNAチップ351の画像からスポット境界を跨ぐデブリ領域が除去され、画像は各スポット毎の画像に分解される。
ステップS337において、検証部444は、ハイブリダイズを検証する処理を実行する。具体的には、図23に示されるように、発現解析用反応槽501にはハイブリダイズ検証用プローブ511が、また細胞数計数用反応槽502にはハイブリダイズ検証用プローブ514が、それぞれスポット352に固定されている。ハイブリダイズ検証用プローブ511,514の蛍光値を測定することで、その蛍光値が、例えばあらかじめ設定されている基準値以上であれば、正しいハイブリダイズ処理が行われていることを検証することができる。
ステップS338において、ハイブリダイズ量計算部445は、ハイブリダイズ量と信頼度の計算を行う。この処理によりスポット内領域にデブリが存在する場合、スポット内領域が複数の領域に分割され、各スポット内領域毎に、そして最終的にはスポット単位で、ハイブリダイズ値と信頼度が計算される。
ステップS339において、発現量計算部365は、ステップS338の処理で、ハイブリダイズ量計算部445により計算されたハイブリダイズ値と信頼度に基づいて、発現量を計算する処理を実行する。この処理に基づいて、計算された(取得された)蛍光値に対応する発現量が計算される。
このように、本発明によれば、遺伝子の発現を測定することができる。特に、より少ない回数の測定で、複数の遺伝子それぞれの発現量を定量的に測定することが可能になる。
以上、DNAチップのハイブリダイゼーションを測定する場合の実施形態を説明したが、本発明はDNAチップに限らず、各種の生体物質が、他の所定の生体物質と生体結合したかどうかを測定する場合に適用することが可能である。
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、発現解析用プローブ設計装置51または生体情報処理装置331は、図26に示されるようなパーソナルコンピュータ901により構成される。
図26において、CPU(Central Processing Unit)921は、ROM(Read Only Memory)922に記憶されているプログラム、または記憶部928からRAM(Random Access Memory)923にロードされたプログラムに従って各種の処理を実行する。RAM923にはまた、CPU921が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU921、ROM922、およびRAM923は、バス924を介して相互に接続されている。このバス924にはまた、入出力インタフェース925も接続されている。
入出力インタフェース925には、キーボード、マウスなどよりなる入力部926、CRT(Cathode Ray Tube)、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部927、ハードディスクなどより構成される記憶部928、モデムなどより構成される通信部929が接続されている。通信部929は、インターネットを含むネットワークを介しての通信処理を行う。
入出力インタフェース925にはまた、必要に応じてドライブ930が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア931が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部928にインストールされる。
一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。
この記録媒体は、図26に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini-Disc)(商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア931により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM922や、記憶部928に含まれるハードディスクなどで構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置(または特定の機能を実現する機能モジュール)が論理的に集合した物を意味し、各装置や機能モジュールが単一の筐体内にあるか否かは問わない。
51 発現解析用プローブ設計装置, 61 遺伝子データベース, 62 遺伝子配列取得部, 63 入力部, 64 ハイブリダイズ率計算部, 65 プローブ候補選択部, 66 出力部, 351 DNAチップ
Claims (12)
- 第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、前記第2の生体物質に生体反応する前記第3の生体物質との結合の強さを表す結合強度に基づいて、前記第3の生体物質が前記第2の生体物質のうちの前記第1の生体物質と選択的に生体反応する傾向を表す指数を計算する計算手段と、
前記指数に基づいて、前記第1の生体物質の発現を検出するための前記第3の生体物質を選択する選択手段と
を備える生体情報処理装置。 - 前記計算手段は、前記結合強度の分散である前記指数を計算する
請求項1に記載の生体情報処理装置。 - 前記選択手段は、前記指数に基づいて、前記第1の生体物質と最も選択的に生体反応する前記第3の生体物質を選択する
請求項1に記載の生体情報処理装置。 - 前記選択手段は、前記第1の生体物質について、前記結合強度の分散である前記指数であって、最も値の大きい前記指数に対応する前記第3の生体物質を選択する
請求項1に記載の生体情報処理装置。 - 前記選択手段は、複数の前記第1の生体物質について、それぞれ、前記結合強度の分散である前記指数であって、最も値の大きい前記指数に対応する前記第3の生体物質を選択して、さらに、選択した前記第3の生体物質の前記指数の小さい順に、前記第1の生体物質について、前記第3の生体物質を選択する
請求項1に記載の生体情報処理装置。 - 前記選択手段は、所定の数の前記第1の生体物質と、所定の数の前記第3の生体物質との生体反応の確率を示す、前記指数を要素とする行列に基づいて、前記第1の生体物質のそれぞれの生体反応の確率が最大となるように、前記第3の生体物質を選択する
請求項1に記載の生体情報処理装置。 - 前記計算手段は、前記第1の生体物質の所定の部分と相補的な構造の前記第3の生体物質について、前記指数を計算する
請求項1に記載の生体情報処理装置。 - 前記計算手段は、前記第1の生体物質の先頭から前記部分までの距離を考慮した前記結合強度に基づいて、前記指数を計算する
請求項7に記載の生体情報処理装置。 - 第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、前記第2の生体物質に生体反応する前記第3の生体物質との結合の強さを表す結合強度に基づいて、前記第3の生体物質が前記第2の生体物質のうちの前記第1の生体物質と選択的に生体反応する傾向を表す指数を計算する計算ステップと、
前記指数に基づいて、前記第1の生体物質の発現を検出するための前記第3の生体物質を選択する選択ステップと
を含む生体情報処理方法。 - 第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、前記第2の生体物質に生体反応する前記第3の生体物質との結合の強さを表す結合強度に基づいて、前記第3の生体物質が前記第2の生体物質のうちの前記第1の生体物質と選択的に生体反応する傾向を表す指数を計算する計算ステップと、
前記指数に基づいて、前記第1の生体物質の発現を検出するための前記第3の生体物質を選択する選択ステップと
をコンピュータに実行させるプログラム。 - 請求項10に記載のプログラムが記録されている記録媒体。
- 第1の生体物質の発現を検出しようとする被検体において発現が予測される第2の生体物質と、前記第2の生体物質に生体反応する前記第3の生体物質との結合の強さを表す結合強度から計算された、前記第3の生体物質が前記第2の生体物質のうちの前記第1の生体物質に選択的に生体反応する傾向を表す指数に基づき選択された、前記第1の生体物質の発現を検出するための前記第3の生体物質が固定されているDNAチップ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005124572A JP2006302064A (ja) | 2005-04-22 | 2005-04-22 | 生体情報処理装置および方法、プログラム、記録媒体、並びにdnaチップ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005124572A JP2006302064A (ja) | 2005-04-22 | 2005-04-22 | 生体情報処理装置および方法、プログラム、記録媒体、並びにdnaチップ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006302064A true JP2006302064A (ja) | 2006-11-02 |
Family
ID=37470262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005124572A Withdrawn JP2006302064A (ja) | 2005-04-22 | 2005-04-22 | 生体情報処理装置および方法、プログラム、記録媒体、並びにdnaチップ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006302064A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012139168A (ja) * | 2010-12-28 | 2012-07-26 | Kokuritsu Iyakuhin Shokuhin Eisei Kenkyusho | 競合的ハイブリダイゼーションにおける遺伝子データの補正方法及び補正装置 |
-
2005
- 2005-04-22 JP JP2005124572A patent/JP2006302064A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012139168A (ja) * | 2010-12-28 | 2012-07-26 | Kokuritsu Iyakuhin Shokuhin Eisei Kenkyusho | 競合的ハイブリダイゼーションにおける遺伝子データの補正方法及び補正装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5026978B2 (ja) | マイクロアレイ上での複数標的のリアルタイム定量化 | |
JP4736516B2 (ja) | 生体情報処理装置および方法、プログラム並びに記録媒体 | |
US20230207048A1 (en) | Somatic copy number variation detection | |
JP4436261B2 (ja) | 解析処理方法及び装置 | |
JPWO2002001477A1 (ja) | 遺伝子発現データの処理方法および処理プログラム | |
US20030087289A1 (en) | Image analysis of high-density synthetic DNA microarrays | |
JP3537752B2 (ja) | バイオチップを用いたハイブリダイゼーション反応の実験結果表示方法及び実験誤差評価方法 | |
US20040006431A1 (en) | System, method and computer software product for grid placement, alignment and analysis of images of biological probe arrays | |
EP2824444B1 (en) | Determination method, determination device, determination system, and program | |
JP2006302064A (ja) | 生体情報処理装置および方法、プログラム、記録媒体、並びにdnaチップ | |
JP2007017282A (ja) | 生体情報処理装置および生体情報処理方法、学習装置および学習制御方法、プログラム並びに記録媒体 | |
JP2006300797A (ja) | 生体情報処理装置および方法、プログラム、記録媒体、並びに基板 | |
US20080232659A1 (en) | Analysis Processing Method and Device | |
JP2006300795A (ja) | 生体情報測定装置および方法、プログラム並びに記録媒体 | |
JP2006300798A (ja) | 生体情報処理装置および方法、プログラム並びに記録媒体 | |
JPH09507027A (ja) | 自動遺伝子型決定 | |
US20050233376A1 (en) | Biochip scanner device | |
JP2006300796A (ja) | 生体情報処理装置および方法、プログラム並びに記録媒体 | |
JP6055200B2 (ja) | 異常なマイクロアレイの特徴部を特定する方法及びその読み取り可能な媒体 | |
JP5242568B2 (ja) | クラスタリング方法、プログラムおよび装置 | |
EP1134687A2 (en) | Method for displaying results of hybridization experiments | |
EP1583020A2 (en) | Program, method and device for analysis of the time-series data obtained by DNA array method | |
US20230316054A1 (en) | Machine learning modeling of probe intensity | |
KR20100111098A (ko) | 마이크로어레이의 데이터 스팟의 위치를 검출하는 방법 및 장치 | |
JP4581076B2 (ja) | ゲノム物理地図作成法及び作成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080701 |