JP2006302064A

JP2006302064A - 生体情報処理装置および方法、プログラム、記録媒体、並びにｄｎａチップ

Info

Publication number: JP2006302064A
Application number: JP2005124572A
Authority: JP
Inventors: Yasunori Oto; 康紀大戸
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2005-04-22
Filing date: 2005-04-22
Publication date: 2006-11-02

Abstract

【課題】複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶ。
【解決手段】ハイブリダイズ率計算部６４は、第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、第２の生体物質に生体反応する第３の生体物質との結合の強さを表す結合強度に基づいて、第３の生体物質が第２の生体物質のうちの第１の生体物質と選択的に生体反応する傾向を表す指数を計算する。プローブ候補選択部６５は、指数に基づいて、第１の生体物質の発現を検出するための第３の生体物質を選択する。本発明は、生体物質に関する情報を処理する生体情報処理装置に適用できる。
【選択図】図３

Description

本発明は生体情報処理装置および方法、プログラム、記録媒体、並びにDNAチップに関し、特に、生体物質に関する情報を処理するか、または生体物質を検出する生体情報処理装置および方法、プログラム、記録媒体、並びにDNAチップに関する。

近年、DNA(deoxyribonucleic acid)チップ若しくはDNAマイクロアレイ（以下、本明細書では両者を区別する必要がない場合、まとめて単にDNAチップと称する）の実用化が進んでいる。DNAチップは、多種・多数のDNAオリゴ鎖を、検出用核酸として基板表面に集積して固定したものである。DNAチップを用いて、基板表面のスポットに固定されたプローブと、細胞などから採取したサンプル中のターゲットとのハイブリダイゼーションを検出することにより、採取した細胞内における遺伝子発現を網羅的に解析することができる。

DNAチップを用いた遺伝子発現解析におけるハイブリダイゼーション検出技術の向上に伴い、単に、遺伝子発現の有無を検出するだけでなく、遺伝子発現量の定量的な測定が可能になりつつある。例えば、ハイブリダイゼーション検出の際に蛍光強度を定量的に測定することにより、遺伝子発現量を示す定量的な数値を取得する技術は、一部実用化されている。

従来、１つのエレメントに対して、エレメントの濃度（スポット中に含まれるエレメントの量）が異なるものを複数個チップ上にスポッティングするものもある（例えば、特許文献１参照）。

特開２００３−１２１４４１号公報

しかしながら、複数の遺伝子それぞれの発現量の定量的な測定には、測定しようとする遺伝子の数と同じ回数の測定の実施が必要であった。測定しようとする遺伝子の数より少ない回数の測定で、遺伝子それぞれの発現量を定量的に測定することは極めて困難であった。

また、このような場合の測定に用いるプローブを選ぶことは、困難であるだけでなく、極めて手間のかかる作業を必要とした。

本発明はこのような状況に鑑みてなされたものであり、複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶことができるようにするものである。また、複数の遺伝子それぞれの発現量を定量的に測定することができるようにするものである。

本発明の第１の側面は、第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、第２の生体物質に生体反応する第３の生体物質との結合の強さを表す結合強度に基づいて、第３の生体物質が第２の生体物質のうちの第１の生体物質と選択的に生体反応する傾向を表す指数を計算する計算手段と、指数に基づいて、第１の生体物質の発現を検出するための第３の生体物質を選択する選択手段とを備える生体情報処理装置である。

本発明の第１の側面においては、第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、第２の生体物質に生体反応する第３の生体物質との結合の強さを表す結合強度に基づいて、第３の生体物質が第２の生体物質のうちの第１の生体物質と選択的に生体反応する傾向を表す指数が計算され、指数に基づいて、第１の生体物質の発現を検出するための第３の生体物質が選択される。

計算手段は、結合強度の分散である指数を計算するようにすることができる。

選択手段は、指数に基づいて、第１の生体物質と最も選択的に生体反応する第３の生体物質を選択するようにすることができる。

選択手段は、第１の生体物質について、結合強度の分散である指数であって、最も値の大きい指数に対応する第３の生体物質を選択するようにすることができる。

選択手段は、複数の第１の生体物質について、それぞれ、結合強度の分散である指数であって、最も値の大きい指数に対応する第３の生体物質を選択して、さらに、選択した第３の生体物質の指数の小さい順に、第１の生体物質について、第３の生体物質を選択するようにすることができる。

選択手段は、所定の数の第１の生体物質と、所定の数の第３の生体物質との生体反応の確率を示す、指数を要素とする行列に基づいて、第１の生体物質のそれぞれの生体反応の確率が最大となるように、第３の生体物質を選択するようにすることができる。

計算手段は、第１の生体物質の所定の部分と相補的な構造の第３の生体物質について、指数を計算するようにすることができる。

計算手段は、第１の生体物質の先頭から部分までの距離を考慮した結合強度に基づいて、指数を計算するようにすることができる。

本発明の第２の側面は、第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、第２の生体物質に生体反応する第３の生体物質との結合の強さを表す結合強度から計算された、第３の生体物質が第２の生体物質のうちの第１の生体物質と選択的に生体反応する傾向を表す指数に基づき選択された、第１の生体物質の発現を検出するための第３の生体物質が固定されているDNAチップである。

本発明の第２の側面においては、第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、第２の生体物質に生体反応する第３の生体物質との結合の強さを表す結合強度から計算された、第３の生体物質が第２の生体物質のうちの第１の生体物質に選択的に生体反応する傾向を表す指数に基づき選択された、第１の生体物質の発現を検出するための第３の生体物質が固定されている。

以上のように、本発明の第１の側面によれば、DNAチップに固定するプローブを選択することができる。特に、複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶことが可能になる。

本発明の第２の側面によれば、遺伝子の発現を測定することができる。特に、複数の遺伝子それぞれの発現量を定量的に測定することが可能になる。

以下に本明細書において使用する用語の意味を説明する。

プローブとは、DNAチップなどのバイオアッセイ用の基板に固定された生体物質であって、ターゲットと生体反応するものをいう。

ターゲットとは、DNAチップなどのバイオアッセイ用の基板に固定された生体物質に生体反応する生体物質をいう。

生体物質とは、蛋白質、核酸、糖などの生体内において生成される物質の他、相互に相補的な塩基配列を有する遺伝子またはそれから派生する物質を含む。

生体反応とは、２以上の生体物質が生化学的に反応することをいう。その代表例は、ハイブリダイゼーションである。

ハイブリダイゼーションとは、相補的な塩基配列構造を備える核酸間の相補鎖（二本鎖）形成反応をいう。

図１は、遺伝子発現量の定量的な測定の処理のうち、実際に測定する前に事前作業する生体情報処理装置の構成例を表している。この生体情報処理装置１は、プローブ設計部１１、DNAチップ作成部１２、変換式取得部１３、並びに結合強度行列取得部１４により構成されている。

プローブ設計部１１は、プローブを設計する。DNAチップ作成部１２は、DNAチップを作成する。変換式取得部１３は、変換式を取得する。結合強度行列取得部１４は、結合強度行列を取得する。

図２は、プローブ設計部１１の構成例を表している。プローブ設計部１１は、発現解析用プローブ設計部３１、ハイブリダイズ検証用プローブ設計部３２、発現標準化用コントロールプローブ設計部３３、並びに細胞数計数用コントロールプローブ設計部３４により構成されている。

発現解析用プローブ設計部３１は、発現解析用プローブを設計する。ハイブリダイズ検証用プローブ設計部３２は、ハイブリダイズ検証用プローブを設計する。発現標準化用コントロールプローブ設計部３３は、発現標準化用コントロールプローブを設計する。細胞数計数用コントロールプローブ設計部３４は、細胞数計数用コントロールプローブを設計する。

次に、発現解析用プローブ設計部３１を構成する発現解析用プローブ設計装置５１について説明する。

図３は、発現解析用プローブ設計装置５１の構成例を表している。発現解析用プローブ設計装置５１は、遺伝子データベース６１、遺伝子配列取得部６２、入力部６３、ハイブリダイズ率計算部６４、プローブ候補選択部６５、並びに出力部６６により構成されている。

遺伝子データベース６１は、各種の生物種の遺伝子の配列の情報を記録する。遺伝子配列取得部６２は、入力部６３からの、ユーザの指示に基づいて、遺伝子データベース６１から遺伝子の配列の情報を取得する。入力部６３は、生物種（cell line）または観測対象とする遺伝子ID群などを特定する、ユーザからの指示を入力する。

ハイブリダイズ率計算部６４は、プローブ候補と、発現が予測される遺伝子群とがハイブリダイズする率であるハイブリダイズ率を計算する。プローブ候補選択部６５は、ハイブリダイズ率に基づいて、プローブ候補を選択する。

出力部６６は、選択したプローブ候補を示す情報であるプローブ配列群を出力する。

図４を参照して、遺伝子の発現量を定量的に測定する生体情報の処理を説明する。ステップＳ１１において、実際に測定する前の事前作業が行われ、ステップＳ１２において、遺伝子の発現量が定量的に測定される、実験過程が行われる。

次に、図５を参照して、図４のステップＳ１１の事前作業の処理について説明する。ステップＳ３１において、プローブ設計部１１は、プローブを選択することにより、プローブを設計する。

ステップＳ３２において、DNAチップ作成部１２は、ステップＳ３１の処理で設計されたプローブを固定したDNAチップを作成する。ステップＳ３３において、変換式取得部１３は、DNAチップに所定の励起光を照射して得られた蛍光の蛍光強度とそれに対応する、プローブとターゲットとのハイブリダイズ量との関係を一義的に決定する変換式（必ずしも式を構成せずとも、変換のためのデータであってもよい）である蛍光強度−ハイブリダイズ量変換式を取得する。ステップＳ３４において、結合強度行列取得部１４は、作成したDNAチップに、合成した所定のターゲットを所定の量ずつ滴下して、蛍光強度を取得することにより、複数のプローブの量と、これに結合する複数のターゲットのそれぞれの量との関係を示すプローブ−ターゲット結合強度行列を取得する。

図６は、図５のステップＳ３１のプローブ設計の処理を説明するフローチャートである。ステップＳ５１において、発現解析用プローブ設計部３１（発現解析用プローブ設計装置５１）は、発現解析用プローブを設計する。ステップＳ５２において、ハイブリダイズ検証用プローブ設計部３２は、ハイブリダイズ検証用プローブを設計する。

ハイブリダイズ検証用プローブとしては、実験対象としている生物種にない遺伝子配列が用いられる。例えば、実験対象が動物である場合（発現解析用プローブが動物の遺伝子である場合）には、ハイブリダイズ検証用プローブとして植物の葉緑素遺伝子が用いられ、ターゲットとしては、その相補配列が用いられる。すなわち、このハイブリダイズ検証用プローブと、ターゲットは、発現解析用プローブとそのターゲットのハイブリダイズとは無関係に、確実にハイブリダイズを起こすものが用いられる。しかも、その実験対象とは全く異なる種のものが用いられるため、ハイブリダイズ検証用プローブが充分ハイブリダイズしている場合には、この実験において（測定において）ハイブリダイズが確実に起きていることを検証することができる。逆に、ハイブリダイズ検証用プローブが充分ハイブリダイズしていない場合には、この測定は何らかの原因によりハイブリダイズが発生し難い環境になっている可能性がある。そこで、ハイブリダイズ検証用プローブの蛍光値を測定することで、その蛍光値が、例えばあらかじめ設定されている基準値以上であれば、正しいハイブリダイズ処理が行われていることを検証することができる。

図７は、発現解析用プローブの設計およびハイブリダイズ検証用プローブの設計を説明する図である。実験対象生物（被検体）の遺伝子情報を記録している遺伝子データベース６１から、実験対象生物において発現する可能性のある遺伝子である発現可能遺伝子８１の配列を示す情報が読み出される。発現可能遺伝子８１には、観測の対象となる遺伝子である観測対象遺伝子８２が含まれる。観測対象遺伝子８２におけるプローブ認識部位８３の相補配列が発現解析用プローブの配列とされる。

すなわち、ｎ個の観測対象遺伝子８２₁乃８２_nにおけるプローブ認識部位８３₁乃至８３_n-2の相補配列が発現解析用プローブの配列とされる。例えば、プローブ認識部位８３_n-1および８３_n-2のように、１つの観測対象遺伝子８２に対して複数のプローブ認識部位８３を設けるようにしてもよい。このような場合でも、後述する結合強度行列として取得した実際のハイブリダイゼーションの分布を用いて、観測対象遺伝子８２の発現量が推定されるので、推定の精度が低下することはなく、むしろ、１つの観測対象遺伝子８２に対して複数のプローブ認識部位８３を設けることで、推定の精度がより高くなる。

実験対象生物（被検体）と異なる生物種（実験対象生物にない遺伝子配列をもつ生物種）の遺伝子情報を記録している遺伝子データベース８４から、ハイブリダイズ検証用遺伝子８５としての、その生物種の遺伝子の配列を示す情報が読み出される。ハイブリダイズ検証用遺伝子８５の一部分がプローブ認識部位８６として選択される。

ハイブリダイズ検証用遺伝子８５のプローブ認識部位８６は、発現可能遺伝子８１の配列と異なる配列とされる。例えば、プローブ認識部位８６の相補配列のプローブと、発現可能遺伝子８１の全てとの特異性が取得され、特異性の分散の和が大きいものが、プローブ認識部位８６とされ、ハイブリダイズ検証用プローブは、プローブ認識部位８６の相補配列とされる。

なお、ハイブリダイズ検証用プローブは、実験対象としている生物種にない遺伝子配列を独自に設計して用いるようにしてもよい。

図８は、特異的ハイブリダイズおよび非特異的ハイブリダイズを説明する図である。ターゲット１０１₁とプローブ１０２₁とが相補的な配列を有し、ターゲット１０１₂とプローブ１０２₂とが相補的な配列を有している場合の、ターゲット１０１₁およびターゲット１０１₂と、プローブ１０２₁およびプローブ１０２₂とのハイブリダイズを考えると、ハイブリダイズの分布は、確率と考えることができる。この考えに基づいて、ターゲット１０１₁および１０１₂と、プローブ１０２₁および１０２₂とにおける結合を示す結合強度を導入することができる。

結合強度ａ₁ ¹は、ターゲット１０１₁とプローブ１０２₁とが結合する確率を示し、結合強度ａ₂ ²は、ターゲット１０１₂とプローブ１０２₂とが結合する確率を示す。結合強度ａ₂ ¹は、ターゲット１０１₁とプローブ１０２₂とが結合する確率を示し、結合強度ａ₁ ²は、ターゲット１０１₂とプローブ１０２₂とが結合する確率を示す。

なお、結合強度ａは、０以上１以下の値となる。

ターゲット１０１₁とプローブ１０２₁とのハイブリダイズおよびターゲット１０１₂とプローブ１０２₂とのハイブリダイズを、特異的ハイブリダイズと称する。ターゲット１０１₁とプローブ１０２₂とのハイブリダイズおよびターゲット１０１₂とプローブ１０２₂とのハイブリダイズを、非特異的ハイブリダイズと称する。

ここで、結合強度を用いて、プローブへのハイブリダイズを表すモデルを導入することができる。

・・・（１）

式（１）において、左辺の行列は、それぞれのプローブ種が配置されているスポットの蛍光強度ベクトルを示し、ｓは、標準化パラメータを示す。右辺の左側の行列は、結合強度を要素とするプローブ−ターゲット結合強度行列である。右辺の右側の行列は、遺伝子の発現量を示す遺伝子発現量ベクトルを示す。すなわち、それぞれのプローブ種が配置されているスポットの蛍光強度ベクトルは、標準化パラメータ、プローブ−ターゲット結合強度行列、および遺伝子発現量ベクトルを掛け算したものとして表すことができる。

式（１）は、行列として式（２）と表すことができる。

・・・（２）

なお、特異性は、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率で示される。特異性は、非特異的ハイブリダイズよりも、特異的ハイブリダイズがおきる性状とも言える。特異性を最大にするとは、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率を最も大きくすることとも言える。

特異性指数は、特異性を示す指数であり、１つのプローブについての、特異的ハイブリダイズの確率と非特異的ハイブリダイズの確率との関係を示す。

図６に戻り、ステップＳ５３において、発現標準化用コントロールプローブ設計部３３は、発現標準化用コントロールプローブを設計する。ステップＳ５４において、細胞数計数用コントロールプローブ設計部３４は、細胞数計数用コントロールプローブを設計する。

発現標準化用コントロールプローブおよび細胞数計数用コントロールプローブにより、データを標準化する処理が行われる。

発現標準化用コントロールプローブによる標準化は、次のようにして行われる。すなわち、発現標準化用コントロールプローブは、DNAチップの発現解析用反応槽のあらかじめ定められた所定の複数の位置（例えば、発現解析用反応槽の４隅と略中央の５ヶ所）に分散して配置されている。そして、この各位置に配置された発現標準化用コントロールプローブの蛍光値に基づいて、補正用曲面が、例えば、Ｂスプライン曲面に基づいて演算され、その補正用曲面によって得られる蛍光値により各ピクセルの蛍光値を割り算することで正規化が行われる。この正規化により、発現解析用反応槽内のスポットの位置によるハイブリダイゼーションのばらつきが補正される。

また、細胞数計数用コントロールプローブによる標準化は、細胞数計数用コントロールプローブに対するハイブリダイズ量の値（細胞数計数用コントロールプローブに基づく蛍光値）により、細胞数計数用反応槽上の各スポット上のピクセルの蛍光値を割り算することにより行われる。細胞数計算用コントロールプローブとしては、発現解析用プローブを抽出した生体のゲノム中の反覆配列（例えば、人間でいえばAlu配列）が用いられる。この処理により、取得された遺伝子の発現量を一定の細胞数当たりの値に換算することができる。

次に、図９のフローチャートを参照して、図６のステップＳ５１の発現解析用プローブ設計の処理を説明する。ステップＳ７１において、ハイブリダイズ率計算部６４は、プローブ候補の特性指数を計算する。

ステップＳ７２において、ハイブリダイズ率計算部６４は、プローブ開始位置とその特異性指数を観測対象遺伝子８２毎のスタックに格納する。ステップＳ７３において、プローブ候補選択部６５は、スタックから特異性指数が最大となるプローブ候補を返す手続きｐｏｐ（）を作成する。すなわち、ｐｏｐ（）は、１つのスタックから、そのスタックに格納されている特異性指数のうち、最大の特異性指数をプローブ候補として返す手続きである。

ステップＳ７４において、プローブ候補選択部６５は、ｐｏｐ（）を用いて各スタックからの観測対象遺伝子８２数分のプローブ候補を取得する。

ここで、プローブ候補として、プローブ候補全体の特異性が最大になるプローブ候補を取得することが好ましい。特異性が最大になるとは、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率が最も大きくなることをいう。

プローブ候補の特異性を最大にするためには、式（３）で示される、プローブ−ターゲット結合強度行列の行成分の分散と列成分の分散との和が最大となるプローブ候補の配列を見つければよい。

・・・（３）

しかしながら、式（３）に基づいてプローブ候補を選択する手法における計算量は膨大になってしまう。

そこで、個々のプローブ候補の特異性を最大にすることを考える。図１０で示されるように個々のプローブとターゲットのそれぞれとの結合強度について分散をとった場合に、その和が最大となるプローブを求めるようにプローブ候補が選択される。例えば、プローブｐ₂に対するターゲットｇ₁乃至ｇ_mとの結合強度ベクトルａ₂の各々の要素（ａ₂ ¹乃至ａ₂ ^m）に対して分散をとった場合に、分散の和が最大となるプローブｐ₂が選択される。

このような考えに基づいて、ステップＳ７４において、プローブ候補選択部６５は、１つのスタックから、そのスタックに格納されている特異性指数のうち、最大の特異性指数をプローブ候補として返すｐｏｐ（）を用いて各スタックからの観測対象遺伝子８２数分のプローブ候補を取得する。

ステップＳ７５において、プローブ候補選択部６５は、プローブ候補の数が予め定めたプローブ数に達するまで、特異性指数が最小となるプローブ候補を取得したスタックからプローブ候補をさらに取得する。

プローブ候補選択部６５は、取得したプローブ候補をプローブ配列群として、出力部６６に出力させる。

図１１を参照して、図９のステップＳ７１のプローブ候補の特異性指数の計算の処理を説明する。ステップＳ９１において、ハイブリダイズ率計算部６４は、変数ｉの初期値を１とし、変数ｉを１ずつインクリメントして、変数ｉが観測対象遺伝子数Ｇｏｎ以下である間、それぞれの変数ｉについて、ステップＳ９２乃至ステップＳ９６の処理を繰り返し実行させるように処理を制御する。観測対象遺伝子数Ｇｏｎは、観測対象遺伝子８２の数を示す。変数ｉは、ｉ番目の観測対象遺伝子８２_iを示す。

ステップＳ９２において、ハイブリダイズ率計算部６４は、変数Ｌ_iに、ｌｎｇ（ｇ_i）−ｐｌを計算した結果を設定する。遺伝子塩基長ｌｎｇ（ｇ_i）は、ｉ番目の観測対象遺伝子８２_iの遺伝子の塩基の長さを示す値である。プローブ塩基長ｐｌは、プローブの塩基の長さを示す値である。すなわち、変数Ｌ_iには、観測対象遺伝子８２_iの遺伝子塩基長からプローブ塩基長を引き算した値が設定される。

ステップＳ９３において、ハイブリダイズ率計算部６４は、変数ｋの初期値を０とし、変数ｋを１ずつインクリメントして、変数ｋが変数Ｌ_i未満である間、それぞれの変数ｋについて、ステップＳ９４乃至ステップＳ９６の処理を繰り返し実行させるように、処理を制御する。変数ｋは、観測対象遺伝子８２_iの開始点からの距離を示す。

ステップＳ９３において、変数ｋが変数Ｌ_i以上になったと判定された場合、ステップＳ９１に戻り、上述した処理を繰り返す。

ステップＳ９４において、ハイブリダイズ率計算部６４は、変数ｊの初期値を１とし、変数ｊを１ずつインクリメントして、変数ｊが発現が予測される遺伝子数Ｇｗｎ以下である間、それぞれの変数ｊについて、ステップＳ９５の処理を繰り返し実行させるように処理を制御する。発現が予測される遺伝子数Ｇｗｎは、発現可能遺伝子８１の数を示す。変数ｊは、ｊ番目の発現可能遺伝子８１_jを示す。なお、遺伝子数Ｇｗｎは、観測対象遺伝子数Ｇｏｎ以下である。また、プローブの数ｐｎは、観測対象遺伝子数Ｇｏｎ以下である。

ステップＳ９５において、ハイブリダイズ率計算部６４は、変数ｋおよび変数ｊに対応する結合指数ｅ_kjに、Ｓｅｐ（ｋ）×Ｈｏｍ（ｇ_i（ｋ，ｐｌ），ｇ_j）を計算した結果を設定する。結合指数ｅ_kjは、ハイブリダイズ率に対応する。結合指数ｅ_kjは、結合強度ａの推定値とも言える。

結合強度Ｈｏｍ（ｇ_i（ｋ，ｐｌ），ｇ_j）は、ｇ_i（ｋ，ｐｌ）で示される塩基配列のプローブと、ｊ番目の発現可能遺伝子８１_jであるターゲットｇ_jとの結合の強さを示す値である。すなわち、ｇ_i（ｋ，ｐｌ）は、開始点ｋにおける遺伝子候補である。

脱落係数Ｓｅｐ（ｋ）は、変数ｋで示される距離であって、開始点からの距離に依存した結合強度を補正する値である。

プローブｐおよびターゲットｇについての結合強度Ｈｏｍ（ｐ，ｇ）は、例えば、式（４）で示される。

・・・（４）
ここで、ｌｎｇ（ｇ）は、ターゲットｇの遺伝子長を示し、ｐｌは、プローブ長を示す。ｐ^kは、プローブｐのｋ番目の塩基種を示し、ｇ^sは、ターゲットのｓ番目の塩基種を示す。Ｗ（Ｌｇ，Ｌｐ）は、ターゲットｇの長さＬｇおよびプローブｐの長さＬｐに依存した重みを示す。

Ｅ（ｂ₁，ｂ₂）は、塩基種ペアであるｂ₁とｂ₂との結合強度を示す。Ｅ（ｂ₁，ｂ₂）は、具体的には、Ｅ（Ａ，Ｔ）＝Ｅ（Ｔ，Ａ）＝Ｅ（Ｃ，Ｇ）＝Ｅ（Ｇ，Ｃ）＝１であり、それ以外の組み合わせは、０である。なお、Ａは、アデニンを示し、Ｔは、チミンを示し、Ｃは、シトニンを示し、Ｇはグアニンを示す。

図１２で示されるように、結合強度Ｈｏｍ（ｐ，ｇ）は、プローブ１０２と、発現可能遺伝子８１の部分８１Ａであって、発現可能遺伝子８１の開始点からの距離８１Ｂを０から（遺伝子長ｌｎｇ（ｇ）−１）まで変化させた位置の塩基を先頭とする、プローブ長ｐｌと同じ長さの部分８１Ａとの結合の強さの総和に対応する値を示す。

ステップＳ９５におけるプローブｇ_i（ｋ，ｐｌ）は、ｉ番目の観測対象遺伝子８２_iの、開始点からの距離ｋの位置を先頭とし、プローブ塩基長ｐｌと同じ長さの部分の相補塩基配列を示す。なお、距離ｋは、変数ｋで示され、プローブ塩基長ｐｌは、変数ｐｌで示される。

このように、ステップＳ９５において、１から、発現が予測される遺伝子数Ｇｗｎまで変化させた変数ｊ（すなわち、発現可能遺伝子８１_j）と、０から、変数Ｌ_i（ｌｎｇ（ｇ_i）−ｐｌ）まで変化させた変数ｋについて、変数ｊと変数ｋの組み合わせに対する結合指数ｅ_kjを計算する。すなわち、図１３で示されるように、発現可能遺伝子８１のそれぞれと、ｉ番目の観測対象遺伝子８２_iのプローブ塩基長ｐｌと同じ長さの部分の相補塩基配列との結合指数ｅ_kjを計算する。この場合、観測対象遺伝子８２_iにおけるプローブ塩基長ｐｌと同じ長さの部分の先頭の位置は、観測対象遺伝子８２_iの開始点からｌｎｇ（ｇ_i）−ｐｌまで、順に変えられる。

ここで、脱落係数Ｓｅｐ（ｋ）について説明する。

図１４は、RNA増幅を説明する図である。発現可能遺伝子８１であるmRNA１３１から逆転写により、mRNA１３１と相補配列のDNA１３２が生成される。そして、DNA１３２を基にして、二本鎖cDNA１３３が生成される。二本鎖cDNA１３３における、DNA１３２の相補配列は、テンプレート１３４として用いられる。酵素を用いてテンプレート１３４から、テンプレート１３４との相補配列（mRNA１３１と相補配列）のcRNA１３５が生成される。

この場合、酵素は、開始点から順にテンプレート１３４をなぞってcRNA１３５を転写するが、cRNA１３５の転写中に、テンプレート１３４から脱落する場合がある。酵素のテンプレート１３４から脱落する確率は、テンプレート１３４の開始点から離れる程、大きくなる。

そこで、図１４で示されるRNA増幅によって増幅されたcRNA１３５をターゲットとする場合、酵素のテンプレート１３４から脱落する確率を補正して、被検体における発現の量を正確に測定するため、脱落係数Ｓｅｐ（ｋ）を結合強度Ｈｏｍ（ｇ_i（ｋ，ｐｌ），ｇ_j）に乗じた値が結合指数ｅ_kjとされる。

脱落係数Ｓｅｐ（ｋ）は、例えば、式（５）で算出される。
Ｓｅｐ（ｋ）＝１−ｃｋ｛ｌｎｇ（ｇ_i）−ｐｌ｝^-1
・・・（５）
ｃは、１未満の定数である。

図１５で示されるように、脱落係数Ｓｅｐ（ｋ）は、開始点からの距離を示す変数ｋが０の場合、１となり、変数ｋがｌｎｇ（ｇ_i）である場合、１−ｃとなり、変数ｋに応じて線形に変化する。

なお、RNA増幅しないで発現量を求める場合、脱落係数Ｓｅｐ（ｋ）を用いずに、結合強度Ｈｏｍ（ｇ_i（ｋ，ｐｌ），ｇ_j）がそのまま結合指数ｅ_kjとされる。

ステップＳ９４において、変数ｋが変数Ｌ_i以上となったと判定された場合、ステップＳ９６に進む。

ステップＳ９６において、ハイブリダイズ率計算部６４は、結合平均強度ｅおよび特異性指数ｅ_ikを算出し、ステップＳ９３に戻り、上述した処理を繰り返す。

結合平均強度ｅは、プローブｇ_i（ｋ，ｐｌ）と全ての発現可能遺伝子８１のそれぞれとの結合指数ｅ_kjの平均であり、式（６）で算出される。

・・・（６）

特異性指数ｅ_ikは、プローブｇ_i（ｋ，ｐｌ）と全ての発現可能遺伝子８１のそれぞれとの結合指数ｅ_kjの分散であり、式（７）で算出される。

・・・（７）

ステップＳ９１において、変数ｉが観測対象遺伝子数Ｇｏｎを超えたと判定された場合、処理は終了する。

このように、観測対象遺伝子８２の塩基配列から、プローブ塩基長ｐｌの塩基配列を抽出した部分と相補的な塩基配列であるプローブｇ_i（ｋ，ｐｌ）のそれぞれについて、特異性指数ｅ_ikが算出される。すなわち、１つの観測対象遺伝子８２_iについて、変数Ｌ_iの数だけ、特異性指数ｅ_ikが算出される。

ステップＳ７２においては、このように１つの観測対象遺伝子８２_iについて算出された特異性指数ｅ_ikが、その観測対象遺伝子８２_iに対応するスタックに、プローブ開始位置（ｋ）と共に格納される。

そして、全ての観測対象遺伝子８２について、所定の数の特異性指数ｅ_ikが算出されることになる。

従って、全ての観測対象遺伝子８２について、個々に対応するスタックの全てに、それぞれの観測対象遺伝子８２についての、所定の数の特異性指数ｅ_ikがプローブ開始位置と共に格納されることになる。

図１６は、特異性指数ｅ_ikと結合強度ａとの関係を説明する図である。特異性を最大にするために、特異性指数ｅ_ikが最大となるプローブを採用する。特異性指数ｅ_ikは、結合強度ベクトルの要素の分散値に対応する。

図１６で示されるように、ｍ個の観測対象遺伝子８２をターゲットｇ₁乃至ｇ_mとし、観測対象遺伝子８２以外のｆ個の発現可能遺伝子８１をターゲットｇ₁₊₁乃至ｇ_m+fとし、ｎ個のハイブリダイズ検証用プローブをプローブｐ₁乃至ｐ_nとした場合、ターゲットｇ₁乃至ｇ_m+fと、プローブｐ₁乃至ｐ_nとの結合強度行列は、結合強度ａ₁ ¹乃至ａ_n ^m+fを要素とする。

例えば、結合強度ａ₂ ¹はターゲットｇ₁とプローブｐ₂との結合の確率を示し、結合強度ａ₂ ²はターゲットｇ₂とプローブｐ₂との結合の確率を示し、同様に、結合強度ａ₂ ³乃至ａ₂ ^m+fは、それぞれ、ターゲットｇ₃乃至ｇ_m+fとプローブｐ₂との結合の確率を示すので、ターゲットｇ₁乃至ｇ_m+fのそれぞれとプローブｐ₂との結合の確率は、結合強度行列の要素のうちの、結合強度ａ₂ ¹乃至ａ₂ ^m+fを要素とする結合強度ベクトルａ₂により表される。

結合強度行列の１行の要素の分散値は、対応するプローブｐが特定のターゲットｇと結合する傾向を示す。結合強度行列の１行の要素の分散値がより大きくなると、対応するプローブｐが特定のターゲットｇと結合する傾向が強くなる。例えば、結合強度行列の２行目の要素である結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値の分散値は、プローブｐ₂がターゲットｇ₁乃至ｇ_m+fのうちの特定のターゲットｇと結合する傾向を示す。例えば、結合強度行列の２行目の要素である結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値の分散値がより大きくなると、プローブｐ₂がターゲットｇ₁乃至ｇ_m+fのうちの特定のターゲットｇと結合する傾向が強くなる。より詳しく説明すれば、結合強度ａ₂ ¹乃至ａ₂ ^m+fのうち、結合強度ａ₂ ²が最大で、結合強度行列の２行目の要素である結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値がより大きくなると、プローブｐ₂がターゲットｇ₂と結合し、ターゲットｇ₁およびターゲットｇ₃乃至ｇ_m+fに結合しない傾向が強くなる。

例えば、プローブｐ₂がターゲットｇ₂にのみ結合し、プローブｐ₂がターゲットｇ₁およびターゲットｇ₃乃至ｇ_m+fに結合しない場合の結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値（すなわち、結合強度ａ₂ ¹が１で、それ以外が０であるときの分散値）と、プローブｐ₂がターゲットｇ₁乃至ｇ_m+fに同じ確率で結合する場合の結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値（すなわち、総ての結合強度ａが一定で平均値に等しい）とを比較すると、結合強度ａが０以上１以下の値なので、プローブｐ₂がターゲットｇ₂にのみ結合し、プローブｐ₂がターゲットｇ₁およびターゲットｇ₃乃至ｇ_m+fに結合しない場合の結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値は、プローブｐ₂がターゲットｇ₁乃至ｇ_m+fに同じ確率で結合する場合の結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値より大きい。

すなわち、ターゲットｇ₂にのみ結合し、ターゲットｇ₁およびターゲットｇ₃乃至ｇ_m+fに結合しない傾向が最も強いプローブｐ₂を選択するには、結合強度ａ₂ ¹乃至ａ₂ ^m+fのうち結合強度ａ₂ ²が最大となり、結合強度ａ₂ ¹乃至ａ₂ ^m+fの分散値がより大きくなるプローブｐ₂を選択すればよい。

分散値がより大きくなるプローブｐを選択することにより、特定のターゲットについて、非特異的ハイブリダイズの確率に対する特異的ハイブリダイズの確率を最も大きく、すなわち、特異性を最大にできる。

上述したように、ステップＳ９５において、結合強度ａに対応する結合指数ｅ_kjが算出され、ステップＳ９６において、プローブのそれぞれについて、結合指数ｅ_kjの分散である特異性指数ｅ_ikが算出される。

特異性指数ｅ_ikを基にして、複数の観測対象遺伝子８２の発現を観測するための複数の発現解析用プローブを選ぶことができる。

次に、図１７を参照して、図９のステップＳ７３乃至ステップＳ７５の処理をより詳細に説明する。

ステップＳ１２１において、プローブ候補選択部６５は、変数ｉの初期値を１とし、変数ｉを１ずつインクリメントして、変数ｉが、ｎ以下である間、それぞれの変数ｉについて、ステップＳ１２２乃至ステップＳ１２４の処理を繰り返し実行させるように処理を制御する。例えば、ｎは、観測対象遺伝子数Ｇｏｎとされる。

ステップＳ１２２において、プローブ候補選択部６５は、特異性指数ｅ_i1乃至ｅ_iLi乃至から最大の特異性指数ｅ_ikと、対応するｋを取り出す手続きｐｏｐ（ｅ）を作成する。すなわち、手続きｐｏｐ（ｅ）によれば、１つの観測対象遺伝子８２_iに対応するスタックに格納されている特異性指数ｅ_i1乃至ｅ_iLiのうち、最大の特異性指数ｅ_ikと、対応するｋとが取り出される。

ステップＳ１２３において、プローブ候補選択部６５は、手続きｐｏｐ（ｅ（ｇ_i））によって、観測対象遺伝子８２_iに対応するスタックから、そのスタックに格納されている特異性指数ｅのうち、最大の特異性指数ｅ_ikを取り出すと共に、対応するｋを取り出す。プローブ候補選択部６５は、抽出した最大の特異性指数ｅ_ikを変数ｄ_iに設定して、配列（ｉ，ｄ_i，ｋ）を生成する。

なお、手続きｐｏｐ（ｅ）によって、最大の特異性指数ｅ_ikと、対応するｋとが取り出された場合、プローブ候補選択部６５は、最大の特異性指数ｅ_ikが抽出されたスタックから、取り出された特異性指数ｅ_ikに対応するプローブと共通する塩基配列を有するプローブに対応する特異性指数を削除する。例えば、図１８で示されるように、観測対象遺伝子８２_iに対応するスタックに、プローブ１０２_iのそれぞれに対応する特異性指数ｅ_i0乃至特異性指数ｅ_iLi-1が格納されている場合、手続きｐｏｐ（ｅ）によって、観測対象遺伝子８２_iに対応するスタックから最大の特異性指数ｅ_ikが取り出されたとき、プローブ候補選択部６５は、観測対象遺伝子８２_iに対応するスタックから、取り出された特異性指数ｅ_ikに対応するプローブ１０２_ikと共通する塩基配列を有するプローブ１０２_i(k-1)に対応する特異性指数ｅ_i(k-1)およびプローブ１０２_i(k+1)に対応する特異性指数ｅ_i(k+1)を削除する。

ステップＳ１２４において、プローブ候補選択部６５は、プローブｇ_i（ｋ，ｐｌ）をプローブ群に加え、ステップＳ１２１に戻り上述した処理を繰り返す。

ステップＳ１２３およびステップＳ１２４の処理はｎ回繰り返されるので、ｎ個の配列（ｉ，ｄ_i，ｋ）が生成され、ｎ個のプローブｇ_i（ｋ，ｐｌ）がプローブ群に加えられることになる。

ステップＳ１２１において、変数ｉが観測対象遺伝子数Ｇｏｎを超えたと判定された場合、ステップＳ１２５に進む。

ステップＳ１２５において、プローブ候補選択部６５は、変数ｊの初期値をｎ＋１とし、変数ｊを１ずつインクリメントして、変数ｊが、所定の定数ｍ以下である間、それぞれの変数ｊについて、ステップＳ１２６乃至ステップＳ１３１の処理を繰り返し実行させるように処理を制御する。

ステップＳ１２６において、プローブ候補選択部６５は、配列（ｉ，ｄ_i，ｋ）（０≦ｉ≦ｎ）から最小となるｄ_iと、これに対応するｉを取り出す。ステップＳ１２７において、プローブ候補選択部６５は、ｄ_iが０に等しいか否かを判定し、ｄ_iが０に等しくないと判定された場合、ステップＳ１２８に進み、プローブ候補選択部６５は、手続きｐｏｐ（ｅ（ｇ_i））によって、観測対象遺伝子８２_iに対応するスタックから、そのスタックに格納されている特異性指数ｅのうち、最大の特異性指数ｅ_ikを取り出すと共に、対応するｋを取り出す。プローブ候補選択部６５は、抽出した最大の特異性指数ｅ_ikを変数ｄ_iに設定して、配列（ｉ，ｄ_i，ｋ）を生成する。

ステップＳ１２９において、プローブ候補選択部６５は、ｐｏｐできなかったか否か（最大の特異性指数ｅ_ikおよび対応するｋを取り出すことができなかったか否か）を判定し、ｐｏｐできなかった（最大の特異性指数ｅ_ikおよび対応するｋを取り出すことができなかった）と判定された場合、ステップＳ１３０に進み、配列（ｉ，ｄ_i，ｋ）を削除して、ステップＳ１２６に戻り、上述した処理を繰り返す。

ステップＳ１２９において、ｐｏｐできた（最大の特異性指数ｅ_ikおよび対応するｋを取り出すことができた）と判定された場合、ステップＳ１３１に進み、プローブ候補選択部６５は、プローブｇ_i（ｋ，ｐｌ）をプローブ群に加え、ステップＳ１２５に戻り、上述した処理を繰り返す。

ステップＳ１２５において、変数ｊが、所定の定数ｍを超えたと判定された場合、またはステップＳ１２７において、ｄ_iが０に等しいと判定された場合、処理は終了する。

図１９で示されるように、ステップＳ１２３の処理において、それぞれのスタックにおいて最大の特異性指数ｅ_ikおよび対応するｋ_iが取り出され（１≦ｉ≦Ｇｏｎ）、ステップＳ１２４の処理において、プローブｇ_i（ｋ_i，ｐｌ）がプローブ群に加えられる。そして、ステップＳ１２８の処理において、それぞれのスタックから取り出された特異性指数ｅ_ikのうち、最も小さい特異性指数ｅ_ikが取り出されたスタックから、さらに、そのスタックにおいて最大の特異性指数ｅ_ikおよび対応するｋ_iが取り出され、ステップＳ１３１の処理において、取り出されたｋ_iに対応するプローブｇ_i（ｋ_i，ｐｌ）がプローブ群に加えられる。

図２０は、ステップＳ１２５乃至ステップＳ１３１の処理で取り出されるプローブと、結合強度ａとの関係を説明する図である。図２０において、ｍ個の観測対象遺伝子８２をターゲットｇ₁乃至ｇ_mとし、観測対象遺伝子８２以外のｆ個の発現可能遺伝子８１をターゲットｇ₁₊₁乃至ｇ_m+fとし、ｎ個のハイブリダイズ検証用プローブをプローブｐ₁乃至ｐ_nとする。

ステップＳ１２３の処理において、ｍ個の観測対象遺伝子８２のそれぞれに対応するスタックから、スタックにおいて最大の特異性指数ｅ_ikおよび対応するｋ_iが取り出され、ステップＳ１２４の処理において、最大の特異性指数ｅ_ikに対応するプローブｇ_i（ｋ_i，ｐｌ）がプローブ群に加えられるので、ｍ個のプローブと、結合強度行列の、結合強度ａ₁ ¹乃至ａ_m ^m+fである要素とが決まる。

スタックにおいて最大の特異性指数ｅ_ikのうち、最小の特異性指数ｅ_ikを選ぶことは、現在プローブ群に加えられているプローブについての結合強度行列の全ての行ベクトル要素の分散値ｅ_ikの中で最小となる、ターゲットｇ₁乃至ｇ_mのいずれかを選択することを意味する。他の値に比較して分散値ｅ_ikが小さいということは、特異性が小さいことを示し、他のターゲットに比較して、そのターゲットがプローブと結合する確率が小さいと言える。

そこで、既に選択されているプローブと結合する確率が、他のターゲットに比較して小さいターゲットを検出するためのプローブをさらに選択する。

例えば、図２０で示されるように、現在プローブ群に加えられているプローブについての結合強度行列の全ての行ベクトル要素の分散値ｅ_ikの中で最小となるターゲットｇ₂が選択されると、ターゲットｇ₂について、結合強度ａ’₂ ¹乃至ａ’₂ ^m+fであるベクトル要素の分散値が最大になるプローブがさらに選択されて、プローブ群に加えられる。すなわち、ターゲットｇ₂に対するスタックから、さらに、そのスタックにおいて最大の特異性指数ｅ_ikが選択され、対応するプローブがプローブ群に加えられる。

このようにすることで、所定の個数の観測対象遺伝子８２をより確実に検出できるようになる。

なお、上述したように、ステップＳ１２３の処理において、手続きｐｏｐ（ｅ）によって、最大の特異性指数ｅ_ikおよび対応するｋ_iが取り出されると、取り出された特異性指数ｅ_ikに対応するプローブと共通する塩基配列を有するプローブに対応する特異性指数が削除されるので、ステップＳ１３１の処理において、プローブ群に加えられるプローブの塩基配列は、既にプローブ群に加えられているプローブの塩基配列と重複することがない。これにより、より正確に、ターゲットを検出することができるようになる。

このように、DNAチップに固定するプローブを選択することができる。特に、より少ない回数の測定で、複数の遺伝子それぞれの発現量を定量的に測定するためのプローブを簡単に選ぶことが可能になる。

次に、実験過程の処理および実験過程の処理を実行する装置について説明する。

遺伝子発現量の定量的な測定は、図２１に示される実験過程処理装置３０１により行われる。

実験過程処理装置３０１は、調整部３２１、ハイブリダイズ部３２２、取得部３２３、発現量推定部３２４、標準化部３２５、出力部３２６、および記憶部３２７により構成されている。

調整部３２１はターゲットの調整を行う。ハイブリダイズ部３２２はプローブとターゲットとのハイブリダイズを行う。取得部３２３は蛍光強度を取得する。発現量推定部３２４は発現量の推定処理を行う。標準化部３２５はデータの標準化を行う。出力部３２６は発現プロファイルデータを出力する。記憶部３２７は発現プロファイルデータを記憶する。

図２２は、図２１の実験過程処理装置３０１の一部を構成する生体情報処理装置の構成例を表している。この生体情報処理装置３３１は、DNAチップ３５１、ピックアップ部３６１、蛍光強度取得部３６２、励起光強度計算部３６３、ハイブリダイズ量推定部３６４、発現量計算部３６５、標準化部３６６、出力部３６７、発現プロファイルデータ記憶部３６８、表示部３６９Ａを有するユーザインターフェース（UI）部３６９、蛍光強度−ハイブリダイズ量変換式記憶部３７０、並びに機械的学習部３７１により構成されている。

なお、実験過程処理装置３０１の取得部３２３、発現量推定部３２４、標準化部３２５、出力部３２６および記憶部３２７が、生体情報処理装置３３１により構成されている。具体的には、取得部３２３は、ピックアップ部３６１、蛍光強度取得部３６２、励起光強度計算部３６３、および蛍光強度−ハイブリダイズ量変換式記憶部３７０により構成され、発現量推定部３２４は、ハイブリダイズ量推定部３６４、発現量計算部３６５、および機械的学習部３７１により構成され、標準化部３２５は標準化部３６６により構成され、出力部３２６は出力部３６７により構成され、記憶部３２７は発現プロファイルデータ記憶部３６８により構成される。

DNAチップ３５１は、スポット３５２とガイド３５３を有している。図２３は、DNAチップ３５１のより詳細な構成例を表している。

DNAチップ３５１は、その基板３５１Ａ上に、発現解析用反応槽５０１と細胞数計数用反応槽５０２を有している。基板３５１Ａの図中下側の端部には、直線状の開始位置ガイド３５３Ａが設けられ、図中上側の端部には、終了位置ガイド３５３Ｂが設けられている。図２２のガイド３５３は、具体的には、この開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂにより構成される。

発現解析用反応槽５０１と細胞数計数用反応槽５０２は、この開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂの間に配置されている。

発現解析用反応槽５０１には、反応領域としての複数のスポット３５２が形成されており、各スポット３５２には、生体物質（第３の生体物質）としてのハイブリダイズ検証用プローブ５１１、発現解析用プローブ５１２、並びに発現標準化用コントロールプローブ５１３が固定されている。発現解析用反応槽５０１にサンプルが滴下された場合、ハイブリダイズ検証用プローブ５１１には、その塩基と相補的構成を有する塩基を有する生体物質（第２の生体物質）としてのターゲット５１１Ａがハイブリダイズする。同様に、発現解析用プローブ５１２には、その塩基と相補的構成を有する塩基を有する生体物質としてのターゲット５１２Ａがハイブリダイズする。

なお、発現解析用プローブ５１２は、発現解析用プローブ設計装置５１により設計される。

また、発現標準化用コントロールプローブ５１３には、その塩基と相補的構成の塩基を有する生体物質としてのターゲット５１３Ａがハイブリダイズする。

細胞数計数用反応槽５０２においては、生体物質としてのハイブリダイズ検証用プローブ５１４と細胞数計数用コントロールプローブ５１５が、それぞれ反応領域としてのスポット３５２に取り付けられている。細胞数計数用反応槽５０２にサンプルが滴下された場合、ハイブリダイズ検証用プローブ５１４には、その塩基と相補的構成の塩基を有する生体物質としてのターゲット５１４Ａがハイブリダイズし、細胞数計数用コントロールプローブ５１５には、その塩基と相補的構成の塩基を有する生体物質としてのターゲット５１５Ａがハイブリダイズする。

ハイブリダイズした（生体反応した）生体物質としてのプローブとターゲットには、インターカレータ５１６が結合されている。インターカレータ５１６は励起光が照射されると蛍光を発生する。

図２３には、このように、各プローブに対してターゲットがハイブリダイズした状態が示されている。なお、図２３には便宜上、１つのスポット３５２に１つのプローブのみが示されているが、実際には１つのスポット３５２に対して同一種類の複数のプローブが固定されている。また、各反応槽には同一種類のプローブが固定された任意の数のスポットが、予め定められた所定の位置に配置されている。

図２２のピックアップ部３６１は、蛍光強度取得用ピックアップ３９１、ガイド信号取得用ピックアップ３９２、コントロール部３９３、対物座標計算部３９４、および畳み込み展開部３９５で構成されている。

蛍光強度取得用ピックアップ３９１は、図２３のDNAチップ３５１の発現解析用反応槽５０１と細胞数計数用反応槽５０２の画像を取得するピックアップである。これに対して、ガイド信号取得用ピックアップ３９２は、開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂを読み取るためのピックアップである。

蛍光強度取得用ピックアップ３９１は、対物レンズ４１１、プリズム４１２、半導体レーザ４１３、およびフォトダイオード４１４を有している。半導体レーザ４１３より出射されたレーザ光（励起光）は、プリズム４１２を介して対物レンズ４１１に入射され、対物レンズ４１１は、入射されたレーザ光を基板３５１Ａ（スポット３５２）上に照射する。対物レンズ４１１はまた、スポット３５２からの光をプリズム４１２を介してフォトダイオード４１４に入射する。各スポット３５２には、複数のプローブが固定されており、プローブとターゲットがハイブリダイゼーションした場合、さらに両者にはインターカレータ５１６が結合される。すなわち、プローブとターゲットがハイブリダイゼーションしていない場合には、両者の間にインターカレータ５１６は存在せず、ハイブリダイゼーションした場合においてのみ、両者の間にインターカレータ５１６が存在する。インターカレータ５１６は、励起光が照射されると蛍光を発生する。対物レンズ４１１により集光された蛍光はプリズム４１２により励起光と分離されて、フォトダイオード４１４に入射される。

ハイブリダイゼーションしている量が多ければ、それだけインターカレータ５１６の量も多く、したがって、そこから発生する蛍光量も多い。したがって、蛍光の強度に基づいて、ハイブリダイゼーションの状態を測定する（ハイブリダイゼーションの情報を得る）ことが可能となる。

コントロール部３９３は、半導体レーザ４１３の電流制御を行い、その励起光の強度を調整する。また、コントロール部３９３は、フォトダイオード４１４の出力（電流量変化）を読み取る。

畳み込み展開部３９５は、フォトダイオード４１４より出力された電流量変化に基づく信号をコントロール部３９３から受け取り、ピクセル単位の画像データを生成する。

ガイド信号取得用ピックアップ３９２は、対物レンズ４２１、プリズム４２２、半導体レーザ４２３、およびフォトダイオード４２４により構成されている。半導体レーザ４２３は、コントロール部３９３からの制御に基づいて、レーザ光を発生する（このレーザ光は、ガイド検出光として機能する）。プリズム４２２は、半導体レーザ４２３からのレーザ光を対物レンズ４２１に入射し、対物レンズ４２１はこのレーザ光を基板３５１Ａに照射する。対物レンズ４２１は、基板３５１Ａからの反射光を受光し、プリズム４２２はこの反射光を照射光から分離してフォトダイオード４２４に出射する。フォトダイオード４２４は、プリズム４２２より入射された反射光を光電変換し、ガイド信号としてコントロール部３９３に出力する。コントロール部３９３は、フォトダイオード４２４より入力されたガイド信号を対物座標計算部３９４に出力する。ガイド３５３（開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂ）は、基板３５１Ａの他の領域に較べて反射率が高く（または低く）なるように形成されている。対物座標計算部３９４は、コントロール部３９３を介して、ガイド信号取得用ピックアップ３９２より供給されたガイド信号のレベルに基づいて、開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂの位置、並びに開始位置ガイド３５３Ａから終了位置ガイド３５３Ｂに向けて等速度で移動されるガイド信号取得用ピックアップ３９２の位置（座標）を計算する。

コントロール部３９３は、対物座標計算部３９４により計算されたガイド信号取得用ピックアップ３９２の位置に基づいて、蛍光強度取得用ピックアップ３９１（対物レンズ４１１）の位置を制御する。ガイド信号取得用ピックアップ３９２と蛍光強度取得用ピックアップ３９１は、相互に所定の位置関係に固定されており、蛍光強度取得用ピックアップ３９１を図２３における開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂの間における所定の位置に配置することは、とりもなおさずガイド信号取得用ピックアップ３９２を開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂの間の所定の位置に配置することになる。

蛍光強度取得部３６２は、蛍光強度取得用ピックアップ３９１のフォトダイオード４１４が出力した各スポット３５２（その座標（ｘ，ｙ））からの蛍光強度（pfx，y）の入力を受け、この蛍光強度に関するデータをハイブリダイズ量推定部３６４の励起光強度推定部４４１に出力する。蛍光強度取得部３６２はまた、蛍光強度取得用ピックアップ３９１の対物レンズ４１１の基板３５１Ａ上の対物座標（ｘ，ｙ）、対物面積半径（ｒ）、並びに励起光強度を制御する制御信号をコントロール部３９３に出力する。コントロール部３９３は、この制御信号に基づいて対物レンズ４１１を制御する。これにより、対物レンズ４１１が基板３５１Ａ上の所定の座標（ｘ，ｙ）に配置され、対物レンズ４１１より出射されるレーザ光の照射範囲の半径（対物面積半径）（ｒ）が所定の値に制御され、そのレーザ光の強度（励起光強度）が所定の値に調整される。

蛍光強度取得部３６２は、コントロール部３９３から供給された蛍光強度を、励起光強度計算部３６３に出力する。励起光強度計算部３６３は、蛍光強度−ハイブリダイズ量変換式記憶部３７０に記憶されている変換式に基づいて、プリスキャン時に蛍光強度取得部３６２から入力された蛍光強度に基づいて、最適な励起光強度を計算し、その計算して得られた励起光強度を蛍光強度取得部３６２に出力する。本スキャン時、蛍光強度取得部３６２は、この励起光強度計算部３６３からの励起光強度に基づいて半導体レーザ４１３の電流を制御し、所定の強さの励起光を半導体レーザ４１３より出射させる。

ハイブリダイズ量推定部３６４は、励起光強度推定部４４１、作成部４４２、画像処理部４４３、検証部４４４、並びにハイブリダイズ量計算部４４５により構成されている。

反応領域の画像情報を入力する入力手段としての励起光強度推定部４４１は、蛍光強度取得部３６２より供給された蛍光強度に基づく画像データ、または発現プロファイルデータ記憶部３６８にあらかじめ記憶されている発現プロファイルデータなどの画像情報の入力を受け、必要に応じて励起光強度を推定する処理を行う。作成部４４２は励起光強度推定部４４１からのデータに基づいて、蛍光強度からハイブリダイズ量を一義的に決定する式hybridize(pf)を作成する。画像処理部４４３は、作成部４４２より入力された画像データを処理し、検証部４４４とユーザインターフェース部３６９に出力する。ユーザインターフェース部３６９は、画像処理部４４３より入力された画像を表示部３６９Ａに表示する。画像処理部４４３は、ユーザインターフェース部３６９を介して、ユーザより指示される入力に基づいて、DNAチップ３５１の画像からデブリ（観測を行う上において障害となる物質）の成分を除去し、各スポット３５２毎の画像へ分解する処理を行う。

検証部４４４は、画像処理部４４３より入力された画像データのうち、ハイブリダイズ検証用プローブ５１１，５１４のスポット３５２におけるハイブリダイズ量に基づいて、ハイブリダイズが正しく行われていることを検証する。

ハイブリダイズ量計算部４４５は、スポット内領域を分割し、スポット内領域単位でハイブリダイズ値と信頼度の計算を行い、スポット単位でのハイブリダイズ値と信頼度を出力する。

発現量計算部３６５は、ハイブリダイズ量計算部４４５からの出力に基づいて、プローブに対するターゲットの結合強度を求めることで、蛍光強度に対応する発現量を推定する。標準化部３６６は発現標準化用コントロールプローブ５１３と細胞数計数用コントロールプローブ５１５を利用した標準化処理を行う。出力部３６７は標準化されたデータを発現プロファイルデータ記憶部３６８に供給する。発現プロファイルデータ記憶部３６８は、出力部３６７より供給されたデータを、発現プロファイルデータとして記憶する。発現プロファイルデータ記憶部３６８に記憶されたデータは、必要に応じて、ユーザインターフェース部３６９に供給され、表示部３６９Ａに表示される。発現量計算部３６５より出力されたデータも必要に応じて、表示部３６９Ａに表示される。

蛍光強度−ハイブリダイズ量変換式記憶部３７０は、変換式取得部１３によって取得された、蛍光強度とそれに対応する、プローブとターゲットとのハイブリダイズ量との関係を一義的に決定する変換式である蛍光強度−ハイブリダイズ量変換式をあらかじめ記憶している。

機械的学習部３７１は、機械的学習の手段としてのSVM（Support Vector Machine）４６１とスポット除去パターンデータベース４６２を有している。SVM４６１は学習モード時、ユーザインターフェース部３６９と発現プロファイルデータ記憶部３６８からのデータに基づいて学習を行い、学習結果をスポット除去パターンデータベース４６２に記憶させる。SVM４６１はまた、判定モード時、発現プロファイルデータ記憶部３６８からのデータを、スポット除去パターンデータベース４６２に記憶されているパターンに基づいて判定し、その判定結果をハイブリダイズ量計算部４４５に出力する。

なお、SVMについては、Nello Cristianini, John Shawe-Taylor, An Introduction to Support Vector Machines and other kernel-based learning methods, Cambridgeに詳細な説明がある。

また、機械的学習としては、SVMのほかにニューラルネットワークなどを採用することも可能である。

次に、図２１の実験過程処理装置３０１による、図４のステップＳ１２の実験過程の処理を、図２４のフローチャートを参照して説明する。

最初に、ステップＳ３１１において、調整部３２１はターゲットを調整する。具体的には、細胞が含まれるサンプルが取り出され、その中から蛋白質を変性させて除去する処理が行われ、RNA（ribonucleic acid）の抽出、断片化、並びにDNA(deoxyribonucleic acid)の抽出、断片化によりターゲット（発現解析用プローブ５１２に対するターゲット５１２Ａ）が生成される。

ステップＳ３１２において、ハイブリダイズ部３２２はハイブリダイズする処理を実行する。具体的には、ステップＳ３１１の処理で生成されたターゲットが入った溶液に、さらにハイブリダイズ検証用プローブ５１１，５１４に対するターゲット５１１Ａ，５１４Ａ、発現標準化用コントロールプローブ５１３に対するターゲット５１３Ａ、並びに細胞数計数用コントロールプローブ５１５に対するターゲット５１５Ａが加えられ、この溶液を発現解析用反応槽５０１と細胞数計数用反応槽５０２に滴下することで、ターゲットとプローブとがハイブリダイズされる。そして、インターカレータ５１６が導入され、ハイブリダイズしたターゲットとプローブに結合され、図２３に示されるようなDNAチップ３５１が得られる。同図に示されるように、発現解析用反応槽５０１のスポット３５２では、発現解析用プローブ５１２に対してターゲット５１２Ａがハイブリダイズしている他、発現標準化用コントロールプローブ５１３に対してターゲット５１３Ａがハイブリダイズしており、ハイブリダイズ検証用プローブ５１１に対してターゲット５１１Ａがハイブリダイズしている。そして、それらの２本鎖結合したプローブとターゲットの間にはインターカレータ５１６が結合している。

同様に、細胞数計数用反応槽５０２のスポット３５２においても、ハイブリダイズ検証用プローブ５１４に対してターゲット５１４Ａがハイブリダイズしており、細胞数計数用コントロールプローブ５１５に対してターゲット５１５Ａがハイブリダイズしている。そして、これらのハイブリダイズしたプローブとターゲットの間にも、インターカレータ５１６が結合されている。

なお、発現解析用プローブ５１２は、図６のステップＳ５１の発現解析用プローブ設計の処理において設計されたものである。

ステップＳ３１３において、取得部３２３は蛍光強度を取得する。具体的には、蛍光強度取得部３６２は、コントロール部３９３を介して蛍光強度取得用ピックアップ３９１を駆動し、半導体レーザ４１３にレーザ光を励起光として出射させる。この励起光は、プリズム４１２を介して対物レンズ４１１に入射され、対物レンズ４１１は、これを基板３５１Ａ上の発現解析用反応槽５０１に照射する。

インターカレータ５１６は励起光が照射されると蛍光を発生する。この蛍光が対物レンズ４１１により集光され、プリズム４１２を介してフォトダイオード４１４に入射される。フォトダイオード４１４は蛍光に対応する電流を出力する。コントロール部３９３は、この電流に対応する信号を畳み込み展開部３９５により画像信号に変換させ、変換により生成された蛍光強度に対応する信号を、蛍光強度取得部３６２に出力する。

コントロール部３９３は、対物レンズ４１１の位置を開始位置ガイド３５３Ａから終了位置ガイド３５３Ｂの方向に向けて移動させる。このとき、ガイド信号取得用ピックアップ３９２の半導体レーザ４２３が出射するガイド検出光としてのレーザ光が、プリズム４２２を介して対物レンズ４２１に入射され、対物レンズ４２１がこのガイド検出光を基板３５１Ａに照射する。ガイド検出光の反射光の強度は、開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂに照射されたとき強くなる。この反射光が対物レンズ４２１を介してプリズム４２２に入射され、プリズム４２２からフォトダイオード４２４に入射される。対物座標計算部３９４はコントロール部３９３を介してフォトダイオード４２４からのガイド信号を取得し、この信号に基づいて、ガイド信号取得用ピックアップ３９２（したがって、それと一体化している蛍光強度取得用ピックアップ３９１）が基板３５１Ａの開始位置ガイド３５３Ａと終了位置ガイド３５３Ｂの間のいずれの位置に位置するのか、その座標を計算する。コントロール部３９３はその座標に基づいてガイド信号取得用ピックアップ３９２（蛍光強度取得用ピックアップ３９１）を開始位置ガイド３５３Ａから終了位置ガイド３５３Ｂまで一定の速度で移動させる（走査させる）。

このようにして、蛍光強度取得用ピックアップ３９１が、図２３において、開始位置ガイド３５３Ａから終了位置ガイド３５３Ｂの位置まで移動されるとともに、さらに、その走査位置が、開始位置ガイド３５３Ａ（終了位置ガイド３５３Ｂ）と平行な方向（図中ｘ座標方向）に１ピッチ分だけ移動され、新たな移動位置において同様に、開始位置ガイド３５３Ａから終了位置ガイド３５３Ｂまで移動される。このようにして、発現解析用反応槽５０１と細胞数計数用反応槽５０２の全体が走査され、各座標における画像信号が蛍光強度取得用ピックアップ３９１より出力される。

ステップＳ３１４において、発現量推定部３２４は発現量推定処理を実行する。この発現量推定処理の詳細は、図２５を参照して後述するが、この処理によりハイブリダイズ量と信頼度の計算が行われ、発現量が計算される。

次に、ステップＳ３１５において、標準化部３２５（標準化部３６６）により、データを標準化する処理が行われる。この標準化としては、発現標準化用コントロールプローブ５１３による標準化と、細胞数計数用コントロールプローブ５１５による標準化が行われる。

さらに、ステップＳ３１６において、出力部３２６（出力部３６７）は、発現プロファイルデータを出力する。具体的には、以上のようにして得られた画像データが、記憶部３２７（発現プロファイルデータ記憶部３６８）に供給され、記録される。

次に、図２５のフローチャートを参照して、図２４のステップＳ３１４の発現量推定処理について説明する。ステップＳ３３１において、励起光強度推定部４４１は画像情報を入力する。具体的には、蛍光強度取得部３６２より画像情報が入力される。ステップＳ３３２において、励起光強度推定部４４１は、ステップＳ３３１で入力された画像情報に励起光強度情報があるか（含まれているか）を判定する。

励起光強度推定部４４１が蛍光強度取得部３６２より入力する画像情報は、セットとなる画像の枚数の他、各スポットの画像の励起光強度、縦横ピクセル数、および蛍光画像により構成されている画像データと、スポット位置テンテンプレート画像、スポット数、プローブ遺伝子インデックスなどにより構成されている共通データとからなる。

したがって、少なくとも蛍光強度取得部３６２より供給される画像情報の場合、画像データに励起光強度が含まれているので、励起光強度情報があると判定される。これに対して、発現プロファイルデータ記憶部３６８からそこに記憶されている発現プロファイル画像が供給される場合、それが蛍光強度取得部３６２から供給され、記憶された画像である場合には上述したように励起光強度情報が存在するが、そうでない場合（他の装置から供給された画像データである場合）には、励起光強度情報が存在しないことがある。

ステップＳ３３２において、励起光強度情報が存在しないと判定された場合、ステップＳ３３３において、励起光強度推定部４４１は、励起光強度を推定する処理を実行する。

この励起光強度を推定する処理は、少なくとも２つの異なる強度の励起光に基づいて測定が行われた画像情報（画像データ）である場合に実行可能となる。励起光強度情報が存在する場合、または存在しないとしても、異なる少なくとも２つの励起光強度に基づく画像情報（画像データ）が存在しない場合、励起光強度を推定することができない。このため、これらの場合には、ステップＳ３３３の処理はスキップされる。

次に、ステップＳ３３４において、作成部４４２は、入力された画像情報が複数の励起光強度で撮影した画像の画像情報かを判定する。複数の励起光強度で撮影した画像の画像情報である場合には、ステップＳ３３５において、作成部４４２は、蛍光強度に基づいてハイブリダイズ量を決定する式（８）（hybridize（pf））を作成する。

ステップＳ３３４において、入力された画像データは、複数の励起光強度で撮影した画像の画像データではないと判定された場合には、ステップＳ３３５の処理は実行できないのでスキップされる。

式hybridize_e（pf）は、各スポットの蛍光強度とハイブリダイズ量の関係を規定する。蛍光強度が与えられると対応するハイブリダイズ量は関数に基づき一義的に決定される。ただし、励起光強度が変化すると、蛍光強度のレベルも変化する。

式（８）中の式hybridize_s（pf_s）と式hybridize_w（pf_w）は、それぞれ、得られたデータのうちの、励起光強度が強い方の式hybridize_e（pf）と、弱い方の式hybridize_e（pf）を表している。

次に、ステップＳ３３６において、画像処理部４４３は画像処理を行う。この処理により、DNAチップ３５１の画像からスポット境界を跨ぐデブリ領域が除去され、画像は各スポット毎の画像に分解される。

ステップＳ３３７において、検証部４４４は、ハイブリダイズを検証する処理を実行する。具体的には、図２３に示されるように、発現解析用反応槽５０１にはハイブリダイズ検証用プローブ５１１が、また細胞数計数用反応槽５０２にはハイブリダイズ検証用プローブ５１４が、それぞれスポット３５２に固定されている。ハイブリダイズ検証用プローブ５１１，５１４の蛍光値を測定することで、その蛍光値が、例えばあらかじめ設定されている基準値以上であれば、正しいハイブリダイズ処理が行われていることを検証することができる。

ステップＳ３３８において、ハイブリダイズ量計算部４４５は、ハイブリダイズ量と信頼度の計算を行う。この処理によりスポット内領域にデブリが存在する場合、スポット内領域が複数の領域に分割され、各スポット内領域毎に、そして最終的にはスポット単位で、ハイブリダイズ値と信頼度が計算される。

ステップＳ３３９において、発現量計算部３６５は、ステップＳ３３８の処理で、ハイブリダイズ量計算部４４５により計算されたハイブリダイズ値と信頼度に基づいて、発現量を計算する処理を実行する。この処理に基づいて、計算された（取得された）蛍光値に対応する発現量が計算される。

このように、本発明によれば、遺伝子の発現を測定することができる。特に、より少ない回数の測定で、複数の遺伝子それぞれの発現量を定量的に測定することが可能になる。

以上、DNAチップのハイブリダイゼーションを測定する場合の実施形態を説明したが、本発明はDNAチップに限らず、各種の生体物質が、他の所定の生体物質と生体結合したかどうかを測定する場合に適用することが可能である。

上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、発現解析用プローブ設計装置５１または生体情報処理装置３３１は、図２６に示されるようなパーソナルコンピュータ９０１により構成される。

図２６において、CPU（Central Processing Unit）９２１は、ROM（Read Only Memory）９２２に記憶されているプログラム、または記憶部９２８からRAM（Random Access Memory）９２３にロードされたプログラムに従って各種の処理を実行する。RAM９２３にはまた、CPU９２１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU９２１、ROM９２２、およびRAM９２３は、バス９２４を介して相互に接続されている。このバス９２４にはまた、入出力インタフェース９２５も接続されている。

入出力インタフェース９２５には、キーボード、マウスなどよりなる入力部９２６、CRT(Cathode Ray Tube)、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部９２７、ハードディスクなどより構成される記憶部９２８、モデムなどより構成される通信部９２９が接続されている。通信部９２９は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース９２５にはまた、必要に応じてドライブ９３０が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア９３１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部９２８にインストールされる。

一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。

この記録媒体は、図２６に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ（Mini-Disc）（商標）を含む）、もしくは半導体メモリなどよりなるリムーバブルメディア９３１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM９２２や、記憶部９２８に含まれるハードディスクなどで構成される。

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の装置（または特定の機能を実現する機能モジュール）が論理的に集合した物を意味し、各装置や機能モジュールが単一の筐体内にあるか否かは問わない。

事前作業する生体情報処理装置の構成例を示すブロック図である。プローブ設計部の構成例を示すブロック図である。発現解析用プローブ設計装置の構成例を示すブロック図である。生体情報の処理を説明するフローチャートである。事前作業の処理を説明するフローチャートである。プローブ設計の処理を説明するフローチャートである。発現解析用プローブおよびハイブリダイズ検証用プローブの設計を説明する図である。特異的ハイブリダイズおよび非特異的ハイブリダイズを説明する図である。発現解析用プローブ設計の処理を説明するフローチャートである。個々のプローブ候補の最大になる特異性について説明する図である。特異性指数の計算の処理を説明するフローチャートである。結合強度Ｈｏｍ（ｐ，ｇ）を説明する図である。結合指数ｅ_kjを説明する図である。 RNA増幅を説明する図である。脱落係数Ｓｅｐ（ｋ）の例を示す図である。特異性指数ｅ_ikと結合強度ａとの関係を説明する図である。フローブ候補の取得の処理を説明するフローチャートである。手続きｐｏｐ（ｅ）の処理を説明する図である。プローブ群にさらにプローブを加える処理を説明する図である。プローブと結合強度ａとの関係を説明する図である。実験過程処理装置の構成例を表すブロック図である。生体情報処理装置の構成例を表すブロック図である。 DNAチップの構成例を表す斜視図である。実験過程の処理を説明するフローチャートである。発現量推定処理を説明するフローチャートである。パーソナルコンピュータの構成例を表すブロック図である。

符号の説明

５１発現解析用プローブ設計装置，６１遺伝子データベース，６２遺伝子配列取得部，６３入力部，６４ハイブリダイズ率計算部，６５プローブ候補選択部，６６出力部，３５１ DNAチップ

Claims

第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、前記第２の生体物質に生体反応する前記第３の生体物質との結合の強さを表す結合強度に基づいて、前記第３の生体物質が前記第２の生体物質のうちの前記第１の生体物質と選択的に生体反応する傾向を表す指数を計算する計算手段と、
前記指数に基づいて、前記第１の生体物質の発現を検出するための前記第３の生体物質を選択する選択手段と
を備える生体情報処理装置。
前記計算手段は、前記結合強度の分散である前記指数を計算する
請求項１に記載の生体情報処理装置。
前記選択手段は、前記指数に基づいて、前記第１の生体物質と最も選択的に生体反応する前記第３の生体物質を選択する
請求項１に記載の生体情報処理装置。
前記選択手段は、前記第１の生体物質について、前記結合強度の分散である前記指数であって、最も値の大きい前記指数に対応する前記第３の生体物質を選択する
請求項１に記載の生体情報処理装置。
前記選択手段は、複数の前記第１の生体物質について、それぞれ、前記結合強度の分散である前記指数であって、最も値の大きい前記指数に対応する前記第３の生体物質を選択して、さらに、選択した前記第３の生体物質の前記指数の小さい順に、前記第１の生体物質について、前記第３の生体物質を選択する
請求項１に記載の生体情報処理装置。
前記選択手段は、所定の数の前記第１の生体物質と、所定の数の前記第３の生体物質との生体反応の確率を示す、前記指数を要素とする行列に基づいて、前記第１の生体物質のそれぞれの生体反応の確率が最大となるように、前記第３の生体物質を選択する
請求項１に記載の生体情報処理装置。
前記計算手段は、前記第１の生体物質の所定の部分と相補的な構造の前記第３の生体物質について、前記指数を計算する
請求項１に記載の生体情報処理装置。
前記計算手段は、前記第１の生体物質の先頭から前記部分までの距離を考慮した前記結合強度に基づいて、前記指数を計算する
請求項７に記載の生体情報処理装置。
第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、前記第２の生体物質に生体反応する前記第３の生体物質との結合の強さを表す結合強度に基づいて、前記第３の生体物質が前記第２の生体物質のうちの前記第１の生体物質と選択的に生体反応する傾向を表す指数を計算する計算ステップと、
前記指数に基づいて、前記第１の生体物質の発現を検出するための前記第３の生体物質を選択する選択ステップと
を含む生体情報処理方法。
第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、前記第２の生体物質に生体反応する前記第３の生体物質との結合の強さを表す結合強度に基づいて、前記第３の生体物質が前記第２の生体物質のうちの前記第１の生体物質と選択的に生体反応する傾向を表す指数を計算する計算ステップと、
前記指数に基づいて、前記第１の生体物質の発現を検出するための前記第３の生体物質を選択する選択ステップと
をコンピュータに実行させるプログラム。
請求項１０に記載のプログラムが記録されている記録媒体。
第１の生体物質の発現を検出しようとする被検体において発現が予測される第２の生体物質と、前記第２の生体物質に生体反応する前記第３の生体物質との結合の強さを表す結合強度から計算された、前記第３の生体物質が前記第２の生体物質のうちの前記第１の生体物質に選択的に生体反応する傾向を表す指数に基づき選択された、前記第１の生体物質の発現を検出するための前記第３の生体物質が固定されているDNAチップ。