JP2007017282A - Biological data processor, biological data processing method, learning device, learning control method, program and recording medium - Google Patents

Biological data processor, biological data processing method, learning device, learning control method, program and recording medium Download PDF

Info

Publication number
JP2007017282A
JP2007017282A JP2005199016A JP2005199016A JP2007017282A JP 2007017282 A JP2007017282 A JP 2007017282A JP 2005199016 A JP2005199016 A JP 2005199016A JP 2005199016 A JP2005199016 A JP 2005199016A JP 2007017282 A JP2007017282 A JP 2007017282A
Authority
JP
Japan
Prior art keywords
information
spot
feature amount
reliability
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005199016A
Other languages
Japanese (ja)
Inventor
Yasunori Oto
康紀 大戸
Atsumi Tsujimoto
敦美 辻本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005199016A priority Critical patent/JP2007017282A/en
Publication of JP2007017282A publication Critical patent/JP2007017282A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To learn the judgment of the adoption or non-adoption of a spot based on reliability. <P>SOLUTION: Developed profile data 744 including feature quantity data is provided to SVM 91 and the images of the respective spots of a developed profile image 741 are displayed on a display part. The indication related to whether the respective spots are set to adoption spots 742 or non-adoption spots 743 is received as the teacher data of a learning mode from a user. The non-adoption spots 743 are the spots judged not to be adopted because a large deburi or the like detracting the reliability of a measured result and the adoption spots 742 are the spots wherein deburi or the like is present and effective hybridization is produced. The SVM 91 learns the relation of the teacher data indicated by the user with the feature quantity data at every spot of the developed profile data 744 to store the learning result in a spot removing pattern database 92. This invention can be adapted to a biological data processor. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、生体情報処理装置および生体情報処理方法、学習装置および学習制御方法、プログラム並びに記録媒体に関し、特に、生体物質の生体結合の状態を、構成を複雑にすることなく、低コストで正確に測定することができるようにした生体情報処理装置および生体情報処理方法、学習装置および学習制御方法、プログラム並びに記録媒体に関する。   The present invention relates to a biological information processing apparatus, a biological information processing method, a learning apparatus, a learning control method, a program, and a recording medium. The present invention relates to a biological information processing apparatus, a biological information processing method, a learning apparatus, a learning control method, a program, and a recording medium that can be measured in a continuous manner.

近年、DNA(deoxyribonucleic acid)チップ若しくはDNAマイクロアレイ(以下、本明細書では両者を区別する必要がない場合、まとめて単にDNAチップと称する)の実用化が進んでいる。DNAチップは、多種・多数のDNAオリゴ鎖を、検出用核酸として基板表面に集積して固定したものである。DNAチップを用いて、基板表面のスポットに固定されたプローブと、細胞などから採取したサンプル中のターゲットとのハイブリダイゼーションを検出することにより、採取した細胞内における遺伝子発現を網羅的に解析することができる。   In recent years, a DNA (deoxyribonucleic acid) chip or a DNA microarray (hereinafter simply referred to as a DNA chip when it is not necessary to distinguish between them) has been put into practical use. A DNA chip is a DNA chip in which various and many DNA oligo chains are integrated and immobilized on a substrate surface as nucleic acids for detection. Comprehensive analysis of gene expression in collected cells by detecting hybridization between probes immobilized on spots on the substrate surface and targets in samples collected from cells using a DNA chip Can do.

DNAチップなどによって得られた遺伝子発現量の解析方法、補正方法などに関する先行技術文献として、例えば、特許文献1乃至特許文献3がある。
特開2002−71688号公報 特表2002−267668号公報 特開2003−28862号公報
For example, Patent Documents 1 to 3 are prior art documents related to a method for analyzing and correcting a gene expression level obtained by a DNA chip or the like.
JP 2002-71688 A JP 2002-267668 Gazette JP 2003-28862 A

従来、DNAチップにおけるターゲットのプローブに対するハイブリダイズ量を測定する場合、DNAチップのハイブリダイゼーションに伴うスポットの蛍光画像がディスプレイに表示される。ハイブリダイズ量は、スポット領域内の蛍光強度の平均値に基づいて判定される。   Conventionally, when the amount of hybridization to a target probe in a DNA chip is measured, a fluorescent image of a spot associated with hybridization of the DNA chip is displayed on the display. The amount of hybridization is determined based on the average value of the fluorescence intensity in the spot region.

ところで、DNAチップ上に異物が存在する場合などにおいては、プローブとターゲットのハイブリダイゼーションを検出するのに必要な蛍光強度を正確に測定することが困難になる。従来の方法では、例えば、DNAチップ上に異物が存在するか否かを、測定を行う人が目視で確認するようなことがなされていた。このため、DNAチップを用いた各種解析処理に時間がかかってしまうのみならず、測定を行う人による測定結果のばらつきなども発生してしまっていた。   By the way, when a foreign substance exists on the DNA chip, it becomes difficult to accurately measure the fluorescence intensity necessary to detect the hybridization between the probe and the target. In the conventional method, for example, a person performing the measurement visually confirms whether or not a foreign substance exists on the DNA chip. For this reason, various analysis processes using the DNA chip not only take time, but also the measurement results vary depending on the person performing the measurement.

本発明は、このような状況に鑑みてなされたものであり、構成を複雑にすることなく、測定を行う人による測定結果のばらつきを防止して、正確な測定ができるようにするものである。   The present invention has been made in view of such a situation, and it is possible to prevent a measurement result from being varied by a person who performs measurement and to perform accurate measurement without complicating the configuration. .

本発明の第1の側面の生体情報処理装置は、反応領域の画像情報の入力を受ける画像入力手段と、画像入力手段により入力された反応領域の画像情報の特徴量を抽出する特徴量抽出手段と、反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報を記憶する記憶手段と、記憶手段により記憶された判定基準情報を基に、特徴量抽出手段により抽出された特徴量を有する反応領域の画像情報を測定に用いた場合の信頼度の有無を判定する判定手段と、判定手段による判定結果に基づいて、反応領域における第1の生体物質と第2の生体物質との生体反応の状態を表す反応度情報を計算する計算手段とを備え、判定基準情報は、学習用の画像情報を用いて、反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、特徴量は、反応領域の画像情報の信頼度に相関を有する値である。   The biological information processing apparatus according to the first aspect of the present invention includes an image input unit that receives input of image information of a reaction region, and a feature amount extraction unit that extracts a feature amount of image information of the reaction region input by the image input unit. Storage means for storing determination criterion information that is a determination criterion for the presence or absence of reliability when the image information of the reaction area is used for measurement, and a feature amount extraction means based on the determination criterion information stored by the storage means Determining means for determining the presence or absence of reliability when the image information of the reaction region having the feature amount extracted by the measurement is used for measurement, and the first biological material and the first biological substance in the reaction region based on the determination result by the determination unit And calculating means for calculating reactivity information representing the state of biological reaction with the biological material of 2 and the criterion information is obtained by using image information for learning and image information of the reaction region for measurement. The presence or absence of reliability And to information, which is obtained by learning the correlation between the feature quantity of the image information of the reaction region, the feature quantity is a value having a correlation to the reliability of the image information of the reaction region.

判定基準情報は、SVMにより得られるものとすることができる。   The criterion information can be obtained by SVM.

特徴量抽出手段により抽出される特徴量には、反応領域に励起光を照射した場合に得られる蛍光強度が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction unit may include the fluorescence intensity obtained when the reaction region is irradiated with excitation light.

特徴量抽出手段により抽出される特徴量には、反応領域の周辺の領域に励起光を照射した場合に得られる蛍光強度が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction means may include the fluorescence intensity obtained when the region around the reaction region is irradiated with excitation light.

特徴量抽出手段により抽出される特徴量には、反応領域に含まれる、測定を行うために障害となる物質に対応する画像の面積に対応する値が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction unit may include a value corresponding to the area of the image corresponding to the substance that is an obstacle to perform the measurement included in the reaction region.

特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質の生体反応量に対応する値が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction unit may include a value corresponding to the biological reaction amount of the first biological material and the second biological material in the reaction region.

特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質との生体反応のしやすさを示す情報が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction means may include information indicating the ease of biological reaction between the first biological material and the second biological material in the reaction region.

画像入力手段により入力された学習用の画像情報を表示する表示手段と、表示手段により表示された画像情報を参照したユーザにより、教師情報として、反応領域の画像情報の信頼度の有無を示す情報の入力を受ける教師情報入力手段と、教師情報入力手段により入力された教師情報と、特徴量抽出手段により抽出された特徴量との相関を学習することにより、判定基準情報を得る学習手段とを更に備えさせるようにすることができ、記憶手段には、学習手段により得られた判定基準情報を記憶させるようにすることができる。   Information indicating whether or not the reaction area image information is reliable as teacher information by a display means for displaying the learning image information input by the image input means and a user referring to the image information displayed by the display means And a learning means for obtaining criterion information by learning the correlation between the teacher information input by the teacher information input means and the feature quantity extracted by the feature quantity extraction means. Further, the storage unit can store the determination criterion information obtained by the learning unit.

第1の生体物質と第2の生体物質は、相互に相補的な塩基配列を有する遺伝子またはそれから派生する物質であるものとすることができ、反応度情報は、第1の生体物質と第2の生体物質のハイブリダイゼーションの情報であるものとすることができる。   The first biological material and the second biological material may be genes having base sequences complementary to each other or materials derived therefrom, and the reactivity information includes the first biological material and the second biological material. Information on the hybridization of the biological material.

ハイブリダイゼーションの情報は、第1の生体物質と第2の生体物質とがハイブリダイズして得られる蛍光強度から関数に基づき一義的に決定される情報であるものとすることができる。   The information of hybridization can be information uniquely determined based on a function from the fluorescence intensity obtained by hybridizing the first biological material and the second biological material.

本発明の第1の側面の生体情報処理方法またはプログラムは、反応領域の画像情報の入力を制御する画像入力制御ステップと、画像入力制御ステップの処理により入力が制御された反応領域の画像情報の特徴量を抽出する特徴量抽出ステップと、反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報の取得を制御する取得制御ステップと、取得制御ステップの処理により取得が制御された判定基準情報を基に、特徴量抽出ステップの処理により抽出された特徴量を有する反応領域の画像情報を測定に用いた場合の信頼度の有無を判定する判定ステップと、判定ステップの処理による判定結果に基づいて、反応領域における第1の生体物質と第2の生体物質との生体反応の状態を表す反応度情報を計算する計算ステップとを含み、判定基準情報は、学習用の画像情報を用いて、反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、特徴量は、反応領域の画像情報の信頼度に相関を有する値である。   A biological information processing method or program according to a first aspect of the present invention includes an image input control step for controlling input of image information in a reaction region, and image information in a reaction region whose input is controlled by processing in the image input control step. A feature amount extraction step for extracting a feature amount, an acquisition control step for controlling the acquisition of determination criterion information that is a determination criterion for the presence or absence of reliability when the image information of the reaction region is used for measurement, and processing of the acquisition control step A determination step for determining the presence or absence of reliability when the image information of the reaction region having the feature amount extracted by the processing of the feature amount extraction step is used for the measurement based on the determination reference information whose acquisition is controlled by: Calculation for calculating reactivity information representing the state of biological reaction between the first biological material and the second biological material in the reaction region based on the determination result obtained by the determination step. The criterion information includes learning information, information indicating the presence or absence of reliability when the image information of the reaction region is used for measurement, and the feature amount of the image information of the reaction region. It is obtained by learning the correlation, and the feature amount is a value having a correlation with the reliability of the image information in the reaction region.

本発明の第1の側面においては、反応領域の画像情報の入力を受け、反応領域の画像情報の特徴量が抽出され、反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報を基に、抽出された特徴量を有する反応領域の画像情報を測定に用いた場合の信頼度の有無が判定され、判定結果に基づいて、反応領域における第1の生体物質と第2の生体物質との生体反応の状態を表す反応度情報が計算される。このとき、判定基準情報は、学習用の画像情報を用いて、反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、特徴量は、反応領域の画像情報の信頼度に相関を有する値である。   In the first aspect of the present invention, when the image information of the reaction area is input, the feature amount of the image information of the reaction area is extracted, and the presence / absence of reliability when the image information of the reaction area is used for measurement is determined. Based on the determination criterion information as a reference, the presence or absence of reliability is determined when the image information of the reaction region having the extracted feature amount is used for measurement, and the first living body in the reaction region is determined based on the determination result. Reactivity information representing the state of biological reaction between the substance and the second biological substance is calculated. At this time, the determination criterion information uses the learning image information to correlate information indicating the presence or absence of reliability when the image information of the reaction region is used for measurement and the feature amount of the image information of the reaction region. The feature amount is obtained by learning, and the feature amount is a value having a correlation with the reliability of the image information in the reaction region.

本発明の第2の側面の学習装置は、反応領域の画像情報の入力を受ける画像入力手段と、画像入力手段により入力された画像情報を表示する表示手段と、表示手段により表示された画像情報を参照したユーザにより、教師情報として、反応領域の画像情報の信頼度の有無を示す情報の入力を受ける教師情報入力手段と、反応領域ごとに、反応領域の画像情報の信頼度に相関を有する特徴量を抽出する特徴量抽出手段と、教師情報入力手段により入力された反応領域の信頼度の有無を示す情報に対する、特徴量抽出手段により抽出された特徴量の相関を学習する学習手段とを備える。   The learning device according to the second aspect of the present invention includes an image input unit that receives input of image information of a reaction region, a display unit that displays image information input by the image input unit, and image information displayed by the display unit. There is a correlation with the reliability of the image information in the reaction area for each reaction area, and the teacher information input means that receives the information indicating the presence or absence of the reliability of the image information in the reaction area by the user who referred to Feature amount extraction means for extracting feature amounts, and learning means for learning the correlation of the feature amounts extracted by the feature amount extraction means with respect to the information indicating the presence or absence of reliability of the reaction region input by the teacher information input means Prepare.

特徴量抽出手段により抽出される特徴量には、反応領域に励起光を照射した場合に得られる蛍光強度が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction unit may include the fluorescence intensity obtained when the reaction region is irradiated with excitation light.

特徴量抽出手段により抽出される特徴量には、反応領域の周辺の領域に励起光を照射した場合に得られる蛍光強度が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction means may include the fluorescence intensity obtained when the region around the reaction region is irradiated with excitation light.

特徴量抽出手段により抽出される特徴量には、反応領域に含まれる、測定を行うために障害となる物質に対応する画像の面積に対応する値が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction unit may include a value corresponding to the area of the image corresponding to the substance that is an obstacle to perform the measurement included in the reaction region.

特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質の生体反応量に対応する値が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction unit may include a value corresponding to the biological reaction amount of the first biological material and the second biological material in the reaction region.

特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質との生体反応のしやすさを示す情報が含まれるものとすることができる。   The feature amount extracted by the feature amount extraction means may include information indicating the ease of biological reaction between the first biological material and the second biological material in the reaction region.

学習手段は、SVMにより学習処理を行うものとすることができる。   The learning means can perform learning processing by SVM.

画像入力手段には、画像情報を得るために基板に照射される励起光の強度が異なる場合に得られる同一の基板における複数の画像情報を入力させるようにすることができ、特徴量抽出手段には、励起光の強度が異なる場合に得られた複数の画像情報のそれぞれの反応領域ごとに、特徴量を抽出させるようにすることができ、教師情報入力手段には、表示手段により表示された画像情報を参照したユーザにより、1つの反応領域に対して1クラスの教師情報の入力を受けさせるようにすることができ、学習手段には、教師情報入力手段により入力された1クラスの教師情報に対して、特徴量抽出手段により抽出された、励起光の強度が異なる場合に得られたそれぞれの特徴量の相関を学習させるようにすることができる。   The image input means can be input with a plurality of pieces of image information on the same substrate obtained when the intensity of the excitation light irradiated to the substrate is different in order to obtain image information. Can extract feature amounts for each reaction region of a plurality of pieces of image information obtained when the intensity of excitation light is different, and is displayed on the teacher information input means by the display means. The user who refers to the image information can receive one class of teacher information for one reaction area, and the learning means includes one class of teacher information input by the teacher information input means. On the other hand, it is possible to learn the correlation between the respective feature amounts obtained when the intensity of the excitation light extracted by the feature amount extraction means is different.

本発明の第2の側面の学習制御方法またはプログラムは、反応領域の画像情報の入力を制御する画像入力制御ステップと、画像入力制御ステップの処理により入力が制御された画像情報の表示を制御する表示制御ステップと、表示制御ステップの処理により表示が制御された画像情報を参照したユーザによる、教師情報としての、反応領域の画像情報の信頼度の有無を示す情報の入力を制御する教師情報入力制御ステップと、反応領域ごとに、反応領域の画像情報の信頼度に相関を有する特徴量を抽出する特徴量抽出ステップと、教師情報入力制御ステップの処理により入力が制御された反応領域の信頼度の有無を示す情報に対する、特徴量抽出ステップの処理により抽出された特徴量の相関を学習する学習ステップとを含む。   A learning control method or program according to a second aspect of the present invention controls an image input control step for controlling input of image information in a reaction region, and display of image information whose input is controlled by processing of the image input control step. Teacher information input for controlling the input of information indicating the presence or absence of reliability of the image information of the reaction region as the teacher information by the user who refers to the display control step and the image information whose display is controlled by the processing of the display control step The reliability of the reaction region whose input is controlled by the control step, the feature amount extraction step for extracting the feature amount correlated with the reliability of the image information of the reaction region for each reaction region, and the processing of the teacher information input control step A learning step for learning the correlation of the feature quantity extracted by the process of the feature quantity extraction step with respect to the information indicating the presence or absence.

本発明の第2の側面においては、反応領域の画像情報が入力され、画像情報が表示され、表示された画像情報を参照したユーザによる、教師情報としての、反応領域の画像情報の信頼度の有無を示す情報が入力され、反応領域ごとに、反応領域の画像情報の信頼度に相関を有する特徴量が抽出され、反応領域の信頼度の有無を示す情報に対する、抽出された特徴量の相関が学習される。   In the second aspect of the present invention, the image information of the reaction area is input, the image information is displayed, and the reliability of the image information of the reaction area as the teacher information by the user who refers to the displayed image information. Information indicating presence / absence is input, and for each reaction region, a feature amount having a correlation with the reliability of the image information in the reaction region is extracted, and the correlation of the extracted feature amount with respect to information indicating the presence / absence of the reliability of the reaction region is extracted. Is learned.

以上のように、本発明の第1の側面によれば、第1の生体物質と、前記第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定することができ、特に、学習の結果得られた判定基準情報を用いて、反応領域の画像情報の信頼度の有無を判定することができる。   As described above, according to the first aspect of the present invention, the state of the biological reaction between the first biological material and the second biological material that undergoes a biological reaction with respect to the first biological material is measured. In particular, it is possible to determine the presence / absence of reliability of the image information in the reaction region using the determination reference information obtained as a result of learning.

また、本発明の第2の側面によれば、画像情報の信頼度の有無を判定するための学習を行うことができ、特に、反応領域の画像情報の信頼度に相関を有する特徴量を用いて学習が行われるので、反応領域の信頼度の有無を示す情報に対する、抽出された特徴量の相関を学習することができる。   In addition, according to the second aspect of the present invention, it is possible to perform learning for determining the presence or absence of reliability of image information, and in particular, using a feature quantity having a correlation with the reliability of image information in a reaction region. Thus, it is possible to learn the correlation of the extracted feature quantity with respect to the information indicating the presence or absence of the reliability of the reaction region.

以下に本発明の実施の形態を説明するが、本発明の構成要件と、発明の詳細な説明に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、発明の詳細な説明に記載されていることを確認するためのものである。したがって、発明の詳細な説明中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。   Embodiments of the present invention will be described below. Correspondences between the configuration requirements of the present invention and the embodiments described in the detailed description of the present invention are exemplified as follows. This description is to confirm that the embodiments supporting the present invention are described in the detailed description of the invention. Therefore, although there are embodiments that are described in the detailed description of the invention but are not described here as embodiments corresponding to the constituent elements of the present invention, It does not mean that the embodiment does not correspond to the configuration requirements. Conversely, even if an embodiment is described here as corresponding to a configuration requirement, that means that the embodiment does not correspond to a configuration requirement other than the configuration requirement. It's not something to do.

本発明の第1の側面の生体情報処理装置(例えば、図1の生体情報処理装置1)は、基板上に設けられた反応領域に固定された第1の生体物質(例えば、プローブに用いられる生体物質)と、第1の生体物質に対して生体反応する第2の生体物質(例えば、ターゲットとして用いられる生体物質)との生体反応の状態を測定する生体情報処理装置であって、反応領域の画像情報の入力を受ける画像入力手段(例えば、図1の励起光強度推定部81)と、画像入力手段により入力された反応領域の画像情報の特徴量を抽出する特徴量抽出手段(例えば、図1の特徴量抽出部86)と、反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報(例えば、スポット信頼度判定情報)を記憶する記憶手段(例えば、図1のスポット除去パターンデータベース92)と、記憶手段により記憶された判定基準情報を基に、特徴量抽出手段により抽出された特徴量を有する反応領域の画像情報を測定に用いた場合の信頼度の有無を判定する判定手段(例えば、図1のSVM91)と、判定手段による判定結果に基づいて、反応領域における第1の生体物質と第2の生体物質との生体反応の状態を表す反応度情報を計算する計算手段(例えば、図1のハイブリダイズ量計算部85)とを備え、判定基準情報は、学習用の画像情報を用いて、反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、特徴量は、反応領域の画像情報の信頼度に相関を有する値である。   The biological information processing apparatus according to the first aspect of the present invention (for example, the biological information processing apparatus 1 in FIG. 1) is used for a first biological material (for example, a probe) fixed to a reaction region provided on a substrate. A biological information processing apparatus for measuring a biological reaction state between a biological material) and a second biological material that reacts biologically with the first biological material (for example, a biological material used as a target), Image input means (for example, the excitation light intensity estimation unit 81 in FIG. 1) that receives the input of the image information, and feature amount extraction means (for example, the feature quantity extraction means that extracts the feature amount of the image information of the reaction region input by the image input means) A feature amount extraction unit 86 in FIG. 1 and storage means (for example, spot reliability determination information) for storing determination criterion information (for example, spot reliability determination information) that is a determination criterion for the presence or absence of reliability when the image information of the reaction region is used for measurement. For example, FIG. Based on the spot removal pattern database 92) and the criterion information stored in the storage means, the presence or absence of reliability when the image information of the reaction region having the feature quantity extracted by the feature quantity extraction means is used for the measurement. Based on the determination means (for example, SVM91 in FIG. 1) for determination and the determination result by the determination means, the reactivity information representing the state of the biological reaction between the first biological material and the second biological material in the reaction region is calculated. And the presence or absence of reliability when the image information for the reaction region is used for the measurement using the learning image information. Is obtained by learning the correlation between the image information and the feature amount of the image information in the reaction region, and the feature amount is a value having a correlation with the reliability of the image information in the reaction region.

本発明の第1の側面の生体情報処理装置において、特徴量抽出手段により抽出される特徴量には、反応領域に含まれる、測定を行うために障害となる物質に対応する画像(例えば、デブリ)の面積に対応する値(例えば、スポット内領域のピクセル数)が含まれる。   In the biological information processing apparatus according to the first aspect of the present invention, the feature amount extracted by the feature amount extraction unit includes an image (for example, debris) included in the reaction region and corresponding to a substance that hinders measurement. ) (For example, the number of pixels in the spot area).

本発明の第1の側面の生体情報処理装置において、特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質の生体反応量に対応する値(例えば、ハイブリダイズ値)が含まれる。   In the biological information processing apparatus according to the first aspect of the present invention, the feature amount extracted by the feature amount extraction unit is a value corresponding to the biological reaction amount of the first biological material and the second biological material in the reaction region ( For example, a hybridization value) is included.

本発明の第1の側面の生体情報処理装置において、特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質との生体反応のしやすさを示す情報(例えば、プローブ−ターゲット結合強度行列)が含まれる。   In the biological information processing apparatus according to the first aspect of the present invention, the feature amount extracted by the feature amount extraction unit includes the ease of biological reaction between the first biological material and the second biological material in the reaction region. Information (eg, a probe-target bond strength matrix) is included.

本発明の第1の側面の生体情報処理装置は、画像入力手段により入力された学習用の画像情報を表示する表示手段(例えば、図1の表示部92)と、表示手段により表示された画像情報を参照したユーザにより、教師情報として、反応領域の画像情報の信頼度の有無を示す情報の入力を受ける教師情報入力手段(例えば、図1の入力部29B)と、教師情報入力手段により入力された教師情報と、特徴量抽出手段により抽出された特徴量との相関を学習することにより、判定基準情報を得る学習手段(例えば、図1のSVM91)とを更に備え、記憶手段は、学習手段により得られた判定基準情報を記憶する。   The biological information processing apparatus according to the first aspect of the present invention includes a display unit (for example, the display unit 92 in FIG. 1) for displaying learning image information input by the image input unit, and an image displayed by the display unit. Input by a user who has referred to the information as teacher information by teacher information input means (for example, the input unit 29B in FIG. 1) that receives information indicating the presence or absence of reliability of the image information of the reaction area, and by teacher information input means Learning means (for example, SVM 91 in FIG. 1) for obtaining determination criterion information by learning the correlation between the teacher information thus obtained and the feature quantity extracted by the feature quantity extraction means, and the storage means includes learning The criterion information obtained by the means is stored.

本発明の第1の側面の生体情報処理方法、またはプログラムは、反応領域の画像情報の入力を制御する画像入力制御ステップ(例えば、図6のステップS31の処理)と、画像入力制御ステップの処理により入力が制御された反応領域の画像情報の特徴量を抽出する特徴量抽出ステップ(例えば、図28のステップS253の処理)と、反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報(例えば、スポット信頼度判定情報)の取得を制御する取得制御ステップ(例えば、図5のステップS11の処理)と、取得制御ステップの処理により取得が制御された判定基準情報を基に、特徴量抽出ステップの処理により抽出された特徴量を有する反応領域の画像情報を測定に用いた場合の信頼度の有無を判定する判定ステップ(例えば、図28のステップS254の処理)と、判定ステップの処理による判定結果に基づいて、反応領域における第1の生体物質と第2の生体物質との生体反応の状態を表す反応度情報を計算する計算ステップ(例えば、図6のステップS39の処理)とを含み、判定基準情報は、学習用の画像情報を用いて、反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、特徴量は、反応領域の画像情報の信頼度に相関を有する値である。   The biological information processing method or program according to the first aspect of the present invention includes an image input control step (for example, step S31 in FIG. 6) for controlling input of image information in a reaction region, and an image input control step process. A feature amount extraction step (for example, the process of step S253 in FIG. 28) for extracting the feature amount of the image information of the reaction region whose input is controlled by the input, and the presence or absence of reliability when the image information of the reaction region is used for the measurement The acquisition control step (for example, the process of step S11 in FIG. 5) for controlling the acquisition of the determination reference information (for example, the spot reliability determination information) serving as the determination reference, and the determination in which the acquisition is controlled by the process of the acquisition control step Based on the reference information, it is determined whether or not there is reliability when the image information of the reaction region having the feature amount extracted by the feature amount extraction step is used for the measurement. The degree of reactivity representing the state of the biological reaction between the first biological material and the second biological material in the reaction region based on the determination step (for example, the processing of step S254 in FIG. 28) and the determination result of the determination step. A calculation step for calculating information (for example, the process of step S39 in FIG. 6), and the criterion information uses the image information for learning, and the reliability of the image information of the reaction region when used for the measurement. It is obtained by learning the correlation between the information indicating presence / absence and the feature amount of the image information in the reaction region, and the feature amount is a value having a correlation with the reliability of the image information in the reaction region.

本発明の第2の側面の学習装置(例えば、図1の生体情報処理装置1)は、基板上に設けられた反応領域に固定された第1の生体物質と、第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定するために、反応領域の信頼度の有無の判定に必要な学習処理を実行する学習装置であって、反応領域の画像情報の入力を受ける画像入力手段(例えば、図1の励起光強度推定部81)と、画像入力手段により入力された画像情報を表示する表示手段(例えば、図1の表示部92)と、表示手段により表示された画像情報を参照したユーザにより、教師情報として、反応領域の画像情報の信頼度の有無を示す情報の入力を受ける教師情報入力手段(例えば、図1の入力部29B)と、反応領域ごとに、反応領域の画像情報の信頼度に相関を有する特徴量を抽出する特徴量抽出手段(例えば、図1の特徴量抽出部86)と、教師情報入力手段により入力された反応領域の信頼度の有無を示す情報に対する、特徴量抽出手段により抽出された特徴量の相関を学習する学習手段(例えば、図1のSVM91)とを備える。   The learning apparatus according to the second aspect of the present invention (for example, the biological information processing apparatus 1 in FIG. 1) is provided for a first biological substance fixed to a reaction region provided on a substrate, and the first biological substance. In order to measure the state of the biological reaction with the second biological substance that reacts biologically, the learning device executes a learning process necessary for determining the presence or absence of the reliability of the reaction region. An image input unit that receives an input (for example, the excitation light intensity estimating unit 81 in FIG. 1), a display unit that displays image information input by the image input unit (for example, the display unit 92 in FIG. 1), and a display unit A teacher information input means (for example, the input unit 29B in FIG. 1) for receiving, as teacher information, information indicating the presence or absence of reliability of the image information in the reaction area by a user who refers to the displayed image information; For each of the reaction area image information Features for feature quantity extraction means (for example, feature quantity extraction unit 86 in FIG. 1) for extracting feature quantities having a correlation with reliability, and information indicating presence / absence of reliability of reaction regions input by a teacher information input means Learning means (for example, SVM 91 in FIG. 1) for learning the correlation between the feature values extracted by the quantity extraction means.

本発明の第2の側面の学習装置において、特徴量抽出手段により抽出される特徴量には、反応領域に含まれる、測定を行うために障害となる物質に対応する画像(例えば、デブリ)の面積に対応する値(例えば、スポット内領域のピクセル数)が含まれる。   In the learning device according to the second aspect of the present invention, the feature amount extracted by the feature amount extraction unit includes an image (for example, debris) included in the reaction region and corresponding to a substance that becomes an obstacle to perform measurement. A value corresponding to the area (for example, the number of pixels in the spot area) is included.

本発明の第2の側面の学習装置において、特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質の生体反応量に対応する値(例えば、ハイブリダイズ値)が含まれる。   In the learning device according to the second aspect of the present invention, the feature amount extracted by the feature amount extraction means is a value corresponding to the biological reaction amount of the first biological material and the second biological material in the reaction region (for example, Hybridization value).

本発明の第2の側面の学習装置において、特徴量抽出手段により抽出される特徴量には、反応領域における第1の生体物質と第2の生体物質との生体反応のしやすさを示す情報(例えば、プローブ−ターゲット結合強度行列)が含まれる。   In the learning device according to the second aspect of the present invention, the feature amount extracted by the feature amount extraction unit includes information indicating the ease of biological reaction between the first biological material and the second biological material in the reaction region. (Eg, a probe-target binding strength matrix).

本発明の第2の側面の学習制御方法、またはプログラムは、反応領域の画像情報の入力を制御する画像入力制御ステップ(例えば、図38のステップS351の処理)と、画像入力制御ステップの処理により入力が制御された画像情報の表示を制御する表示制御ステップ(例えば、図38のステップS353の処理)と、表示制御ステップの処理により表示が制御された画像情報を参照したユーザによる、教師情報としての、反応領域の画像情報の信頼度の有無を示す情報の入力を制御する教師情報入力制御ステップ(例えば、図38のステップS353の処理)と、反応領域ごとに、反応領域の画像情報の信頼度に相関を有する特徴量を抽出する特徴量抽出ステップ(例えば、図38のステップS352の処理)と、教師情報入力制御ステップの処理により入力が制御された反応領域の信頼度の有無を示す情報に対する、特徴量抽出ステップの処理により抽出された特徴量の相関を学習する学習ステップ(例えば、図38のステップS355の処理)とを含む。   The learning control method or program according to the second aspect of the present invention includes an image input control step (for example, the processing in step S351 in FIG. 38) for controlling the input of image information in the reaction region, and the image input control step. As teacher information by a user who refers to the display control step (for example, the process of step S353 in FIG. 38) for controlling the display of the image information whose input is controlled and the image information whose display is controlled by the process of the display control step. A teacher information input control step (for example, the process of step S353 in FIG. 38) for controlling the input of information indicating the presence / absence of reliability of the image information in the reaction region, and the reliability of the image information in the reaction region for each reaction region. A feature amount extraction step (for example, the process of step S352 in FIG. 38) for extracting feature amounts having a correlation with each other, and a teacher information input control step. A learning step (for example, the process of step S355 in FIG. 38) learns the correlation of the feature amount extracted by the feature amount extraction step with respect to the information indicating the presence or absence of the reliability of the reaction region whose input is controlled by the step processing. ).

以下に本明細書において使用する用語の意味を説明する。   The meanings of terms used in the present specification will be described below.

プローブとは、DNAチップなどのバイオアッセイ用の基板に固定された生体物質であって、ターゲットと生体反応するものをいう。   The probe refers to a biological substance fixed on a bioassay substrate such as a DNA chip, which reacts with a target.

ターゲットとは、DNAチップなどのバイオアッセイ用の基板に固定された生体物質に生体反応する生体物質をいう。   The target refers to a biological material that bioreacts with a biological material fixed on a bioassay substrate such as a DNA chip.

生体物質とは、蛋白質、核酸、糖などの生体内において生成される物質の他、相互に相補的な塩基配列を有する遺伝子またはそれから派生する物質を含む。   Biological substances include genes generated in vivo such as proteins, nucleic acids, and sugars, as well as genes having mutually complementary base sequences or substances derived therefrom.

生体反応とは、2以上の生体物質が生化学的に反応することをいう。その代表例は、ハイブリダイゼーションである。   Biological reaction means that two or more biological substances react biochemically. A typical example is hybridization.

ハイブリダイゼーションとは、相補的な塩基配列構造を備える核酸間の相補鎖(二本鎖)形成反応をいう。   Hybridization refers to a complementary strand (double strand) forming reaction between nucleic acids having a complementary base sequence structure.

以下、図を参照して、本発明の実施の形態について説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の実施形態の生体情報処理装置の構成例を表している。この生体情報処理装置1は、DNAチップ11、ピックアップ部21、蛍光強度取得部22、励起光強度計算部23、ハイブリダイズ量推定部24、発現量計算部25、標準化部26、出力部27、発現プロファイルデータ記憶部28、表示部29Aおよび入力部29Bを有するユーザインターフェース(UI)部29、蛍光強度−ハイブリダイズ量変換式記憶部30、並びに機械的学習部31により構成されている。   FIG. 1 illustrates a configuration example of a biological information processing apparatus according to an embodiment of the present invention. The biological information processing apparatus 1 includes a DNA chip 11, a pickup unit 21, a fluorescence intensity acquisition unit 22, an excitation light intensity calculation unit 23, a hybridization amount estimation unit 24, an expression amount calculation unit 25, a standardization unit 26, an output unit 27, It comprises an expression profile data storage unit 28, a user interface (UI) unit 29 having a display unit 29A and an input unit 29B, a fluorescence intensity-hybridization amount conversion type storage unit 30, and a mechanical learning unit 31.

この生体情報処理装置1は、学習モードと判定モードとの2つのモードを有する。学習モードとは、機械的学習部31に、スポットごとの信頼度の判定を自動的に行わせるための学習を行わせるためのモードである。また、判定モードとは、必要に応じて、機械的学習部31による学習に基づいて、スポットごとの信頼度の判定を自動的に行わせることにより、人が目視でスポットごとの信頼度の判定を行う場合と比較して、DNAチップ11を用いた各種解析処理を、測定結果のばらつきの発生を防止して、正確に、短い時間で行うことができるようにするものである。   The biological information processing apparatus 1 has two modes, a learning mode and a determination mode. The learning mode is a mode for causing the mechanical learning unit 31 to perform learning for automatically determining reliability for each spot. In addition, the determination mode is to automatically determine the reliability for each spot based on the learning by the mechanical learning unit 31 as necessary, so that the person can visually determine the reliability for each spot. Compared with the case of performing the above, various analysis processes using the DNA chip 11 can be performed accurately and in a short time by preventing the occurrence of variations in measurement results.

なお、この生体情報処理装置1の学習モードによって得られる学習結果は、他の生体情報処理装置の判定モードに利用されても良い。また、生体情報処理装置1は、他の生体情報処理装置の学習モードによって得られる学習結果を用いて判定モードの処理を行うことが可能である。   Note that the learning result obtained by the learning mode of the biological information processing apparatus 1 may be used in the determination mode of another biological information processing apparatus. In addition, the biological information processing apparatus 1 can perform determination mode processing using a learning result obtained by a learning mode of another biological information processing apparatus.

DNAチップ11は、スポット12とガイド13を有している。図2は、DNAチップ11のより詳細な構成例を表している。   The DNA chip 11 has a spot 12 and a guide 13. FIG. 2 shows a more detailed configuration example of the DNA chip 11.

DNAチップ11は、その基板11A上に、発現解析用反応槽101と細胞数計数用反応槽102を有している。基板11Aの図中下側の端部には、直線状の開始位置ガイド13Aが設けられ、図中上側の端部には、終了位置ガイド13Bが設けられている。図1のガイド13は、具体的には、この開始位置ガイド13Aと終了位置ガイド13Bにより構成される。   The DNA chip 11 has an expression analysis reaction tank 101 and a cell number counting reaction tank 102 on its substrate 11A. A linear start position guide 13A is provided at the lower end of the substrate 11A in the figure, and an end position guide 13B is provided at the upper end in the figure. Specifically, the guide 13 shown in FIG. 1 includes a start position guide 13A and an end position guide 13B.

発現解析用反応槽101と細胞数計数用反応槽102は、この開始位置ガイド13Aと終了位置ガイド13Bの間に配置されている。   The expression analysis reaction tank 101 and the cell number counting reaction tank 102 are arranged between the start position guide 13A and the end position guide 13B.

発現解析用反応槽101には、反応領域としての複数のスポット12が形成されており、各スポット12には、生体物質(第1の生体物質)としてのハイブリダイズ検証用プローブ111、発現解析用プローブ112、並びに発現標準化用コントロールプローブ113が固定されている。発現解析用反応槽101にサンプルが滴下された場合、ハイブリダイズ検証用プローブ111には、その塩基と相補的構成を有する塩基を有する生体物質(第2の生体物質)としてのターゲット111Aがハイブリダイズする。同様に、発現解析用プローブ112には、その塩基と相補的構成を有する塩基を有する生体物質(第2の生体物質)としてのターゲット112Aがハイブリダイズする。また、発現標準化用コントロールプローブ113には、その塩基と相補的構成の塩基を有する生体物質(第2の生体物質)としてのターゲット113Aがハイブリダイズする。   In the expression analysis reaction tank 101, a plurality of spots 12 as reaction regions are formed, and in each spot 12, a hybridization verification probe 111 as a biological material (first biological material), an expression analysis A probe 112 and an expression standardization control probe 113 are fixed. When a sample is dropped into the expression analysis reaction tank 101, a target 111A as a biological material (second biological material) having a base having a complementary structure to the base is hybridized to the hybridization verification probe 111. To do. Similarly, the target 112A as a biological material (second biological material) having a base having a complementary structure to the base is hybridized to the expression analysis probe 112. In addition, the expression standardization control probe 113 is hybridized with a target 113A as a biological material (second biological material) having a base complementary to the base.

DNAチップ11においては、その作成時に、合成した所定のターゲットを所定の量ずつ滴下して、所定の強度の励起光を照射して蛍光強度を取得することにより、複数のプローブの量と、これに結合する複数のターゲットのそれぞれの量との関係を示すプローブ−ターゲット結合強度行列が取得される。プローブ−ターゲット結合強度行列は、すなわち、プローブとターゲットとのハイブリダイズのしやすさを示すものであり、DNAチップ11のそれぞれにおいて固有に求められる値である。   When the DNA chip 11 is produced, a predetermined amount of a synthesized target is dropped by a predetermined amount and irradiated with excitation light having a predetermined intensity to obtain the fluorescence intensity. A probe-target bond strength matrix is obtained that indicates a relationship with the amount of each of the plurality of targets that bind to the target. The probe-target binding strength matrix indicates the ease of hybridization between the probe and the target, and is a value that is uniquely obtained for each DNA chip 11.

細胞数計数用反応槽102においては、生体物質(第1の生体物質)としてのハイブリダイズ検証用プローブ114と細胞数計数用コントロールプローブ115が、それぞれ反応領域としてのスポット12に取り付けられている。細胞数計数用反応槽102にサンプルが滴下された場合、ハイブリダイズ検証用プローブ114には、その塩基と相補的構成の塩基を有する生体物質(第2の生体物質)としてのターゲット114Aがハイブリダイズし、細胞数計数用コントロールプローブ115には、その塩基と相補的構成の塩基を有する生体物質(第2の生体物質)としてのターゲット115Aがハイブリダイズする。   In the cell number counting reaction tank 102, a hybridization verification probe 114 as a biological material (first biological material) and a cell number counting control probe 115 are respectively attached to a spot 12 as a reaction region. When a sample is dropped into the cell number counting reaction tank 102, a target 114A as a biological material (second biological material) having a base complementary to the base is hybridized to the hybridization verification probe 114. The target 115A as a biological material (second biological material) having a base complementary to the base hybridizes with the control probe 115 for counting the number of cells.

ハイブリダイズした(生体反応した)生体物質としてのプローブとターゲットには、インターカレータ116が結合される。インターカレータ116は励起光が照射されると蛍光を発生する。   An intercalator 116 is coupled to the probe and target as the hybridized (bioreacted) biological material. The intercalator 116 generates fluorescence when irradiated with excitation light.

図2には、このように、各プローブに対してターゲットがハイブリダイズした状態が示されている。なお、図2には便宜上、1つのスポット12に1つのプローブのみが示されているが、実際には1つのスポット12に対して同一種類の複数のプローブが固定されている。また、各反応槽には同一種類のプローブが固定された任意の数のスポットが、予め定められた所定の位置に配置されている。   FIG. 2 shows a state in which the target is hybridized to each probe as described above. In FIG. 2, for convenience, only one probe is shown for one spot 12, but actually, a plurality of probes of the same type are fixed to one spot 12. Further, in each reaction tank, an arbitrary number of spots to which the same type of probe is fixed are arranged at predetermined positions.

図1のピックアップ部21は、蛍光強度取得用ピックアップ41、ガイド信号取得用ピックアップ42、コントロール部43、対物座標計算部44、および畳み込み展開部45で構成されている。ピックアップ部21は、学習モードおよび判定モードのいずれにおいても、同様の処理を行う。   The pickup unit 21 shown in FIG. 1 includes a fluorescence intensity acquisition pickup 41, a guide signal acquisition pickup 42, a control unit 43, an objective coordinate calculation unit 44, and a convolution expansion unit 45. The pickup unit 21 performs the same processing in both the learning mode and the determination mode.

蛍光強度取得用ピックアップ41は、図2のDNAチップ11の発現解析用反応槽101と細胞数計数用反応槽102の画像を取得するピックアップである。これに対して、ガイド信号取得用ピックアップ42は、開始位置ガイド13Aと終了位置ガイド13Bを読み取るためのピックアップである。   The fluorescence intensity acquisition pickup 41 is a pickup that acquires images of the expression analysis reaction tank 101 and the cell number counting reaction tank 102 of the DNA chip 11 of FIG. On the other hand, the guide signal acquisition pickup 42 is a pickup for reading the start position guide 13A and the end position guide 13B.

蛍光強度取得用ピックアップ41は、対物レンズ51、プリズム52、半導体レーザ53、およびフォトダイオード54を有している。半導体レーザ53より出射されたレーザ光(励起光)は、プリズム52を介して対物レンズ51に入射され、対物レンズ51は、入射されたレーザ光を基板11A(スポット12)上に照射する。対物レンズ51はまた、スポット12からの光を、プリズム52を介してフォトダイオード54に入射する。各スポット12には、複数のプローブが固定されており、プローブとターゲットがハイブリダイゼーションした場合、さらに両者にはインターカレータ116が結合される。すなわち、プローブとターゲットがハイブリダイゼーションしていない場合には、両者の間にインターカレータ116は存在せず、ハイブリダイゼーションした場合においてのみ、両者の間にインターカレータ116が存在する。インターカレータ116は、励起光が照射されると蛍光を発生する。対物レンズ51により集光された蛍光はプリズム52により励起光と分離されて、フォトダイオード54に入射される。   The fluorescence intensity acquisition pickup 41 includes an objective lens 51, a prism 52, a semiconductor laser 53, and a photodiode 54. Laser light (excitation light) emitted from the semiconductor laser 53 is incident on the objective lens 51 via the prism 52, and the objective lens 51 irradiates the incident laser light on the substrate 11A (spot 12). The objective lens 51 also makes light from the spot 12 incident on the photodiode 54 via the prism 52. A plurality of probes are fixed to each spot 12, and when the probe and the target are hybridized, an intercalator 116 is further coupled to both. That is, when the probe and the target are not hybridized, there is no intercalator 116 between them, and only when they are hybridized, there is an intercalator 116 between them. The intercalator 116 generates fluorescence when irradiated with excitation light. The fluorescence condensed by the objective lens 51 is separated from the excitation light by the prism 52 and is incident on the photodiode 54.

ハイブリダイゼーションしている量が多ければ、それだけインターカレータ116の量も多く、したがって、そこから発生する蛍光量も多い。したがって、蛍光の強度に基づいて、ハイブリダイゼーションの状態を測定する(ハイブリダイゼーションの情報を得る)ことが可能となる。   The greater the amount of hybridization, the greater the amount of intercalator 116, and hence the greater the amount of fluorescence generated therefrom. Therefore, it is possible to measure the state of hybridization (obtain information on hybridization) based on the intensity of fluorescence.

コントロール部43は、半導体レーザ53の電流制御を行い、その励起光の強度を調整する。また、コントロール部43は、フォトダイオード54の出力(電流量変化)を読み取る。   The control unit 43 controls the current of the semiconductor laser 53 and adjusts the intensity of the excitation light. Further, the control unit 43 reads the output (current amount change) of the photodiode 54.

畳み込み展開部45は、フォトダイオード54より出力された電流量変化に基づく信号をコントロール部43から受け取り、ピクセル単位の画像データを生成する。   The convolution developing unit 45 receives a signal based on the change in the amount of current output from the photodiode 54 from the control unit 43, and generates image data in units of pixels.

ガイド信号取得用ピックアップ42は、対物レンズ61、プリズム62、半導体レーザ63、およびフォトダイオード64により構成されている。半導体レーザ63は、コントロール部43からの制御に基づいて、レーザ光を発生する(このレーザ光は、ガイド検出光として機能する)。プリズム62は、半導体レーザ63からのレーザ光を対物レンズ61に入射し、対物レンズ61はこのレーザ光を基板11Aに照射する。対物レンズ61は、基板11Aからの反射光を受光し、プリズム62はこの反射光を照射光から分離してフォトダイオード64に出射する。フォトダイオード64は、プリズム62より入射された反射光を光電変換し、ガイド信号としてコントロール部43に出力する。コントロール部43は、フォトダイオード64より入力されたガイド信号を対物座標計算部44に出力する。ガイド13(開始位置ガイド13Aと終了位置ガイド13B)は、基板11Aの他の領域に較べて反射率が高く(または低く)なるように形成されている。対物座標計算部44は、コントロール部43を介して、ガイド信号取得用ピックアップ42より供給されたガイド信号のレベルに基づいて、開始位置ガイド13Aと終了位置ガイド13Bの位置、並びに開始位置ガイド13Aから終了位置ガイド13Bに向けて等速度で移動されるガイド信号取得用ピックアップ42の位置(座標)を計算する。   The guide signal acquisition pickup 42 includes an objective lens 61, a prism 62, a semiconductor laser 63, and a photodiode 64. The semiconductor laser 63 generates laser light based on control from the control unit 43 (this laser light functions as guide detection light). The prism 62 makes the laser beam from the semiconductor laser 63 incident on the objective lens 61, and the objective lens 61 irradiates the substrate 11A with this laser beam. The objective lens 61 receives the reflected light from the substrate 11A, and the prism 62 separates the reflected light from the irradiated light and emits it to the photodiode 64. The photodiode 64 photoelectrically converts the reflected light incident from the prism 62 and outputs it as a guide signal to the control unit 43. The control unit 43 outputs the guide signal input from the photodiode 64 to the objective coordinate calculation unit 44. The guides 13 (the start position guide 13A and the end position guide 13B) are formed so that the reflectance is higher (or lower) than the other areas of the substrate 11A. The objective coordinate calculation unit 44 determines the positions of the start position guide 13A and the end position guide 13B and the start position guide 13A based on the level of the guide signal supplied from the guide signal acquisition pickup 42 via the control unit 43. The position (coordinates) of the guide signal acquisition pickup 42 moved at a constant speed toward the end position guide 13B is calculated.

コントロール部43は、対物座標計算部44により計算されたガイド信号取得用ピックアップ42の位置に基づいて、蛍光強度取得用ピックアップ41(対物レンズ51)の位置を制御する。ガイド信号取得用ピックアップ42と蛍光強度取得用ピックアップ41は、相互に所定の位置関係に固定されており、蛍光強度取得用ピックアップ41を図2における開始位置ガイド13Aと終了位置ガイド13Bの間における所定の位置に配置することは、とりもなおさずガイド信号取得用ピックアップ42を開始位置ガイド13Aと終了位置ガイド13Bの間の所定の位置に配置することになる。   The control unit 43 controls the position of the fluorescence intensity acquisition pickup 41 (objective lens 51) based on the position of the guide signal acquisition pickup 42 calculated by the objective coordinate calculation unit 44. The guide signal acquisition pickup 42 and the fluorescence intensity acquisition pickup 41 are fixed to each other in a predetermined positional relationship, and the fluorescence intensity acquisition pickup 41 is arranged between the start position guide 13A and the end position guide 13B in FIG. The guide signal acquisition pickup 42 is disposed at a predetermined position between the start position guide 13A and the end position guide 13B.

蛍光強度取得部22は、蛍光強度取得用ピックアップ41のフォトダイオード54が出力した各スポット12(その座標(x,y))からの蛍光強度(pfx,y)の入力を受け、この蛍光強度に関する蛍光強度データをハイブリダイズ量推定部24の励起光強度推定部81に出力する。蛍光強度取得部22からハイブリダイズ量推定部24の励起光強度推定部81に供給される蛍光強度データには、座標(x,y)からの蛍光強度(pfx,y)を示す蛍光画像(または、発現量を求めるために用いられる発現プロファイル画像とも称される)が含まれている。蛍光強度取得部22からハイブリダイズ量推定部24の励起光強度推定部81に供給される蛍光強度データの詳細に関しては、図7を用いて後述する。 The fluorescence intensity acquisition unit 22 receives the input of the fluorescence intensity (pf x, y ) from each spot 12 (its coordinates (x, y)) output from the photodiode 54 of the fluorescence intensity acquisition pickup 41, and receives this fluorescence intensity. Is output to the excitation light intensity estimation unit 81 of the hybridization amount estimation unit 24. The fluorescence intensity data supplied from the fluorescence intensity acquisition unit 22 to the excitation light intensity estimation unit 81 of the hybridization amount estimation unit 24 includes a fluorescence image (fluorescence image (pf x, y ) from the coordinates (x, y)). Alternatively, it is also referred to as an expression profile image used for obtaining the expression level). Details of the fluorescence intensity data supplied from the fluorescence intensity acquisition unit 22 to the excitation light intensity estimation unit 81 of the hybridization amount estimation unit 24 will be described later with reference to FIG.

蛍光強度取得部22はまた、蛍光強度取得用ピックアップ41の対物レンズ51の基板11A上の対物座標(x,y)、対物面積半径(r)、並びに励起光強度を制御する制御信号をコントロール部43に出力する。コントロール部43は、この制御信号に基づいて対物レンズ51を制御する。これにより、対物レンズ51が基板11A上の所定の座標(x,y)に配置され、対物レンズ51より出射されるレーザ光の照射範囲の半径(対物面積半径)(r)が所定の値に制御され、そのレーザ光の強度(励起光強度)が所定の値に調整される。   The fluorescence intensity acquisition unit 22 also receives control signals for controlling the objective coordinates (x, y), the objective area radius (r), and the excitation light intensity of the objective lens 51 of the fluorescence intensity acquisition pickup 41 on the substrate 11A. Output to 43. The control unit 43 controls the objective lens 51 based on this control signal. Thereby, the objective lens 51 is arranged at predetermined coordinates (x, y) on the substrate 11A, and the radius (objective area radius) (r) of the irradiation range of the laser light emitted from the objective lens 51 becomes a predetermined value. The laser light intensity (excitation light intensity) is adjusted to a predetermined value.

蛍光強度取得部22は、コントロール部43から供給された蛍光強度を、励起光強度計算部23に出力する。励起光強度計算部23は、蛍光強度−ハイブリダイズ量変換式記憶部30に記憶されている変換式に基づいて、プリスキャン時に蛍光強度取得部22から入力された蛍光強度に基づいて、最適な励起光強度を計算し、その計算して得られた励起光強度を蛍光強度取得部22に出力する。本スキャン時、蛍光強度取得部22は、この励起光強度計算部23からの励起光強度に基づいて半導体レーザ53の電流を制御し、所定の強さの励起光を半導体レーザ53より出射させる。   The fluorescence intensity acquisition unit 22 outputs the fluorescence intensity supplied from the control unit 43 to the excitation light intensity calculation unit 23. Based on the conversion formula stored in the fluorescence intensity-hybridization amount conversion formula storage unit 30, the excitation light intensity calculation unit 23 is optimized based on the fluorescence intensity input from the fluorescence intensity acquisition unit 22 during the prescan. The excitation light intensity is calculated, and the excitation light intensity obtained by the calculation is output to the fluorescence intensity acquisition unit 22. During the main scan, the fluorescence intensity acquisition unit 22 controls the current of the semiconductor laser 53 based on the excitation light intensity from the excitation light intensity calculation unit 23, and causes the semiconductor laser 53 to emit excitation light having a predetermined intensity.

ハイブリダイズ量推定部24は、励起光強度推定部81、作成部82、画像処理部83、検証部84、ハイブリダイズ量計算部85、および、特徴量抽出部86により構成されている。ハイブリダイズ量推定部24は、学習モードと判定モードとにおいて、一部、異なる処理を実行する。   The hybridization amount estimation unit 24 includes an excitation light intensity estimation unit 81, a creation unit 82, an image processing unit 83, a verification unit 84, a hybridization amount calculation unit 85, and a feature amount extraction unit 86. The hybridizing amount estimation unit 24 executes partially different processes in the learning mode and the determination mode.

励起光強度推定部81は、学習モードと判定モードとのいずれにおいても、反応領域の画像情報、具体的には、蛍光強度取得部22より供給された蛍光強度に基づく画像データ、または発現プロファイルデータ記憶部28に予め記憶されている発現プロファイルデータなどの画像情報の入力を受け、必要に応じて(例えば、他の装置により得られた発現プロファイルデータの励起光強度が不明である場合)、後述する蛍光強度−ハイブリダイズ量変換式記憶部30に記憶されている蛍光強度−ハイブリダイズ量変換式を用いて、励起光強度を推定する処理を行う。   The excitation light intensity estimation unit 81 is the image information of the reaction region, specifically, the image data based on the fluorescence intensity supplied from the fluorescence intensity acquisition unit 22 or the expression profile data in both the learning mode and the determination mode. Upon receiving input of image information such as expression profile data stored in advance in the storage unit 28, and as necessary (for example, when the excitation light intensity of the expression profile data obtained by another device is unknown), it will be described later Using the fluorescence intensity-hybridization amount conversion formula stored in the fluorescence intensity-hybridization amount conversion storage unit 30, a process for estimating the excitation light intensity is performed.

なお、発現プロファイルデータ記憶部28には、ハイブリダイズ量推定部24によりハイブリダイズ量が推定され、後述する発現量計算部25により発現量が計算されて、標準化部26により標準化されて、出力部27により出力される発現プロファイルデータ以外にも、異なる装置において撮像された蛍光画像と、その蛍光画像に関する情報により構成される発現プロファイルデータを記憶することができる。   In the expression profile data storage unit 28, the hybridization amount is estimated by the hybridization amount estimation unit 24, the expression amount is calculated by the expression amount calculation unit 25 described later, standardized by the standardization unit 26, and output. In addition to the expression profile data output by 27, it is possible to store expression profile data composed of fluorescence images captured by different devices and information relating to the fluorescence images.

作成部82は、学習モードと判定モードとのいずれにおいても、必要に応じて(例えば、複数の励起光強度において蛍光画像が取得されていた場合)、蛍光強度からハイブリダイズ量を一義的に決定する式hybridize(pf)を作成する処理を実行する。   In both the learning mode and the determination mode, the creation unit 82 uniquely determines the amount of hybridization from the fluorescence intensity as necessary (for example, when fluorescence images are acquired at a plurality of excitation light intensities). Execute the process to create the expression hybridize (pf).

画像処理部83は、学習モードにおいて、作成部82より入力された画像データに所定の処理を施し、特徴量の抽出に必要な各種の画像処理を実行する。また、画像処理部83は、判定モードにおいて、作成部82より入力された画像データに、画像の表示、ハイブリダイズ量の推定、または、特徴量の抽出に必要な所定の処理を施す。   In the learning mode, the image processing unit 83 performs predetermined processing on the image data input from the creation unit 82 and executes various types of image processing necessary for feature amount extraction. Further, in the determination mode, the image processing unit 83 performs predetermined processing necessary for displaying an image, estimating a hybridizing amount, or extracting a feature amount, on the image data input from the creating unit 82.

画像処理部83は、図11を参照して後述するように、DNAチップ11の画像からデブリ(測定を行う上において障害となる物質)の成分を除去し、各スポット12毎の画像へ分解する処理を行う。また、画像処理部83は、ユーザインターフェース部29を介して、ユーザより指示される入力に基づいて、デブリ成分を除去する処理を行うことも可能である。   As will be described later with reference to FIG. 11, the image processing unit 83 removes debris (a substance that hinders measurement) from the image of the DNA chip 11, and decomposes it into an image for each spot 12. Process. Further, the image processing unit 83 can perform a process of removing the debris component based on an input instructed by the user via the user interface unit 29.

ユーザインターフェース部29は、画像処理部83より入力された画像を表示部29Aに表示する。また、ユーザインターフェース部29には、ユーザの操作入力を受ける入力部29Bも備えられ、学習モードおよび判定モードにおいて、用いられているDNAチップ11に対応するプローブ−ターゲット結合強度行列の入力を受け、特徴量抽出部86に供給する。プローブ−ターゲット結合強度行列は、DNAチップ11の各スポットに備えられたプローブと、滴下されるターゲットとのハイブリダイズのしやすさを示す情報である。   The user interface unit 29 displays the image input from the image processing unit 83 on the display unit 29A. In addition, the user interface unit 29 is also provided with an input unit 29B that receives a user operation input. In the learning mode and the determination mode, the user interface unit 29 receives an input of a probe-target binding strength matrix corresponding to the DNA chip 11 being used, This is supplied to the feature quantity extraction unit 86. The probe-target bond strength matrix is information indicating the ease of hybridization between the probe provided in each spot of the DNA chip 11 and the dropped target.

また、入力部29Bは、学習モードにおいて、表示部29Aに表示された発現プロファイル画像を参照したユーザから、例えば、大きなデブリが存在していたり、蛍光強度が極端に低いまたは高い場合など、そのスポットの蛍光強度から求められたハイブリダイズ量の信頼度が低いと思われるスポット、すなわち、信頼度の低いスポットと、信頼度の高いスポットを区別する情報の入力を受け、学習処理の教師データとしてSVM91に供給する。   In addition, the input unit 29B receives the spot from the user who refers to the expression profile image displayed on the display unit 29A in the learning mode, for example, when large debris is present or the fluorescence intensity is extremely low or high. SVM91 is input as information for distinguishing a spot that is considered to have a low reliability of the hybridization amount obtained from the fluorescence intensity of the light, that is, a spot having a low reliability and a spot having a high reliability, and is used as teacher data for learning processing. To supply.

また、入力部29Bは、学習モードおよび判定モードのいずれにおいても、表示部29Aに表示された発現プロファイル画像を参照したユーザから、デブリの除去を指令する操作入力を受け、画像処理部83に供給することも可能である。   The input unit 29B receives an operation input instructing removal of debris from a user who refers to the expression profile image displayed on the display unit 29A in both the learning mode and the determination mode, and supplies the operation input to the image processing unit 83. It is also possible to do.

検証部84は、学習モードと判定モードとのいずれにおいても、画像処理部83より入力された画像データのうち、ハイブリダイズ検証用プローブ111,114のスポット12におけるハイブリダイズ量に基づいて、ハイブリダイズが正しく行われていることを検証する。   In both the learning mode and the determination mode, the verification unit 84 performs hybridization based on the amount of hybridization in the spot 12 of the hybridization verification probes 111 and 114 in the image data input from the image processing unit 83. Verify that is done correctly.

ハイブリダイズ量計算部85は、学習モードにおいて、スポット内領域を分解してスポット単位でのハイブリダイズ値と信頼度の計算を行って、学習処理に用いられる特徴量として、例えば、スポット領域の蛍光強度、スポット周辺領域の蛍光強度、スポット内領域に含まれるピクセル数、ハイブリダイズ値、および、スポット信頼度などを取得する。また、ハイブリダイズ量計算部85は、判定モードにおいて、図22を参照して後述するように、スポット内領域を分割し、必要に応じて、スポット内領域を選択し、スポット内領域単位でハイブリダイズ値と信頼度の計算を行い、スポット単位でのハイブリダイズ値と信頼度を出力する。ハイブリダイズ量計算部85は、スポットの信頼度の判定を行う場合、必要に応じて、機械的学習部31によるスポットごとの信頼度の有無の判定結果を利用する。   In the learning mode, the hybridization amount calculation unit 85 decomposes the in-spot region and calculates the hybridization value and the reliability in units of spots. As the feature amount used in the learning process, for example, the fluorescence of the spot region is calculated. The intensity, the fluorescence intensity of the area around the spot, the number of pixels included in the area within the spot, the hybridization value, the spot reliability, and the like are acquired. Further, in the determination mode, the hybridization amount calculation unit 85 divides a spot area, selects a spot area as necessary, and hybridizes in units of spots as described later with reference to FIG. The soybean value and reliability are calculated, and the hybridization value and reliability in spot units are output. When determining the reliability of the spot, the hybridization amount calculation unit 85 uses the determination result of the reliability of each spot by the mechanical learning unit 31 as necessary.

特徴量抽出部86は、学習モードにおいて、表示部29Aに表示された発現プロファイル画像のそれぞれのスポットにおける特徴量データを取得し、学習処理のためにSVM91に供給する。また、特徴量抽出部86は、判定モードにおいて、測定対象となっている発現プロファイル画像のそれぞれのスポットにおける特徴量データを取得し、スポットの信頼度を判定するためにSVM91に供給する。特徴量抽出部86により抽出される特徴量データは、スポットの信頼度と相関性を有する特徴量であり、その詳細については後述する。   In the learning mode, the feature amount extraction unit 86 acquires feature amount data at each spot of the expression profile image displayed on the display unit 29A, and supplies the feature amount data to the SVM 91 for the learning process. In addition, the feature amount extraction unit 86 acquires feature amount data at each spot of the expression profile image to be measured in the determination mode, and supplies the feature amount data to the SVM 91 to determine the reliability of the spot. The feature amount data extracted by the feature amount extraction unit 86 is a feature amount having a correlation with the reliability of the spot, and details thereof will be described later.

発現量計算部25は、判定モードにおいて、ハイブリダイズ量計算部85からの出力に基づいて、プローブに対するターゲットの結合強度を求めることで、蛍光強度に対応する発現量を推定する。標準化部26は、判定モードにおいて、発現標準化用コントロールプローブ113と細胞数計数用コントロールプローブ115を利用した標準化処理を行う。出力部27は、判定モードにおいて、標準化されたデータを発現プロファイルデータ記憶部28に供給する。   In the determination mode, the expression level calculation unit 25 estimates the expression level corresponding to the fluorescence intensity by obtaining the binding strength of the target to the probe based on the output from the hybridization level calculation unit 85. In the determination mode, the standardization unit 26 performs standardization processing using the expression standardization control probe 113 and the cell number counting control probe 115. The output unit 27 supplies the standardized data to the expression profile data storage unit 28 in the determination mode.

発現プロファイルデータ記憶部28は、出力部27より供給されたデータを、発現プロファイルデータとして記憶する。また、発現プロファイルデータ記憶部28は、他の装置により得られた発現プロファイルデータを記憶することができる。他の装置により得られた発現プロファイルデータには、プローブとターゲットとのハイブリダイズのしやすさを示すプローブ−ターゲット結合強度行列の情報が含まれていると好適である。   The expression profile data storage unit 28 stores the data supplied from the output unit 27 as expression profile data. In addition, the expression profile data storage unit 28 can store expression profile data obtained by other devices. It is preferable that the expression profile data obtained by another apparatus includes information on a probe-target binding strength matrix indicating the ease of hybridization between the probe and the target.

発現プロファイルデータ記憶部28に記憶されたデータは、ハイブリダイズ量推定部24の励起光強度推定部81に供給されて、学習モードにも、判定モードにも用いることができる。発現プロファイルデータ記憶部28に記憶されたデータは、必要に応じて、ユーザインターフェース部29に供給され、表示部29Aに表示される。発現量計算部25より出力されたデータも必要に応じて、表示部29Aに表示される。   The data stored in the expression profile data storage unit 28 is supplied to the excitation light intensity estimation unit 81 of the hybridization amount estimation unit 24 and can be used for both the learning mode and the determination mode. The data stored in the expression profile data storage unit 28 is supplied to the user interface unit 29 as necessary and displayed on the display unit 29A. Data output from the expression level calculation unit 25 is also displayed on the display unit 29A as necessary.

蛍光強度−ハイブリダイズ量変換式記憶部30は、図9を参照して後述するように、蛍光強度とそれに対応するハイブリダイズ量との関係を一義的に決定する変換式(必ずしも式を構成せずとも、変換のためのデータであってもよい)を予め記憶している。   As will be described later with reference to FIG. 9, the fluorescence intensity-hybridization amount conversion storage unit 30 is a conversion equation that uniquely determines the relationship between the fluorescence intensity and the corresponding hybridization amount. Or may be data for conversion) in advance.

機械的学習部31は、SVM(Support Vector Machine)91とスポット除去パターンデータベース(DB)92を有している。   The mechanical learning unit 31 includes an SVM (Support Vector Machine) 91 and a spot removal pattern database (DB) 92.

学習モード時、ユーザインターフェース部29の表示部29Aには、発現プロファイル画像が表示される。また、特徴量抽出部86は、表示されている発現プロファイル画像のスポットごとの特徴量を抽出して、SVM92に供給する。ユーザは、表示部29Aに表示された発現プロファイル画像を参照して、例えば、大きなデブリが存在していたり、スポットの蛍光強度が非常に高い、または、低い場合、もしくは、スポット内で蛍光強度に偏りが見られるなど、そのスポットの蛍光強度から求められたハイブリダイズ量の信頼度が低いと思われるもの、すなわち、スポットとして信頼度の低いものと、スポットとしての信頼度の高いものを区別して入力する。SVM91は、複数の発現プロファイル画像(学習に用いられるサンプル数が多いほど学習の信頼度が増すことは言うまでもない)に対応して、ユーザインターフェース部29から、教師データとして、それぞれのスポットの信頼度の有無を区別する情報の供給を受けるとともに、特徴量抽出部86から、それぞれのスポットの特徴量データの供給を受け、これらに基づいて、スポットごとに、信頼性の有無を判定するためのパターン学習を行う。SVM91は、学習結果であるスポット信頼度判定情報をスポット除去パターンデータベース92に記憶させる。   In the learning mode, an expression profile image is displayed on the display unit 29A of the user interface unit 29. Further, the feature amount extraction unit 86 extracts the feature amount for each spot of the displayed expression profile image, and supplies it to the SVM 92. The user refers to the expression profile image displayed on the display unit 29A, for example, when large debris is present, or when the fluorescence intensity of the spot is very high or low, or the fluorescence intensity within the spot is increased. Distinguish between those that seem to have low reliability of the hybridization amount obtained from the fluorescence intensity of the spot, such as bias, that is, those that have low reliability as spots and those that have high reliability as spots input. In response to a plurality of expression profile images (the number of samples used for learning increases, the reliability of learning increases), the SVM 91 receives the reliability of each spot as teacher data from the user interface unit 29. A pattern for determining the presence or absence of reliability for each spot based on the supply of feature amount data of each spot from the feature amount extraction unit 86. Do learning. The SVM 91 stores spot reliability determination information as a learning result in the spot removal pattern database 92.

SVM91はまた、判定モード時、特徴量抽出部86から供給された特徴量データの供給を受け、スポット除去パターンデータベース92に記憶されているスポット信頼度判定情報に基づいて、対応するスポットの信頼度の有無を判定し、その判定結果をハイブリダイズ量計算部85に出力する。すなわち、判定モードでは、ユーザは、発現プロファイル画像を参照して、スポットの信頼度を判定する必要がない。   In the determination mode, the SVM 91 is also supplied with the feature amount data supplied from the feature amount extraction unit 86, and based on the spot reliability determination information stored in the spot removal pattern database 92, the reliability of the corresponding spot The determination result is output to the hybridization amount calculation unit 85. That is, in the determination mode, the user does not need to determine the spot reliability with reference to the expression profile image.

なお、生体情報処理装置1においては、学習モードを実行する装置と判定モードを実行する装置とを区別するようにしても良い。すなわち、学習モードが実行された結果、スポット除去パターンデータベース92に記憶されたスポット信頼度判定情報を、他の生体情報処理装置に供給し、その装置において利用することもできるし、他の生体情報処理装置が実行した学習モードにより得られたスポット信頼度判定情報を取得して、スポット除去パターンデータベース92に記憶させることにより、判定モードに用いるようにすることもできるし、また、スポット除去パターンデータベース92に記憶されたスポット信頼度判定情報を、自分自身の判定モードにおいて利用することもできる。   In the biological information processing apparatus 1, a device that executes the learning mode may be distinguished from a device that executes the determination mode. That is, as a result of executing the learning mode, the spot reliability determination information stored in the spot removal pattern database 92 can be supplied to another biological information processing apparatus and used in the apparatus, or other biological information can be used. The spot reliability determination information obtained by the learning mode executed by the processing apparatus is acquired and stored in the spot removal pattern database 92, so that it can be used for the determination mode, or the spot removal pattern database. The spot reliability determination information stored in 92 can be used in its own determination mode.

遺伝子発現量の定量的な測定、および、測定を行うための学習処理は、図3に示される実験過程処理装置131により行われる。図1の生体情報処理装置1は、この図3の実験過程処理装置131の一部を構成している。   The quantitative measurement of the gene expression level and the learning process for performing the measurement are performed by the experimental process processing device 131 shown in FIG. The biological information processing apparatus 1 in FIG. 1 constitutes a part of the experimental process processing apparatus 131 in FIG.

すなわち、実験過程処理装置131は、調整部141、ハイブリダイズ部142、取得部143、発現量推定部144、標準化部145、出力部146、記憶部147、特徴量抽出部148、学習処理部149、および、操作入力部150により構成されている。このうち、取得部143、発現量推定部144、標準化部145、出力部146、記憶部147、特徴量抽出部148、学習処理部149、および、操作入力部150が、生体情報処理装置1により構成されている。   That is, the experimental process processing device 131 includes an adjustment unit 141, a hybridization unit 142, an acquisition unit 143, an expression level estimation unit 144, a standardization unit 145, an output unit 146, a storage unit 147, a feature amount extraction unit 148, and a learning processing unit 149. And the operation input unit 150. Among these, the acquisition unit 143, the expression amount estimation unit 144, the standardization unit 145, the output unit 146, the storage unit 147, the feature amount extraction unit 148, the learning processing unit 149, and the operation input unit 150 are included in the biological information processing apparatus 1. It is configured.

具体的には、取得部143は、ピックアップ部21、蛍光強度取得部22、励起光強度計算部23、および蛍光強度−ハイブリダイズ量変換式記憶部30により構成され、発現量推定部144は、ハイブリダイズ量推定部24の特徴量抽出部86以外の部分、および、発現量計算部25により構成され、標準化部145は標準化部26により構成され、出力部146は出力部27により構成され、記憶部147は発現プロファイルデータ記憶部28により構成される。そして、特徴量抽出部148は、ハイブリダイズ量推定部24の特徴量抽出部86より構成され、学習処理部149は、機械的学習部31により構成され、操作入力部150は、ユーザインターフェース部29の入力部29Bより構成される。   Specifically, the acquisition unit 143 includes a pickup unit 21, a fluorescence intensity acquisition unit 22, an excitation light intensity calculation unit 23, and a fluorescence intensity-hybridization amount conversion expression storage unit 30, and the expression level estimation unit 144 includes: The hybridizing amount estimating unit 24 includes a part other than the feature amount extracting unit 86 and the expression amount calculating unit 25, the standardizing unit 145 includes the standardizing unit 26, and the output unit 146 includes the output unit 27. The unit 147 includes the expression profile data storage unit 28. The feature quantity extraction unit 148 includes the feature quantity extraction unit 86 of the hybridization amount estimation unit 24, the learning processing unit 149 includes the mechanical learning unit 31, and the operation input unit 150 includes the user interface unit 29. The input unit 29B.

調整部141は、学習モードおよび判定モードのいずれにおいても、ターゲットの調整を行う。ハイブリダイズ部142は、学習モードおよび判定モードのいずれにおいても、プローブとターゲットとのハイブリダイズを行う。取得部143は、学習モードおよび判定モードのいずれにおいても、蛍光強度を取得する。発現量推定部144は、学習モードのとき、ハイブリダイズ済みの学習用DNAチップ11により得られた蛍光強度を基に、学習に用いられる特徴量を抽出するために必要な各種処理を実行する。発現量推定部144はまた、判定モードのとき、学習処理部149による学習の結果得られるスポット信頼度判定情報の判定結果を利用して、発現量の推定処理を行う。   The adjustment unit 141 adjusts the target in both the learning mode and the determination mode. The hybridizing unit 142 hybridizes the probe and the target in both the learning mode and the determination mode. The acquisition unit 143 acquires the fluorescence intensity in both the learning mode and the determination mode. In the learning mode, the expression level estimation unit 144 executes various processes necessary for extracting feature quantities used for learning based on the fluorescence intensity obtained by the hybridized learning DNA chip 11. The expression level estimation unit 144 also performs an expression level estimation process using the determination result of the spot reliability determination information obtained as a result of learning by the learning processing unit 149 in the determination mode.

特徴量抽出部148は、学習モードおよび判定モードのいずれにおいても、発現量推定部144の処理により得られる特徴量を抽出する。学習処理部149は、学習モードにおいて、特徴量抽出部149により抽出された特徴量データと、操作入力部150により入力された教師データとしてのスポットごとの信頼度の判定結果を基に、学習を行い、学習結果を記憶する。学習処理部149は、更に、判定モードにおいて、特徴量抽出部149により抽出された特徴量データに基づいて、対応するスポットの信頼度の判定を行う。操作入力部150は、学習処理部149の学習モードにおいて、教師データとしてのスポットごとの判定結果の入力を受け、学習処理部149に供給する。また、操作入力部150は、学習モードおよび判定モードのいずれにおいても、特徴量となる値(例えば、プローブ−ターゲット結合強度行列)の入力を受け、学習処理部149に供給することができる。標準化部145はデータの標準化を行う。出力部146は発現プロファイルデータを出力する。記憶部147は発現プロファイルデータを記憶する。   The feature amount extraction unit 148 extracts the feature amount obtained by the processing of the expression amount estimation unit 144 in both the learning mode and the determination mode. In the learning mode, the learning processing unit 149 performs learning based on the feature amount data extracted by the feature amount extracting unit 149 and the reliability determination result for each spot as the teacher data input by the operation input unit 150. And remember the learning results. The learning processing unit 149 further determines the reliability of the corresponding spot based on the feature amount data extracted by the feature amount extraction unit 149 in the determination mode. The operation input unit 150 receives an input of a determination result for each spot as teacher data in the learning mode of the learning processing unit 149, and supplies it to the learning processing unit 149. In addition, the operation input unit 150 can receive an input of a value (for example, a probe-target bond strength matrix) serving as a feature amount and supply it to the learning processing unit 149 in both the learning mode and the determination mode. The standardization unit 145 standardizes data. The output unit 146 outputs expression profile data. The storage unit 147 stores expression profile data.

なお、学習モードを実行する装置、または、判定モードを実行する装置は、図3に示される実験過程処理装置131から独立して構成するようにしても良い。すなわち、学習処理部149による学習の結果得られるスポット信頼度判定情報を、他の実験過程処理装置に供給し、その装置において利用することもできるし、他の実験過程処理装置が実行した学習モードにより得られたスポット信頼度判定情報を取得して、判定モードに用いるようにすることもできるし、また、自分自身の学習処理部149による学習の結果得られたスポット信頼度判定情報を、自分自身の判定モードにおいて利用することもできる。   Note that the device that executes the learning mode or the device that executes the determination mode may be configured independently of the experimental process processing device 131 shown in FIG. That is, the spot reliability determination information obtained as a result of learning by the learning processing unit 149 can be supplied to another experimental process processing apparatus and used in the apparatus, or the learning mode executed by the other experimental process processing apparatus. It is also possible to acquire the spot reliability determination information obtained by the above and use it in the determination mode. Also, the spot reliability determination information obtained as a result of learning by the own learning processing unit 149 It can also be used in its own judgment mode.

次に、図3の実験過程処理装置131の処理のうち、調整部141、ハイブリダイズ部142、および、取得部143が実行する実験過程の処理1を、図4のフローチャートを参照して説明する。実験過程の処理1は、学習モードおよび判定モードのいずれにおいても実行される。   Next, processing 1 of the experimental process executed by the adjustment unit 141, the hybridization unit 142, and the acquisition unit 143 in the processing of the experimental process processing device 131 of FIG. 3 will be described with reference to the flowchart of FIG. . Process 1 of the experimental process is executed in both the learning mode and the determination mode.

最初に、ステップS1において、調整部141はターゲットを調整する。具体的には、細胞が含まれるサンプルが取り出され、その中から蛋白質を変性させて除去する処理が行われ、RNA(ribonucleic acid)の抽出、断片化、並びにDNA(deoxyribonucleic acid)の抽出、断片化によりターゲット(発現解析用プローブ112に対するターゲット112A)が生成される。   First, in step S1, the adjustment unit 141 adjusts the target. Specifically, a sample containing cells is taken out, processed to denature and remove proteins from it, RNA (ribonucleic acid) extraction, fragmentation, DNA (deoxyribonucleic acid) extraction, fragment The target (target 112A for the expression analysis probe 112) is generated.

ステップS2において、ハイブリダイズ部142はハイブリダイズする処理を実行する。具体的には、ステップS1の処理で生成されたターゲットが入った溶液に、さらにハイブリダイズ検証用プローブ111,114に対するターゲット111A,114A、発現標準化用コントロールプローブ113に対するターゲット113A、並びに細胞数計数用コントロールプローブ115に対するターゲット115Aが加えられ、この溶液を発現解析用反応槽101と細胞数計数用反応槽102に滴下することで、ターゲットとプローブとがハイブリダイズされる。そして、インターカレータ116が導入され、ハイブリダイズしたターゲットとプローブに結合され、図2に示されるようなDNAチップ11が得られる。同図に示されるように、発現解析用反応槽101のスポット12では、発現解析用プローブ112に対してターゲット112Aがハイブリダイズしている他、発現標準化用コントロールプローブ113に対してターゲット113Aがハイブリダイズしており、ハイブリダイズ検証用プローブ111に対してターゲット111Aがハイブリダイズしている。そして、それらの2本鎖結合したプローブとターゲットの間にはインターカレータ116が結合している。   In step S2, the hybridizing unit 142 executes a hybridizing process. Specifically, in the solution containing the target generated in step S1, the targets 111A and 114A for the hybridization verification probes 111 and 114, the target 113A for the expression normalization control probe 113, and the cell count counter A target 115A for the control probe 115 is added, and this solution is dropped into the expression analysis reaction tank 101 and the cell number counting reaction tank 102, whereby the target and the probe are hybridized. Then, the intercalator 116 is introduced and coupled to the hybridized target and probe to obtain the DNA chip 11 as shown in FIG. As shown in the figure, in the spot 12 of the expression analysis reaction tank 101, the target 112A is hybridized to the expression analysis probe 112, and the target 113A is hybridized to the expression standardization control probe 113. The target 111A is hybridized with the probe 111 for hybridization verification. And the intercalator 116 has couple | bonded between the probe and target which couple | bonded with those double strands.

同様に、細胞数計数用反応槽102のスポット12においても、ハイブリダイズ検証用プローブ114に対してターゲット114Aがハイブリダイズしており、細胞数計数用コントロールプローブ115に対してターゲット115Aがハイブリダイズしている。そして、これらのハイブリダイズしたプローブとターゲットの間にも、インターカレータ116が結合されている。   Similarly, also in the spot 12 of the cell number counting reaction tank 102, the target 114A is hybridized to the hybridization verification probe 114, and the target 115A is hybridized to the cell number counting control probe 115. ing. An intercalator 116 is also coupled between these hybridized probe and target.

ステップS3において、取得部143は蛍光強度を取得する。具体的には、蛍光強度取得部22は、コントロール部43を介して蛍光強度取得用ピックアップ41を駆動し、半導体レーザ53にレーザ光を励起光として出射させる。この励起光は、プリズム52を介して対物レンズ51に入射され、対物レンズ51は、これを基板11A上の発現解析用反応槽101に照射する。   In step S3, the acquisition unit 143 acquires the fluorescence intensity. Specifically, the fluorescence intensity acquisition unit 22 drives the fluorescence intensity acquisition pickup 41 via the control unit 43 and causes the semiconductor laser 53 to emit laser light as excitation light. The excitation light is incident on the objective lens 51 via the prism 52, and the objective lens 51 irradiates the expression analysis reaction tank 101 on the substrate 11A.

インターカレータ116は励起光が照射されると蛍光を発生する。この蛍光が対物レンズ51により集光され、プリズム52を介してフォトダイオード54に入射される。フォトダイオード54は蛍光に対応する電流を出力する。コントロール部43は、この電流に対応する信号を畳み込み展開部45により画像信号に変換させ、変換により生成された蛍光強度に対応する信号を、蛍光強度取得部22に出力する。   The intercalator 116 generates fluorescence when irradiated with excitation light. This fluorescence is collected by the objective lens 51 and is incident on the photodiode 54 via the prism 52. The photodiode 54 outputs a current corresponding to the fluorescence. The control unit 43 causes the convolutional expansion unit 45 to convert a signal corresponding to the current into an image signal, and outputs a signal corresponding to the fluorescence intensity generated by the conversion to the fluorescence intensity acquisition unit 22.

コントロール部43は、対物レンズ51の位置を開始位置ガイド13Aから終了位置ガイド13Bの方向に向けて移動させる。このとき、ガイド信号取得用ピックアップ42の半導体レーザ63が出射するガイド検出光としてのレーザ光が、プリズム62を介して対物レンズ61に入射され、対物レンズ61がこのガイド検出光を基板11Aに照射する。ガイド検出光の反射光の強度は、開始位置ガイド13Aと終了位置ガイド13Bに照射されたとき強くなる。この反射光が対物レンズ61を介してプリズム62に入射され、プリズム62からフォトダイオード64に入射される。対物座標計算部44はコントロール部43を介してフォトダイオード64からのガイド信号を取得し、この信号に基づいて、ガイド信号取得用ピックアップ42(したがって、それと一体化している蛍光強度取得用ピックアップ41)が基板11Aの開始位置ガイド13Aと終了位置ガイド13Bの間のいずれの位置に位置するのか、その座標を計算する。コントロール部43はその座標に基づいてガイド信号取得用ピックアップ42(蛍光強度取得用ピックアップ41)を開始位置ガイド13Aから終了位置ガイド13Bまで一定の速度で移動させる(走査させる)。   The control unit 43 moves the position of the objective lens 51 from the start position guide 13A toward the end position guide 13B. At this time, laser light as guide detection light emitted from the semiconductor laser 63 of the guide signal acquisition pickup 42 is incident on the objective lens 61 via the prism 62, and the objective lens 61 irradiates the substrate 11A with this guide detection light. To do. The intensity of the reflected light of the guide detection light increases when it is applied to the start position guide 13A and the end position guide 13B. This reflected light is incident on the prism 62 via the objective lens 61, and is incident on the photodiode 64 from the prism 62. The objective coordinate calculation unit 44 acquires a guide signal from the photodiode 64 via the control unit 43, and on the basis of this signal, the guide signal acquisition pickup 42 (therefore, the fluorescence intensity acquisition pickup 41 integrated therewith). Is located between the start position guide 13A and the end position guide 13B of the substrate 11A. Based on the coordinates, the control unit 43 moves (scans) the guide signal acquisition pickup 42 (fluorescence intensity acquisition pickup 41) from the start position guide 13A to the end position guide 13B at a constant speed.

このようにして、蛍光強度取得用ピックアップ41が、図2において、開始位置ガイド13Aから終了位置ガイド13Bの位置まで移動されるとともに、さらに、その走査位置が、開始位置ガイド13A(終了位置ガイド13B)と平行な方向(図中x座標方向)に1ピッチ分だけ移動され、新たな移動位置において同様に、開始位置ガイド13Aから終了位置ガイド13Bまで移動される。このようにして、発現解析用反応槽101と細胞数計数用反応槽102の全体が走査され、各座標における画像信号が蛍光強度取得用ピックアップ41より出力される。   In this way, the fluorescence intensity acquisition pickup 41 is moved from the start position guide 13A to the end position guide 13B in FIG. 2, and the scanning position is further changed to the start position guide 13A (end position guide 13B). ) In the direction parallel to () in the figure (x-coordinate direction) by one pitch, and similarly, from the start position guide 13A to the end position guide 13B at the new movement position. In this manner, the entire expression analysis reaction tank 101 and cell number counting reaction tank 102 are scanned, and image signals at respective coordinates are output from the fluorescence intensity acquisition pickup 41.

次に、図3の実験過程処理装置131の処理のうち、発現量推定部144、標準化部145、出力部146、特徴量抽出部148、および、学習処理部149が実行する実験過程の処理2を、図5のフローチャートを参照して説明する。実験過程の処理2は、判定モードにおける処理である。   Next, among the processes of the experimental process processing device 131 of FIG. 3, the process 2 of the experimental process executed by the expression level estimation unit 144, the standardization unit 145, the output unit 146, the feature value extraction unit 148, and the learning processing unit 149 is performed. Will be described with reference to the flowchart of FIG. Process 2 of the experimental process is a process in the determination mode.

ステップS11において、スポット除去パターンデータベース92は、学習モードが終了したSVM91から、または、他の装置からの外部入力により、後述する学習処理により得られるスポット信頼度判定情報を取得して記憶する。スポット信頼度判定情報は、後述する発現量推定処理において用いられる情報であり、学習処理の詳細は、図39のフローチャートを参照して後述する。   In step S <b> 11, the spot removal pattern database 92 acquires and stores spot reliability determination information obtained by a learning process described later from the SVM 91 in which the learning mode has ended or from an external input from another device. The spot reliability determination information is information used in an expression level estimation process described later, and details of the learning process will be described later with reference to the flowchart of FIG.

ステップS12において、発現量推定部144は、発現量推定処理を実行する。この発現量推定処理の詳細は、図6を参照して後述するが、この処理によりハイブリダイズ量の計算が行われ、発現量が計算される。   In step S12, the expression level estimation unit 144 executes an expression level estimation process. The details of the expression level estimation process will be described later with reference to FIG. 6. By this process, the amount of hybridization is calculated, and the expression level is calculated.

次に、ステップS13において、標準化部145(標準化部26)により、データを標準化する処理が行われる。ここでは、発現標準化用コントロールプローブ113による標準化と、細胞数計数用コントロールプローブ115による標準化が行われる。発現標準化用コントロールプローブ113による標準化は、次のようにして行われる。すなわち、図2には、発現標準化用コントロールプローブ113が1箇所にのみ図示されているが、実際には、この発現標準化用コントロールプローブ113は、発現解析用反応槽101の予め定められた所定の複数の位置(例えば、発現解析用反応槽101の4隅と略中央の5ヶ所)に分散して配置されている。そして、この各位置に配置された発現標準化用コントロールプローブ113の蛍光値に基づいて、補正用曲面が、例えば、Bスプライン曲面に基づいて演算され、その補正用曲面によって得られる蛍光値により各ピクセルの蛍光値を割り算することで正規化が行われる。この正規化により、発現解析用反応槽101内のスポット12の位置によるハイブリダイゼーションのばらつきが補正される。   Next, in step S13, the standardization unit 145 (standardization unit 26) performs processing for standardizing data. Here, standardization by the expression standardization control probe 113 and standardization by the cell number counting control probe 115 are performed. Standardization by the expression standardization control probe 113 is performed as follows. That is, in FIG. 2, the expression standardization control probe 113 is shown only in one place, but actually, this expression standardization control probe 113 is a predetermined predetermined in the expression analysis reaction tank 101. It is distributed and arranged at a plurality of positions (for example, four corners of the expression analysis reaction tank 101 and approximately five at the center). Then, based on the fluorescence value of the expression standardization control probe 113 arranged at each position, a correction curved surface is calculated based on, for example, a B-spline curved surface, and each pixel is calculated based on the fluorescence value obtained by the correction curved surface. Normalization is performed by dividing the fluorescence value. By this normalization, variation in hybridization due to the position of the spot 12 in the reaction tank 101 for expression analysis is corrected.

また、細胞数計数用コントロールプローブ115による標準化は、細胞数計数用コントロールプローブ115に対するハイブリダイズ量の値(細胞数計数用コントロール115に基づく蛍光値)により、細胞数計数用反応槽102上の各スポット12上のピクセルの蛍光値を割り算することにより行われる。細胞数計算用コントロールプローブ115としては、発現解析用プローブ112を抽出した生体のゲノム中の反覆配列(例えば、人間でいえばAlu配列)が用いられる。この処理により、取得された遺伝子の発現量を一定の細胞数当たりの値に換算することができる。   Further, the standardization by the cell number counting control probe 115 is performed based on the value of the amount of hybridization to the cell number counting control probe 115 (fluorescence value based on the cell number counting control 115). This is done by dividing the fluorescence value of the pixel on the spot 12. As the control probe 115 for calculating the number of cells, a repetitive sequence (for example, Alu sequence for humans) in the genome of the living body from which the expression analysis probe 112 is extracted is used. By this processing, the expression level of the acquired gene can be converted into a value per certain number of cells.

さらに、ステップS14において、出力部146(出力部27)は、発現プロファイルデータを出力する。具体的には、発現プロファイル画像データとそれに関する情報により構成される発現プロファイルデータ(図8を用いて後述する)が、記憶部147(発現プロファイルデータ記憶部28)に供給され、記録される。   Further, in step S14, the output unit 146 (output unit 27) outputs the expression profile data. Specifically, expression profile data (described later with reference to FIG. 8) constituted by expression profile image data and information related thereto is supplied to the storage unit 147 (expression profile data storage unit 28) and recorded.

このような処理により、ハイブリダイズ量の計算が行われ、発現量が計算されて、得られたデータが標準化されてハイブリダイゼーションのばらつきが補正され、これらの処理により得られた発現プロファイルデータが出力される。   By such processing, the amount of hybridization is calculated, the amount of expression is calculated, the obtained data is standardized and the variation in hybridization is corrected, and the expression profile data obtained by these processing is output. Is done.

次に、図6のフローチャートを参照して、図5のステップS12において実行される発現量推定処理について説明する。   Next, the expression level estimation process executed in step S12 of FIG. 5 will be described with reference to the flowchart of FIG.

ステップS31において、励起光強度推定部81は、画像情報を入力する。具体的には、励起光強度推定部81は、蛍光強度取得部22から図4を用いて説明した処理により得られる蛍光強度データの供給を受けるか、または、発現プロファイルデータ記憶部28に記憶されている発現プロファイルデータの供給を受ける。   In step S31, the excitation light intensity estimation unit 81 inputs image information. Specifically, the excitation light intensity estimation unit 81 receives supply of fluorescence intensity data obtained by the process described with reference to FIG. 4 from the fluorescence intensity acquisition unit 22 or is stored in the expression profile data storage unit 28. Is supplied with expression profile data.

ステップS32において、励起光強度推定部81は、入力された画像情報が、発現プロファイルデータであるか否かを判断する。   In step S32, the excitation light intensity estimation unit 81 determines whether or not the input image information is expression profile data.

励起光強度推定部81が供給を受けるデータのフォーマットは、例えば、図7または図8に示されるものである。蛍光強度取得部22より供給される蛍光強度データは、図7に示されるように、蛍光強度を取得したときに照射された励起光の強度と、DNAチップ11のそれぞれのプローブとして用いられている遺伝子の一覧であるプローブ遺伝子インデックス、縦横ピクセル数、および、蛍光画像を少なくとも含むものである。   The format of data supplied by the excitation light intensity estimation unit 81 is, for example, as shown in FIG. 7 or FIG. As shown in FIG. 7, the fluorescence intensity data supplied from the fluorescence intensity acquisition unit 22 is used as the intensity of the excitation light irradiated when the fluorescence intensity is acquired and the respective probes of the DNA chip 11. It includes at least a probe gene index that is a list of genes, the number of vertical and horizontal pixels, and a fluorescence image.

これに対して、発現プロファイルデータ記憶部28に記憶されている発現プロファイルデータは、蛍光強度取得部22より供給される蛍光強度データと異なり、別の装置によって求められたものである可能性があり、図8に示されるように、画像データ181と共通データ182により構成されている。発現プロファイルデータ記憶部28に記憶されている発現プロファイルデータは、図7を用いて説明した蛍光強度データを基に、ハイブリダイズの推定、発現量の計算、または、標準化などの処理が施されて作成されるデータであるか、または、他の装置により取得された蛍光画像に、生体情報処理装置1で実行される各種処理に必要なデータを付加したものである。すなわち、画像データ181は、セットとなる画像の枚数の他、蛍光強度取得時に照射された励起光強度、縦横ピクセル数、および蛍光画像により構成されている。共通データ182は、生体情報処理装置1で実行される各種処理に必要な、蛍光画像以外のデータであり、例えば、画像処理を実行する場合に、DNAチップのスポット位置を確定するために用いられるスポット位置テンテンプレート画像、スポット数、プローブ遺伝子インデックスなどにより構成されている。   On the other hand, the expression profile data stored in the expression profile data storage unit 28 is different from the fluorescence intensity data supplied from the fluorescence intensity acquisition unit 22 and may be obtained by another device. As shown in FIG. 8, the image data 181 and common data 182 are included. The expression profile data stored in the expression profile data storage unit 28 is subjected to processing such as estimation of hybridization, calculation of expression level, or standardization based on the fluorescence intensity data described with reference to FIG. This is data that is created, or data that is necessary for various processes executed by the biological information processing apparatus 1 is added to a fluorescent image acquired by another apparatus. That is, the image data 181 includes the number of images to be set, the excitation light intensity irradiated at the time of obtaining the fluorescence intensity, the number of vertical and horizontal pixels, and the fluorescence image. The common data 182 is data other than the fluorescence image necessary for various processes executed by the biological information processing apparatus 1, and is used, for example, to determine the spot position of the DNA chip when executing image processing. It is composed of a spot position template image, the number of spots, a probe gene index, and the like.

すなわち、励起光強度推定部81は、図8に示されるデータの供給を受けた場合、発現プロファイルデータの供給を受けたと判断し、処理は、ステップS33に進む。そして、励起光強度推定部81は、図7に示される蛍光強度データの供給を受けた場合、発現プロファイルデータの供給を受けていないと判断する。図7に示される蛍光強度データには、零時高強度情報が含まれているので、励起光強度推定部81は、励起光強度の推定処理を行う必要がないため、供給された画像データを作成部82に供給し、処理は、ステップS35に進む。   That is, when the excitation light intensity estimation unit 81 receives the data shown in FIG. 8, the excitation light intensity estimation unit 81 determines that the expression profile data has been supplied, and the process proceeds to step S33. Then, when the excitation light intensity estimation unit 81 receives the supply of the fluorescence intensity data shown in FIG. 7, it determines that the expression profile data is not supplied. Since the fluorescence intensity data shown in FIG. 7 includes the zero-time high intensity information, the excitation light intensity estimation unit 81 does not need to perform the excitation light intensity estimation process. The data is supplied to the creation unit 82, and the process proceeds to step S35.

ステップS33において、励起光強度推定部81は、ステップS31で入力された画像情報に励起光強度情報があるか(含まれているか)否かを判定する。   In step S33, the excitation light intensity estimation unit 81 determines whether the image information input in step S31 includes (includes) excitation light intensity information.

励起光強度推定部81が供給を受けるデータが蛍光強度取得部22より供給される蛍光強度データの場合、励起光強度計算部23の処理により計算されて設定された励起光強度において得られた蛍光画像が含まれているので、蛍光強度データには、励起光強度情報が含まれている。これに対して、発現プロファイルデータ記憶部28から発現プロファイルデータが供給される場合、それが蛍光強度取得部22から供給され、各種処理が施された後に記憶されたデータである場合には上述したように励起光強度情報が存在するが、そうでない場合(例えば、他の装置から供給された画像データである場合)には、発現プロファイルデータに励起光強度情報が存在しないことがある。   When the data supplied by the excitation light intensity estimation unit 81 is fluorescence intensity data supplied from the fluorescence intensity acquisition unit 22, the fluorescence obtained at the excitation light intensity calculated and set by the processing of the excitation light intensity calculation unit 23 Since the image is included, the fluorescence intensity data includes excitation light intensity information. On the other hand, when the expression profile data is supplied from the expression profile data storage unit 28, it is described above when the data is supplied from the fluorescence intensity acquisition unit 22 and stored after being subjected to various processes. As described above, the excitation light intensity information exists, but if it is not (for example, image data supplied from another device), the excitation light intensity information may not exist in the expression profile data.

したがって、少なくとも蛍光強度取得部22より供給される画像データの場合、画像データ181に励起光強度が含まれているので、励起光強度情報があると判定される。これに対して、発現プロファイルデータ記憶部28に記憶されている発現プロファイル画像データが励起光強度推定部81に供給される場合、それが蛍光強度取得部22から供給され、記憶された画像であるときには上述したように励起光強度情報が存在するが、そうでないとき(他の装置から供給された画像データである場合)には、対応する励起光強度情報が存在しないことがある。   Therefore, in the case of at least image data supplied from the fluorescence intensity acquisition unit 22, the excitation light intensity is included in the image data 181, and therefore it is determined that there is excitation light intensity information. On the other hand, when the expression profile image data stored in the expression profile data storage unit 28 is supplied to the excitation light intensity estimation unit 81, it is an image supplied and stored from the fluorescence intensity acquisition unit 22. Sometimes, as described above, the excitation light intensity information exists, but when it is not (when the image data is supplied from another apparatus), the corresponding excitation light intensity information may not exist.

ステップS33において、励起光強度情報が存在しないと判定された場合、ステップS34において、励起光強度推定部81は、蛍光強度−ハイブリダイズ量変換式記憶部30に記憶されている蛍光強度−ハイブリダイズ量変換式を用いて、励起光強度を推定する処理を実行し、供給された画像データを作成部82に供給する。作成部82は、推定された蛍光強度に基づいてハイブリダイズ量を決定する式(1)(hybridize(pf))を作成しないので、供給された画像データをそのまま画像処理部83に供給する。   If it is determined in step S33 that the excitation light intensity information does not exist, the excitation light intensity estimation unit 81 in step S34 stores the fluorescence intensity-hybridization stored in the fluorescence intensity-hybridization amount conversion expression storage unit 30. Using the quantity conversion equation, a process for estimating the excitation light intensity is executed, and the supplied image data is supplied to the creation unit 82. Since the creating unit 82 does not create the formula (1) (hybridize (pf)) for determining the amount of hybridization based on the estimated fluorescence intensity, the creating unit 82 supplies the supplied image data to the image processing unit 83 as it is.

この励起光強度を推定する処理は、少なくとも2つの異なる強度の励起光に基づいて測定が行われた画像データである場合に実行可能となる。励起光強度情報が存在せず、異なる少なくとも2つの励起光強度に基づく画像データが存在しない場合、励起光強度を推定することができない。このため、これらの場合には、ステップS34の処理はスキップされる。   The process of estimating the excitation light intensity can be executed when the image data is measured based on at least two different intensity excitation lights. If there is no excitation light intensity information and there is no image data based on at least two different excitation light intensities, the excitation light intensity cannot be estimated. Therefore, in these cases, the process of step S34 is skipped.

ステップS33において、励起光強度情報が存在すると判断された場合、励起光強度推定部81は、励起光強度の推定処理を行う必要がないため、供給された画像データを作成部82に供給し、作成部82は、蛍光強度に基づいてハイブリダイズ量を決定する式(1)(hybridize(pf))を作成する必要がないので、供給された画像データを画像処理部83に供給し、処理は、後述するステップS37に進む。 If it is determined in step S33 that the excitation light intensity information exists, the excitation light intensity estimation unit 81 does not need to perform the excitation light intensity estimation process, and therefore supplies the supplied image data to the creation unit 82. Since the creating unit 82 does not need to create the formula (1) (hybridize (pf)) for determining the amount of hybridization based on the fluorescence intensity, the creating unit 82 supplies the supplied image data to the image processing unit 83, and the processing is performed. Then, the process proceeds to step S37 described later.

ステップS32において、発現プロファイルデータの供給を受けていないと判断された場合、ステップS35において、作成部82は、入力された画像情報が複数の励起光強度で撮影した画像の画像情報であるか否かを判定する。ステップS35において、複数の励起光強度で撮影した画像の画像情報であると判断された場合、ステップS36において、作成部82は、蛍光強度に基づいてハイブリダイズ量を決定する式(1)(hybridize(pf))を作成し、供給された画像データを画像処理部83に供給する。   If it is determined in step S32 that expression profile data has not been supplied, in step S35, the creation unit 82 determines whether the input image information is image information of an image captured with a plurality of excitation light intensities. Determine whether. If it is determined in step S35 that the image information is an image captured with a plurality of excitation light intensities, in step S36, the creating unit 82 determines the amount of hybridization based on the fluorescence intensity (1) (hybridize) (Pf)) is generated, and the supplied image data is supplied to the image processing unit 83.

Figure 2007017282
Figure 2007017282

ステップS35において、入力された画像データは、複数の励起光強度で撮影した画像の画像データではないと判定された場合には、ステップS36の処理は実行できないのでスキップされる。   If it is determined in step S35 that the input image data is not image data of an image captured with a plurality of excitation light intensities, the process of step S36 cannot be executed and is skipped.

図9は、各スポットの蛍光強度とハイブリダイズ量の関係を規定する式hybridizee(pf)を表している。同図に示されるように、蛍光強度が与えられると対応するハイブリダイズ量は関数(曲線191乃至曲線194)に基づき一義的に決定される(ハイブリダイゼーションの情報は、第1の生体物質と第2の生体物質とがハイブリダイズして得られる蛍光強度から関数に基づき一義的に決定される)。ただし、同図に示されるように、図中最も上側に示される曲線191が、励起光強度のレベルが最も弱い場合の曲線を表し、以下、より下側の曲線192、曲線193と、順次励起光強度のレベルが強くなり、最も下側の曲線194が励起光強度のレベルが最も強い場合の曲線を表している。 Figure 9 shows the expression hybridize e (pf) that defines the relationship between fluorescence intensity and hybridized amount of each spot. As shown in the figure, when the fluorescence intensity is given, the corresponding hybridization amount is uniquely determined based on the function (curve 191 to curve 194) (hybridization information includes the first biological substance and the first biological substance). 2 is uniquely determined based on the function from the fluorescence intensity obtained by hybridization of the two biological substances). However, as shown in the figure, the uppermost curve 191 in the figure represents the curve when the excitation light intensity level is the weakest. Hereinafter, the lower curve 192 and the curve 193 are sequentially excited. The light intensity level becomes strong, and the lowermost curve 194 represents the curve when the excitation light intensity level is strongest.

式(1)中の式hybridizes(pfs)と式hybridizew(pfw)は、それぞれ、得られたデータのうちの、励起光強度が強い方の式hybridizee(pf)と、弱い方の式hybridizee(pf)を表している。 The expressions hybridize s (pf s ) and hybridize w (pf w ) in the expression (1) are respectively expressed as the hybridize e (pf) having the stronger excitation light intensity and the weaker one of the obtained data. Represents the hybridize e (pf).

各曲線191乃至194は、いずれも図中左側の端部の領域の部分191A乃至194Aと、図中右側の端部の領域の部分191B乃至194Bにおいて、蛍光強度のわずかな変化に対して、ハイブリダイズ量が著しく変化しているので、これらの領域においては、蛍光強度に対応するハイブリダイ量を一義的に決定することが困難になる。したがって、これらの部分191A乃至194Aと部分191B乃至194Bを除く中央の部分だけが、蛍光強度に対応するハイブリダイズ量の演算に利用される。   Each of the curves 191 to 194 is hybridized to a slight change in fluorescence intensity in the portion 191A to 194A in the left end region in the drawing and the portion 191B to 194B in the right end portion in the drawing. Since the amount of soybean is remarkably changed, it becomes difficult to uniquely determine the amount of hybridi corresponding to the fluorescence intensity in these regions. Therefore, only the central part excluding these parts 191A to 194A and parts 191B to 194B is used for the calculation of the amount of hybridization corresponding to the fluorescence intensity.

ステップS33において、蛍光強度情報がないと判断された場合、ステップS34の処理の終了後、ステップS35において、複数の励起光強度で撮影された画像ではないと判断された場合、または、ステップS36の処理の終了後、ステップS37において、画像処理部83は画像処理を行う。この画像処理の詳細は、図11のフローチャートを参照して後述するが、この処理により、DNAチップ11の画像からスポット境界を跨ぐデブリ領域が除去され、画像は各スポット毎の画像に分解される。   If it is determined in step S33 that there is no fluorescence intensity information, after the process of step S34 is completed, if it is determined in step S35 that the image is not photographed with a plurality of excitation light intensities, or in step S36 After the processing is completed, in step S37, the image processing unit 83 performs image processing. The details of this image processing will be described later with reference to the flowchart of FIG. 11. By this processing, a debris region across the spot boundary is removed from the image of the DNA chip 11, and the image is decomposed into images for each spot. .

ステップS38において、検証部84は、ハイブリダイズを検証する処理を実行する。具体的には、図2に示されるように、発現解析用反応槽101にはハイブリダイズ検証用プローブ111が、また細胞数計数用反応槽102にはハイブリダイズ検証用プローブ114が、それぞれスポット12に固定されている。ハイブリダイズ検証用プローブ111,114としては、実験対象としている生物種にない遺伝子配列が用いられる。例えば、実験対象が動物である場合(発現解析用プローブ112が動物の遺伝子である場合)には、ハイブリダイズ検証用プローブ111,114として植物の葉緑素遺伝子が用いられ、ターゲット111A,114Aとしては、その相補配列が用いられる。すなわち、このハイブリダイズ検証用プローブ111,114と、ターゲット111A,114Aは、発現解析用プローブ112とそのターゲット112Aのハイブリダイズとは無関係に、確実にハイブリダイズを起こすものが用いられる。しかも、その実験対象とは全く異なる種のものが用いられるため、ハイブリダイズ検証用プローブ111,114が充分ハイブリダイズしている場合には、この実験において(測定において)ハイブリダイズが確実に起きていることを検証することができる。逆に、ハイブリダイズ検証用プローブ111,114が充分ハイブリダイズしていない場合には、この測定は何らかの原因によりハイブリダイズが発生し難い環境になっている可能性がある。そこで、ハイブリダイズ検証用プローブ111,114の蛍光値を測定することで、その蛍光値が、例えば予め設定されている基準値以上であれば、正しいハイブリダイズ処理が行われていることを検証することができる。検証部84は、ハイブリダイズを検証する処理の終了後、処理済の発現プロファイル画像データを、取得された関連する情報とともに、ハイブリダイズ量計算部85に供給する。   In step S38, the verification unit 84 executes processing for verifying hybridization. Specifically, as shown in FIG. 2, a hybridization verification probe 111 is provided in the expression analysis reaction tank 101, and a hybridization verification probe 114 is provided in the cell number counting reaction tank 102, respectively. It is fixed to. As the hybridization verification probes 111 and 114, gene sequences that do not exist in the biological species to be experimented are used. For example, when the experiment target is an animal (when the expression analysis probe 112 is an animal gene), a plant chlorophyll gene is used as the hybridization verification probes 111 and 114, and the targets 111A and 114A are as follows: Its complementary sequence is used. That is, as the hybridization verification probes 111 and 114 and the targets 111A and 114A, those that reliably cause hybridization regardless of the hybridization of the expression analysis probe 112 and the target 112A are used. In addition, since a completely different species from that of the experiment target is used, when the hybridization verification probes 111 and 114 are sufficiently hybridized, in this experiment (in the measurement), the hybridization surely occurred. Can be verified. On the contrary, when the hybridization verification probes 111 and 114 are not sufficiently hybridized, there is a possibility that this measurement is an environment in which hybridization is difficult to occur for some reason. Therefore, by measuring the fluorescence value of the hybridization verification probes 111 and 114, if the fluorescence value is equal to or higher than a preset reference value, it is verified that correct hybridization processing is being performed. be able to. The verification unit 84 supplies the processed expression profile image data to the hybridization amount calculation unit 85 together with the acquired related information after the process of verifying hybridization.

ステップS39において、ハイブリダイズ量計算部85は、ハイブリダイズ量と信頼度の計算を行う。その詳細は、図22を参照して後述するが、この処理によりスポット内領域にデブリが存在する場合、スポット内領域が複数の領域に分割され、スポット内領域毎に、そして最終的にはスポット単位で、ハイブリダイズ値と信頼度が計算される。   In step S39, the hybridization amount calculation unit 85 calculates the hybridization amount and the reliability. The details will be described later with reference to FIG. 22. When debris is present in the spot area by this processing, the spot area is divided into a plurality of areas, and each spot area and finally the spot. In units, the hybridization value and confidence are calculated.

ステップS40において、発現量計算部25は、ステップS39の処理で、ハイブリダイズ量計算部85により計算されたハイブリダイズ値と信頼度に基づいて、発現量を計算する処理を実行し、処理は、図5のステップS12に戻り、ステップS13に進む。この処理に基づいて、計算された(取得された)蛍光値に対応する発現量が計算される。   In step S40, the expression level calculation unit 25 executes a process of calculating the expression level based on the hybridization value and the reliability calculated by the hybridization level calculation unit 85 in the process of step S39. Returning to step S12 of FIG. 5, the process proceeds to step S13. Based on this processing, the expression level corresponding to the calculated (acquired) fluorescence value is calculated.

このような処理により、スポット単位のハイブリダイズ値と信頼度が算出され、これを基に、発現量が求められる。   By such processing, the hybridization value and the reliability of each spot are calculated, and the expression level is obtained based on this.

図10は、画像処理部83の機能的構成例を表している。同図に示されるように、画像処理部83は、分離部211、ノイズ除去部212、領域除去部213、および分解部214により構成されている。   FIG. 10 illustrates a functional configuration example of the image processing unit 83. As shown in the figure, the image processing unit 83 includes a separation unit 211, a noise removal unit 212, a region removal unit 213, and a decomposition unit 214.

分離部211は、テンプレートを用いて背景画像を分離する。ノイズ除去部212は背景画像の特徴を用いてノイズを除去する。領域除去部213はスポット境界を跨ぐデブリ領域を除去する。分解部214は入力画像をスポット画像に分解する。   The separation unit 211 separates the background image using the template. The noise removing unit 212 removes noise using the characteristics of the background image. The area removing unit 213 removes a debris area that straddles the spot boundary. The decomposition unit 214 decomposes the input image into spot images.

次に、図11のフローチャートを参照して、図10の画像処理部83が図6のステップS37で実行する画像処理の詳細について説明する。   Next, the details of the image processing executed by the image processing unit 83 in FIG. 10 in step S37 in FIG. 6 will be described with reference to the flowchart in FIG.

ステップS61において、分離部211は、テンプレートにより背景画像を分離する。図12に、この背景を分離する処理が原理的に示されている。同図に示されるように、作成部82より入力された発現プロファイル画像221に対して、テンプレート231が用意される。テンプレート231は複数のスポット位置232を有している。このスポット位置232は、発現プロファイル画像221の複数のスポット位置222に対応する位置とされている。すなわち、発現プロファイル画像221のスポット位置222は既知であるため、このスポット位置に対応するスポット位置232を有するテンプレート231が用意される。   In step S61, the separation unit 211 separates the background image using the template. In FIG. 12, the process of separating the background is shown in principle. As shown in the figure, a template 231 is prepared for the expression profile image 221 input from the creation unit 82. The template 231 has a plurality of spot positions 232. The spot position 232 is a position corresponding to the plurality of spot positions 222 of the expression profile image 221. That is, since the spot position 222 of the expression profile image 221 is known, a template 231 having a spot position 232 corresponding to this spot position is prepared.

図12の下側に示される図のように、テンプレート231を発現プロファイル画像221に対して平行移動したり、回転したり、あるいは拡大、縮小するなどして各スポット位置232が各スポット位置222と一致するようにして、テンプレート231を発現プロファイル画像221に対して対応する位置に配置したうえで、発現プロファイル画像221からスポット位置232の画像を除去することで背景画像が分離される(背景画像のみが抽出される)。   As shown in the lower part of FIG. 12, the template 231 is translated, rotated, enlarged, or reduced with respect to the expression profile image 221, so that each spot position 232 becomes each spot position 222. The template 231 is arranged at a position corresponding to the expression profile image 221 so as to match, and then the background image is separated by removing the image of the spot position 232 from the expression profile image 221 (only the background image) Is extracted).

次に、ステップS62において、ノイズ除去部212は、背景画像特徴を用いてノイズを除去する。具体的には、ノイズ除去部212は、図13に示されるように、周波数フィルタ241とトレンドフィルタ242を生成し、それぞれを画像データに適用することでノイズを除去する。   Next, in step S62, the noise removing unit 212 removes noise using the background image feature. Specifically, as shown in FIG. 13, the noise removing unit 212 generates a frequency filter 241 and a trend filter 242, and removes noise by applying them to image data.

周波数フィルタは、図14に示されるように生成される。すなわち、ノイズ除去部212は、ステップS71において、スポット位置222を有する背景画像221A(ステップS61の処理で抽出された背景画像)のデータを、2次元フーリエ変換することで周波数データを得る。ノイズ除去部212は、ステップS72において、フーリエ変換により得られた周波数データの特性に基づいて、高周波成分261を除去するフィルタを生成する。すなわち、図14に示されるように、高周波成分261を除去する特性曲線271を有するフィルタが生成される。そして、このようにして生成された周波数フィルタ241を画像データに対して適用することで、その高周波成分のノイズを除去することができる。   The frequency filter is generated as shown in FIG. That is, in step S71, the noise removing unit 212 obtains frequency data by performing two-dimensional Fourier transform on the data of the background image 221A having the spot position 222 (the background image extracted in the process of step S61). In step S72, the noise removing unit 212 generates a filter that removes the high frequency component 261 based on the characteristics of the frequency data obtained by the Fourier transform. That is, as shown in FIG. 14, a filter having a characteristic curve 271 that removes the high-frequency component 261 is generated. Then, by applying the frequency filter 241 generated in this way to the image data, noise of the high frequency component can be removed.

図15は、トレンドフィルタ242の原理的構成を模式的に表している。同図に示されるように、この(x,y)座標で規定される位置のピクセルの蛍光強度を3次元座標空間の縦軸(z軸)にとり、(x,y)座標を水平面に取るようにして、回帰平面301が、各ピクセルの蛍光強度に基づいて演算される。トレンドフィルタ242を画像データに適用して、各座標(x,y)の蛍光強度302を回帰平面301からの距離により表すようにすることで、低周波成分のノイズを除去することができる。   FIG. 15 schematically illustrates the basic configuration of the trend filter 242. As shown in the figure, the fluorescence intensity of the pixel at the position defined by the (x, y) coordinates is taken on the vertical axis (z axis) of the three-dimensional coordinate space, and the (x, y) coordinates are taken on the horizontal plane. Thus, the regression plane 301 is calculated based on the fluorescence intensity of each pixel. By applying the trend filter 242 to the image data so that the fluorescence intensity 302 at each coordinate (x, y) is represented by the distance from the regression plane 301, it is possible to remove low-frequency component noise.

ステップS63において、領域除去部213は、スポット境界を跨ぐデブリ領域を除去する。この処理により、デブリ境界が抽出され、スポット境界と交差するデブリ領域が除去される。   In step S63, the region removing unit 213 removes a debris region straddling the spot boundary. By this process, a debris boundary is extracted, and a debris region that intersects the spot boundary is removed.

具体的には、領域除去部213は、例えば、画像全体のデータを微分し、所定の閾値を用いて画像データを2値化して、デブリ境界を抽出し、スポット境界と交差するデブリ領域を除去する。   Specifically, for example, the region removing unit 213 differentiates data of the entire image, binarizes the image data using a predetermined threshold, extracts a debris boundary, and removes a debris region that intersects with the spot boundary. To do.

例えば、図16に示される発現プロファイル画像201において、スポットと背景画像との境界がスポット境界351とされ、各スポット境界351に対して、各種のデブリが交差するように、あるいは内部に発生している。例えば、面積を有するデブリ352は、スポット境界351に対して交差している。そして、面積を有しないデブリ353は、2つのスポット境界351と交差している。また、デブリ354は面積を有しておらず、スポット境界351の内部に位置する。これに対して、デブリ355は、スポット境界351の内部に位置しているが、面積を有している。また、背景画像上に位置しているデブリのうち、デブリ356は面積を有しているが、デブリ357は面積を有していない。また、デブリ358は面積を有し、蛍光試料がスポットから流れだしたような涙状の形状をしている。そして、デブリ360は、2つのスポットにまたがって存在し、スポット境界361,362がデブリ360により被覆された状態となっている。領域除去部213は、これらのデブリのうち、スポット境界と交差するデブリ領域を除去する処理を実行する。   For example, in the expression profile image 201 shown in FIG. 16, the boundary between the spot and the background image is a spot boundary 351, and various debris intersects each spot boundary 351 or is generated inside. Yes. For example, the debris 352 having an area intersects the spot boundary 351. The debris 353 having no area intersects the two spot boundaries 351. The debris 354 has no area and is located inside the spot boundary 351. On the other hand, the debris 355 is located inside the spot boundary 351 but has an area. Of the debris located on the background image, the debris 356 has an area, but the debris 357 does not have an area. Further, the debris 358 has an area and has a teardrop shape in which a fluorescent sample flows out from the spot. The debris 360 exists over two spots, and the spot boundaries 361 and 362 are covered with the debris 360. The area removing unit 213 executes a process of removing a debris area that intersects the spot boundary among these debris.

図17は、図16に示される画像の画像データを微分し、閾値により2値化した場合の画像を模式的に表している。スポット境界351A,デブリ352A乃至358A,360A、並びにスポット境界361A,362Aは、それぞれ、図16のスポット境界351,デブリ352乃至358,360、スポット境界361,362に対応している。   FIG. 17 schematically shows an image when the image data of the image shown in FIG. 16 is differentiated and binarized by a threshold value. Spot boundaries 351A, debris 352A to 358A, 360A, and spot boundaries 361A, 362A correspond to spot boundaries 351, debris 352 to 358, 360, and spot boundaries 361, 362 in FIG. 16, respectively.

そして、2値化により得られた画像を必要に応じて補正して、線の太さを補正したり、不連続部分を連続の曲線または直線に補正することにより、デブリ境界が抽出される。   Then, the debris boundary is extracted by correcting the image obtained by binarization as necessary, correcting the thickness of the line, or correcting the discontinuous portion to a continuous curve or straight line.

図18は、図17のデブリ352A乃至358A,360Aの境界を太線化し、デブリ境界352B乃至358B,360Bとした状態を表している。   FIG. 18 shows a state where the boundaries of the debris 352A to 358A and 360A in FIG. 17 are thickened to form debris boundaries 352B to 358B and 360B.

図18に示されるようにして、デブリ境界の抽出が行われた後、スポット領域と交差するデブリ領域を除去する処理が実行される。すなわち、抽出されたデブリ境界をスポット領域と比較することで、交差するデブリ領域が除去される。この処理により、例えば、図16におけるデブリ352,353,360が除去される。この処理について、図19を参照してさらに説明する。   As shown in FIG. 18, after the debris boundary is extracted, a process of removing a debris area that intersects with the spot area is executed. That is, by comparing the extracted debris boundary with the spot region, the intersecting debris region is removed. By this process, for example, the debris 352, 353, 360 in FIG. 16 is removed. This process will be further described with reference to FIG.

図19の例においては、デブリ領域352Dがスポット領域351Dを規定するスポット境界351にまたがっている。図19において矢印で示されるベクトル355は、デブリ領域352Dのデブリ境界352Bに垂直なベクトルである。図20は、このベクトル355に沿った方向の座標を横軸とし、蛍光強度を縦軸としたグラフを表している。図20に示されるように、デブリ領域352Dの範囲の蛍光強度は、デブリ境界352B近傍を境界として増加しているので、デブリであると判定され、この部分のデータはステップS114の処理で除去される。また、より正確を期するために、デブリ境界352Bの近傍の図中Dで示される範囲(デブリ境界352Bから所定の距離の範囲)内のデータも同様に除去するようにしてもよい。   In the example of FIG. 19, the debris region 352D extends over the spot boundary 351 that defines the spot region 351D. A vector 355 indicated by an arrow in FIG. 19 is a vector perpendicular to the debris boundary 352B of the debris region 352D. FIG. 20 shows a graph in which the horizontal axis represents coordinates in the direction along the vector 355 and the vertical axis represents fluorescence intensity. As shown in FIG. 20, since the fluorescence intensity in the range of the debris region 352D increases with the vicinity of the debris boundary 352B as a boundary, it is determined to be debris, and this portion of data is removed in the process of step S114. The Further, for the sake of more accuracy, data in the range indicated by D in the drawing in the vicinity of the debris boundary 352B (a range of a predetermined distance from the debris boundary 352B) may be similarly removed.

そして、ステップS64において、分解部214は、入力画像を各スポット画像へ分解する処理を行う。すなわち、ステップS63の処理でデブリ領域が除去された画像が各スポットの画像に分解される。ステップS64の処理の終了後、処理は、図6のステップS37に戻り、ステップS38に進む。   In step S64, the decomposing unit 214 performs a process of decomposing the input image into spot images. That is, the image from which the debris area has been removed in the process of step S63 is decomposed into the image of each spot. After the process of step S64 is completed, the process returns to step S37 in FIG. 6 and proceeds to step S38.

このような処理により、供給された発現プロファイル画像から、背景画像が分離されて、ノイズやデブリ領域が除去された後、ハイブリダイズ量や信頼度を求めるために、スポット領域ごとの画像に分解される。   Through such processing, after the background image is separated from the supplied expression profile image and noise and debris areas are removed, the image is decomposed into images for each spot area in order to obtain the amount of hybridization and reliability. The

図21は、図6のステップS39のハイブリダイズ量と信頼度の計算処理を実行するハイブリダイズ量計算部85の機能的構成例を表している。同図に示されるように、ハイブリダイズ量計算部85は、分割部441、信頼度計算部442、選択部443、および出力部444により構成されている。   FIG. 21 illustrates a functional configuration example of the hybridization amount calculation unit 85 that performs the calculation processing of the hybridization amount and the reliability in step S39 of FIG. As shown in the figure, the hybridization amount calculation unit 85 includes a division unit 441, a reliability calculation unit 442, a selection unit 443, and an output unit 444.

分割部441は、スポット内領域を分割する。これにより、スポット内領域が、不要な物質が含まれている領域と含まれていない領域からなる複数の分割領域に分割される。信頼度計算部442は、反応領域における第1の生体物質と第2の生体物質との生体反応の状態を表す反応度情報と、反応度情報の信頼性を表す信頼度情報を、それぞれ分割領域毎に計算する。具体的には、信頼度計算部442において、スポット内領域単位でハイブリダイズ値と信頼度が計算される。また、信頼度計算部442は、同一条件での測定に用いられた対応する複数個の反応領域のそれぞれの分割領域を組み合わせ、組み合わせの反応度情報としての組み合わせ反応度情報と、組み合わせの信頼度情報としての組み合わせ信頼度情報を、組み合わせ毎にそれぞれ計算し、組み合わせ信頼度情報が最も大きい組み合わせの組み合わせ反応度情報を反応領域の反応度情報とする。選択部443は、対象とするスポット内領域における信頼度とスポット信頼度の乗算値を算出し、必要に応じて、特徴量抽出部86により抽出された特徴量ベクトルを基に実行される、機械的学習部31によるスポットの信頼度の判定結果を取得し、これらを基に、スポット内領域を選択する。出力部444は、スポット単位でのハイブリダイズ値と信頼度を出力する。   The dividing unit 441 divides the spot area. As a result, the in-spot region is divided into a plurality of divided regions composed of regions containing unnecessary substances and regions not containing them. The reliability calculation unit 442 divides the reactivity information representing the state of biological reaction between the first biological material and the second biological material in the reaction region and the reliability information representing the reliability of the reactivity information into divided regions. Calculate every time. Specifically, the reliability calculation unit 442 calculates the hybridization value and the reliability for each spot area. In addition, the reliability calculation unit 442 combines the respective divided regions of the plurality of corresponding reaction regions used for the measurement under the same conditions, and combines the combination reactivity information as the combination reactivity information and the reliability of the combination. The combination reliability information as information is calculated for each combination, and the combination reactivity information of the combination having the largest combination reliability information is set as the reactivity information of the reaction region. The selection unit 443 calculates a multiplication value of the reliability and the spot reliability in the target spot area, and is executed based on the feature vector extracted by the feature extraction unit 86 as necessary. The determination result of the reliability of the spot by the automatic learning unit 31 is acquired, and an in-spot region is selected based on these results. The output unit 444 outputs the hybridization value and reliability in spot units.

次に、図22のフローチャートを参照して、図6のステップS39において実行される、ハイブリダイズ値と信頼度の計算処理の詳細について説明する。   Next, the details of the hybrid value and reliability calculation process executed in step S39 of FIG. 6 will be described with reference to the flowchart of FIG.

ステップS201において、分割部441はスポット内領域を分割する。すなわち、スポット領域が、デブリを含むスポット内領域と、デブリを含まないスポット内領域に分割される。例えば図23に示される例では、スポット境界461の内部のスポット領域462内に、面積を有しないデブリ464,465と、面積を有するデブリ463が存在する。面積を有しないデブリ464,465は、それがデブリであることが明確であるため、そのデータはこの段階で除去される。   In step S201, the dividing unit 441 divides the spot area. That is, the spot area is divided into an in-spot area including debris and an in-spot area not including debris. For example, in the example shown in FIG. 23, debris 464 and 465 having no area and debris 463 having an area exist in the spot region 462 inside the spot boundary 461. The debris 464, 465 that do not have an area are removed at this stage because it is clear that it is debris.

一方、面積を有するデブリ463は、スポット境界461の内部のスポット領域462内に位置し、スポット境界461とは交差していないため、上述したステップS63の処理において除去されない。   On the other hand, the debris 463 having an area is located in the spot region 462 inside the spot boundary 461 and does not intersect the spot boundary 461, and thus is not removed in the process of step S63 described above.

スポット領域内の任意の判断対象点がデブリ領域の内部の点であるのか外部の点であるのかは、次のようにして判定される。すなわち、デブリ境界が背景画像の最外境界線と1つの交点をもつかまたは交点をもたない場合、デブリ境界以外の背景画像の最外境界線上の任意の点から、チェックしたいスポット領域内の任意の対象点まで直線を引いて、デブリ境界との交点の数をカウントすると、カウント値が偶数であれば、その対象点はデブリ領域の外側の点となり、カウント値が奇数であれば、その対象点はデブリ領域の内側の点と判定することができる。   It is determined as follows whether an arbitrary determination target point in the spot area is an internal point or an external point in the debris area. In other words, if the debris boundary has one intersection with the outermost boundary line of the background image or does not have an intersection point, any point on the outermost boundary line of the background image other than the debris boundary is within the spot region to be checked. When a straight line is drawn to an arbitrary target point and the number of intersections with the debris boundary is counted, if the count value is an even number, the target point is outside the debris area, and if the count value is an odd number, The target point can be determined as a point inside the debris region.

そこで分割部441は、外側の所定の点から対象とする点まで直線を引いて、デブリ境界との交点数が奇数となったとき、その対象点はデブリ領域内であると認識する。ただし、直線とデブリ境界とが接する場合には、その接点は交点としては計数されない。   Therefore, the dividing unit 441 draws a straight line from a predetermined point on the outside to the target point, and recognizes that the target point is in the debris region when the number of intersections with the debris boundary becomes an odd number. However, when the straight line and the debris boundary contact each other, the contact point is not counted as an intersection.

例えば、図24に示される例で、最外境界線501の左上の点502から判定の対象とするスポット領域483内の点483Aまで直線503を引いた場合、直線503は、デブリ482のデブリ境界482Aと、デブリ481のデブリ境界481Aと交差する。すなわち、直線503は、デブリ482のデブリ境界482Aとは、点491,492,493,494の4個の点と交差し、また、デブリ481の境界481Aとは、点495において交差する。したがって、この場合、直線503は、5個の点でデブリ境界と交差する。交点の数が5個で奇数であるため、この場合においては、点483Aは、デブリ481の内側の点であると判定される。   For example, in the example shown in FIG. 24, when a straight line 503 is drawn from a point 502 at the upper left of the outermost boundary line 501 to a point 483A in the spot region 483 to be determined, the straight line 503 is the debris boundary of the debris 482. 482A and the debris boundary 481A of the debris 481 intersect. That is, the straight line 503 intersects the debris boundary 482A of the debris 482 with four points 491, 492, 493, and 494, and intersects the boundary 481A of the debris 481 at the point 495. Therefore, in this case, the straight line 503 intersects the debris boundary at five points. Since the number of intersections is five and is an odd number, in this case, the point 483A is determined to be an inner point of the debris 481.

図25は、スポット内領域を分割した場合の例を表している。この例においては、図23のスポット境界461を有するスポット領域462が、デブリ463を含むスポット内領域522と、デブリを含まないスポット内領域521とに分割されている。   FIG. 25 shows an example in which the spot area is divided. In this example, the spot area 462 having the spot boundary 461 in FIG. 23 is divided into an in-spot area 522 including debris 463 and an in-spot area 521 not including debris.

次に、ステップS202において、信頼度計算部442は、スポット内領域単位でハイブリダイズ値と信頼度を計算する。スポット内領域iのハイブリダイズ値ahi j(反応度情報)とスポット内領域の信頼度ari j(信頼度情報)は次式で表される。 Next, in step S202, the reliability calculation unit 442 calculates a hybridization value and a reliability for each spot area. Hybridization of the spot area i soybean value ah i j (reactivity information) and a spot in the area reliability ar i j (reliability information) is expressed by the following equation.

Figure 2007017282
Figure 2007017282

上記式(4)と式(5)において、iはスポットの番号を表し、jはそのスポットのスポット内領域の番号を表す。kはそのスポット内領域におけるピクセルの番号を表す。   In the above formulas (4) and (5), i represents the spot number, and j represents the number of the spot in the spot. k represents the number of the pixel in the spot area.

式(4)のhybridize(pfi jk)は図9に曲線191乃至194として表される式を意味し、pni jはスポット内領域jのピクセル数を表す。 The hybridize (pf i jk ) in the equation (4) means an equation represented as curves 191 to 194 in FIG. 9, and pn i j represents the number of pixels in the spot region j.

式(5)のconfidence(pfi jk)は、次の式(6)で表される。 Confidence of formula (5) (pf i jk) is expressed by the following equation (6).

Figure 2007017282
Figure 2007017282

式(6)における重み係数wcは、図9の曲線191乃至194の部分191A乃至194A,191B乃至194B以外の区間(高信頼度区間)の重み係数を表し、重み係数wsatは、図9の曲線191乃至194の部分191A乃至194A,191B乃至194Bの区間(低信頼度区間)の重みを表す。 The weighting factor w c in equation (6), portions 191A or 194A of the curve 191 through 194 in FIG. 9 represents a weighting factor of 191B to 194B other sections (high confidence interval), the weight coefficient w sat is 9 Represents the weights of the sections 191A to 194A and 191B to 194B (low reliability sections) of the curves 191 to 194.

2回の測定における対応するスポットの対応するピクセルの蛍光強度を、1回目の測定の蛍光強度を横軸とし、2回目の測定の蛍光強度を縦軸とする座標空間にプロットすると、図26に示されるように、2回の測定の蛍光強度により規定される点701は傾きが45度の直線702の近傍に散在する。理想的には、対応するスポットの対応する位置のピクセルの蛍光強度は一致するので、点701は、直線702上に位置することになる。しかしながら、実際にはばらつきが発生し、完全に直線702上に位置するわけではなく、その近傍に分布することになる。その分布のばらつきは、蛍光強度が比較的小さい場合に大きく、大きい場合に小さくなる傾向がある。すなわち、蛍光強度が小さい値ph1の設定された範囲703においては、分散が比較的大きく、蛍光強度が値ph1より大きい値ph2では、分散の値がそれより小さくなり、蛍光強度がさらに大きい値ph3では、範囲703の分散が最も小さくなる。式(6)の分散(variance(pf))は、予め設定された所定の範囲703の内部に位置する点701の分散として計算された値とされる。すなわち、式(6)のconfidence(pf)(信頼度情報)は、2つの生体物質(第1の生体物質と第2の生体物質)が第1の測定時にハイブリダイズして得られる第1の蛍光強度と、第2の測定時にハイブリダイズして得られる第2の蛍光強度の設定された範囲の分散の逆数(1/variance(pf))により規定される。 When the fluorescence intensity of the corresponding pixel of the corresponding spot in the second measurement is plotted in a coordinate space in which the fluorescence intensity of the first measurement is the horizontal axis and the fluorescence intensity of the second measurement is the vertical axis, FIG. As shown, the points 701 defined by the fluorescence intensity of the two measurements are scattered in the vicinity of a straight line 702 having an inclination of 45 degrees. Ideally, the points 701 are located on the straight line 702 because the fluorescence intensities of the pixels at the corresponding positions of the corresponding spots match. However, in actuality, variations occur, and they are not completely located on the straight line 702, but are distributed in the vicinity thereof. The distribution variation tends to be large when the fluorescence intensity is relatively small and small when the fluorescence intensity is large. That is, in the range 703 fluorescence intensity is set to a small value ph 1, the dispersion is relatively large, the fluorescence intensity values ph 1 greater than ph 2, the value of the variance is smaller than, the fluorescence intensity is further At a large value ph 3 , the variance in the range 703 is the smallest. The variance (variance (pf)) in Equation (6) is a value calculated as the variance of the points 701 located within a predetermined range 703 set in advance. That is, the confidence (pf) (reliability information) of the equation (6) is the first obtained by hybridizing two biological materials (first biological material and second biological material) at the time of the first measurement. It is defined by the reciprocal (1 / variance (pf)) of the dispersion in a set range of the second fluorescence intensity obtained by hybridization during the second measurement.

したがって、式(6)のconfidence(pf)は、過去に測定され、記憶されているデータからも演算することができるので、過去の資産としての蛍光画像を評価し、有効に利用することができる。このことはまた、蛍光画像を得る処理と、得られた蛍光画像を評価する処理とを別の装置で、異なるタイミングで行うことが可能になることを意味する。さらにこれを演算するために、蛍光画像以外の特別の画像を撮像する必要がないので、装置が複雑になったり、コスト高になること、あるいは処理ステップが多くなり、複雑になることが抑制される。   Accordingly, the confidence (pf) of the equation (6) can be calculated from data measured and stored in the past, and thus the fluorescence image as the past asset can be evaluated and used effectively. . This also means that the process for obtaining the fluorescence image and the process for evaluating the obtained fluorescence image can be performed by different devices at different timings. Furthermore, since it is not necessary to take a special image other than the fluorescent image to calculate this, it is possible to prevent the apparatus from becoming complicated, costly, or processing steps from being increased and complicated. The

ステップS203において、選択部443は、図28のフローチャートを参照して後述するスポット内領域選択処理を実行する。   In step S203, the selection unit 443 performs an in-spot area selection process which will be described later with reference to the flowchart of FIG.

そして、ステップS204において、図21の出力部444は、図35のフローチャートを用いて後述する、スポット単位でのハイブリダイズ値と信頼度の出力処理を実行し、処理は、図6のステップS39に戻り、ステップS40に進む。   In step S204, the output unit 444 in FIG. 21 executes the output processing of the hybridization value and reliability in units of spots, which will be described later using the flowchart in FIG. 35, and the processing is performed in step S39 in FIG. Return to step S40.

このような処理により、スポット単位でのハイブリダイズ値と信頼度が算出されて、出力される。   By such processing, the hybridization value and reliability in spot units are calculated and output.

ステップS203のスポット内領域選択処理を行うため、図21の選択部443は、図27に示されるような機能的構成を有している。すなわち、選択部443は、計算部721、判定部722、および設定部723により構成されている。   In order to perform the in-spot area selection processing in step S203, the selection unit 443 in FIG. 21 has a functional configuration as shown in FIG. That is, the selection unit 443 includes a calculation unit 721, a determination unit 722, and a setting unit 723.

計算部721は、スポット領域の蛍光強度とスポット周辺領域の蛍光強度を取得し、これらを基に、スポット信頼度を算出するとともに、スポット内領域における信頼度をスポット信頼度に基づいて補正する計算を行う。判定部722は、補正されたスポット内領域信頼度と所定の閾値との比較判定を行うとともに、必要に応じて、機械的学習部31による学習結果を用いて、特徴量抽出部86により抽出された特徴量ベクトルを用いた信頼度判定の結果に基づくスポットの信頼度の有無の判定を行う。設定部723は、判定部722による判定結果に基づいて、反応度情報の利用の可否を表すフラグを設定する。フラグは、例えば、信頼度情報、反応領域を不要な物質が含まれている領域と含まれていない領域とに分割した場合における分割領域の数、または、操作者からの指定(操作者により入力部29Bに入力される)に基づいて設定される。   The calculation unit 721 obtains the fluorescence intensity of the spot area and the fluorescence intensity of the spot peripheral area, calculates the spot reliability based on these, and calculates to correct the reliability in the in-spot area based on the spot reliability. I do. The determination unit 722 performs comparison determination between the corrected in-spot region reliability and a predetermined threshold, and is extracted by the feature amount extraction unit 86 using the learning result by the mechanical learning unit 31 as necessary. The presence / absence of spot reliability is determined based on the result of reliability determination using the feature vector. The setting unit 723 sets a flag indicating whether or not the reactivity information can be used based on the determination result by the determination unit 722. The flag is, for example, reliability information, the number of divided areas when the reaction area is divided into an area containing unnecessary substances and an area containing no unnecessary substances, or designation by the operator (input by the operator) Is input to the unit 29B).

この選択部443が図22のステップS203において実行するスポット内領域選択処理について、図28のフローチャートを参照して説明する。   The in-spot area selection process executed by the selection unit 443 in step S203 of FIG. 22 will be described with reference to the flowchart of FIG.

ステップS251において、計算部721は、対象とするスポット内領域における信頼度とスポット信頼度の乗算値を計算する。スポット内領域における信頼度は、式(5)で表されるari jであり、スポット信頼度は次式(7)で表される値である。 In step S251, the calculation unit 721 calculates a multiplication value of the reliability and the spot reliability in the target spot area. Confidence in the spot area is ar i j represented by the formula (5), the spot reliability is a value represented by the following formula (7).

Figure 2007017282
Figure 2007017282

式(7)における右辺の分母のスポット蛍光強度の平均値は、例えば、対象とされるスポットが図29におけるスポット738であった場合、このスポット738を構成するピクセルの蛍光値の平均値を意味する。また、式(7)の右辺の分子のスポット周辺蛍光強度の平均値は、スポット738の周辺の領域(この例の場合、スポット境界から、それと隣接するスポットのスポット境界との間の略1/2の位置までの範囲)であるスポット周辺739を構成するピクセルの蛍光値の平均値を意味する。   The average value of the spot fluorescence intensity in the denominator on the right side in Expression (7) means, for example, the average value of the fluorescence values of the pixels constituting the spot 738 when the target spot is the spot 738 in FIG. To do. In addition, the average value of the fluorescence intensity around the spot of the molecule on the right side of Equation (7) is the area around the spot 738 (in this example, approximately 1 / between the spot boundary and the spot boundary of the adjacent spot. The average value of the fluorescence values of the pixels constituting the spot periphery 739, which is a range up to the position 2).

スポット周辺蛍光強度の平均値が小さく、スポット蛍光強度の平均値が大きいほど、式(7)のスポット信頼度が大きい値(1に近い値)になる。   As the average value of the spot peripheral fluorescence intensity is smaller and the average value of the spot fluorescence intensity is larger, the spot reliability of Expression (7) becomes a larger value (a value closer to 1).

したがって、スポット内領域における信頼度ari j(式(5))にこのスポット信頼度を乗算することで、スポット内領域信頼度を補正することができる。 Therefore, by multiplying the spot reliability to the reliability ar i j in the spot area (Equation (5)), it is possible to correct the spot area reliability.

次に、ステップS252において、判定部722は、ステップS251の処理で補正されたスポット内領域信頼度が、予め設定されている閾値より小さいか否かを判定する。ステップS252において、補正されたスポット内領域信頼度が閾値より小さいと判定された場合、処理は、後述するステップS256に進む。   Next, in step S252, the determination unit 722 determines whether or not the intra-spot region reliability corrected in the process of step S251 is smaller than a preset threshold value. If it is determined in step S252 that the corrected in-spot region reliability is smaller than the threshold, the process proceeds to step S256 described later.

ステップS252において、補正されたスポット内領域信頼度が閾値より小さくないと判断された場合(すなわち、閾値と等しいかそれより大きい場合)、ステップS253において、特徴量抽出部86は、機械的学習を用いた信頼度の判定を実行するために必要な特徴量を抽出し、機械的学習部31のSVM91に供給する。抽出される特徴量には、例えば、プローブ−ターゲット結合強度行列、スポット領域の蛍光強度、スポット周辺領域の蛍光強度、スポット内領域に含まれるピクセル数、ハイブリダイズ値、および、スポット信頼度などがあり、どのような特徴量が用いられるかは、学習モード、すなわち、図39を用いて後述する学習処理において、学習処理のために抽出される特徴量によって決まる。   When it is determined in step S252 that the corrected in-spot region reliability is not smaller than the threshold value (that is, equal to or larger than the threshold value), in step S253, the feature amount extraction unit 86 performs mechanical learning. A feature amount necessary for executing the determination of the reliability used is extracted and supplied to the SVM 91 of the mechanical learning unit 31. The extracted feature quantity includes, for example, a probe-target binding intensity matrix, a fluorescence intensity of a spot area, a fluorescence intensity of a spot peripheral area, the number of pixels included in the spot area, a hybridization value, and a spot reliability. Yes, what kind of feature value is used is determined by the feature value extracted for the learning process in the learning mode, that is, the learning process described later with reference to FIG.

ステップS254において、機械的学習部31のSVM91は、スポット除去パターンデータベース92に記憶されている学習結果(図5のステップS11において取得されたスポット信頼度判定情報)を基に、ステップS253において供給された特徴量から、対応するスポットの信頼度の判定を実行する。   In step S254, the SVM 91 of the mechanical learning unit 31 is supplied in step S253 based on the learning result (spot reliability determination information acquired in step S11 of FIG. 5) stored in the spot removal pattern database 92. The reliability of the corresponding spot is determined from the feature amount.

SVMとは、統計的学習理論に基づく2クラスのパターン認識手法であり、学習により得られる特徴量空間において、最も他クラスと近い位置に存在する特徴量ベクトル(これをサポートベクトルと呼ぶ)を基準として、そのユークリッド距離が最も大きくなるような位置に識別境界を設定する(分離超平面による線形識別を行う)ことができるようになされている。   SVM is a two-class pattern recognition method based on statistical learning theory. In a feature quantity space obtained by learning, SVM is based on a feature quantity vector (this is called a support vector) that is closest to another class. As described above, it is possible to set an identification boundary at a position where the Euclidean distance becomes the largest (perform linear identification using a separation hyperplane).

すなわち、具体的には、SVM91は、図5のステップS11において取得されたスポット信頼度判定情報に示される特徴量空間において、ステップS253において供給された特徴量による特徴量ベクトルが、信頼性ありと信頼性なしのいずれのクラスに分類されるかを判定する。   Specifically, the SVM 91 determines that the feature quantity vector based on the feature quantity supplied in step S253 is reliable in the feature quantity space indicated in the spot reliability determination information acquired in step S11 of FIG. Determine which class is not reliable.

ここで、特徴量として用いられるのは、スポットの信頼性と相関性を有する値である。特徴量には、上述したように、例えば、プローブ−ターゲット結合強度行列、スポット領域の蛍光強度、スポット周辺領域の蛍光強度、スポット内領域に含まれるピクセル数、ハイブリダイズ値、および、スポット信頼度などがある。   Here, a value having a correlation with the reliability of the spot is used as the feature amount. As described above, the feature amount includes, for example, the probe-target binding intensity matrix, the fluorescence intensity of the spot area, the fluorescence intensity of the spot peripheral area, the number of pixels included in the in-spot area, the hybridization value, and the spot reliability. and so on.

例えば、プローブとターゲットの結合強度が高い場合、そのプローブにより構成されているスポットを用いた測定の信頼度は高いと考えられるが、プローブとターゲットの結合強度が低い場合、そのプローブにより構成されているスポットを用いた測定の信頼度は低いと考えられる。すなわち、プローブ−ターゲット結合強度行列は、スポット信頼度の判定の基準となる特徴量として用いるのに適している。プローブ−ターゲット結合強度行列は、上述したように、DNAチップ11に固有に対応付けられて求められるものであり、必要に応じて、入力部29Bから入力されたり、発現プロファイルデータ記憶部28に記憶されている発現プロファイルデータに記載されているものである。   For example, when the bond strength between the probe and the target is high, the reliability of the measurement using the spot formed by the probe is considered high, but when the bond strength between the probe and the target is low, the probe is configured by the probe. It is considered that the reliability of measurement using a spot is low. In other words, the probe-target bond strength matrix is suitable for use as a feature quantity that serves as a reference for determining spot reliability. As described above, the probe-target binding strength matrix is obtained in association with the DNA chip 11 and is input from the input unit 29B or stored in the expression profile data storage unit 28 as necessary. It is described in the expression profile data.

また、スポット領域の蛍光強度が非常に高い場合、図9を用いて説明した蛍光強度とハイブリダイズ量の関係を規定する式hybridizee(pf)の右側の端部の領域の部分191B乃至194Bに対応する信頼度の低い領域に対応する可能性がある。また、スポット領域の蛍光強度が非常に低い場合、図9を用いて説明した蛍光強度とハイブリダイズ量の関係を規定する式hybridizee(pf)の左側の端部の領域の部分191A乃至194Aに対応する信頼度の低い領域に対応する可能性がある。すなわち、スポット領域の蛍光強度は、スポット信頼度の判定の基準となる特徴量として用いるのに適している。 Further, when the fluorescence intensity of the spot region is very high, the right end portion of the region of the portion 191B through 194B of formula hybridize e (pf) defining the fluorescence intensity hybridized amount of relationship described with reference to FIG. 9 There is a possibility of corresponding to a low reliability area. Further, when the fluorescence intensity of the spot region is very low, the formula Hybridize e left end of the area of the portion 191A to 194A of the (pf) defining the fluorescence intensity hybridized amount of relationship described with reference to FIG. 9 There is a possibility of corresponding to a low reliability area. That is, the fluorescence intensity of the spot region is suitable for use as a feature amount that is a reference for determining the spot reliability.

そして、スポット周辺領域の蛍光強度が高い場合、例えば、図29に示されるように、デブリ領域735のデブリ境界736が、スポット731のスポット境界732の一部と重なっており、デブリ領域735は、スポット731と、スポット731に対して図中右側に隣接するスポット領域734を有するスポット733の全体を覆っている状態である可能性がある。このような場合においては、スポット領域を分離するようなデブリがなくとも、スポット全体を覆っているデブリにより、スポット領域内の蛍光強度の信頼性は低くなってしまう。すなわち、スポット周辺領域の蛍光強度は、スポット信頼度の判定の基準となる特徴量として用いるのに適している。   When the fluorescence intensity in the spot peripheral region is high, for example, as shown in FIG. 29, the debris boundary 736 of the debris region 735 overlaps a part of the spot boundary 732 of the spot 731, and the debris region 735 is There is a possibility that the spot 731 and the entire spot 733 having the spot region 734 adjacent to the right side in the drawing with respect to the spot 731 are covered. In such a case, even if there is no debris that separates the spot areas, the reliability of the fluorescence intensity in the spot areas becomes low due to the debris covering the entire spot. That is, the fluorescent intensity in the spot peripheral region is suitable for use as a feature amount that is a reference for determining the spot reliability.

また、スポット内領域に含まれるピクセル数が少ない場合、そのスポット内領域の面積は小さいので、そのスポット内領域がデブリであっても、そのデブリ領域が除去されることにより、スポット領域内の蛍光強度の信頼性は低下しない。しかしながら、スポット内領域に含まれるピクセル数が多い場合、そのスポット内領域の面積は大きいので、そのスポット内領域がデブリ領域であったとき、スポット領域内の蛍光強度の信頼性は低下する。例えば、図30に示されるように、溶液の乾燥状態が悪く、スポット内の溶液の濃度が不均一となってしまった場合や、図31に示されるように、洗浄時の水切りが不十分であったことなどにより、スポット内の溶液の濃度が偏ってしまった場合などのように、スポット内で非常に大きな領域がデブリとなった場合、スポット領域内のデブリの数が少なくても(すなわち、スポット内領域数が少なくても)、スポット領域内の蛍光強度の信頼性は低くなる。すなわち、スポット内領域に含まれるピクセル数、または、スポット内領域の面積を表す値は、スポット信頼度の判定の基準となる特徴量として用いるのに適している。   In addition, when the number of pixels included in the spot area is small, the area of the spot area is small. Therefore, even if the spot area is debris, the debris area is removed, so that the fluorescence in the spot area is reduced. Strength reliability is not reduced. However, when the number of pixels included in the spot area is large, since the area of the spot area is large, when the spot area is a debris area, the reliability of the fluorescence intensity in the spot area decreases. For example, as shown in FIG. 30, when the solution is poorly dried and the concentration of the solution in the spot becomes non-uniform, or as shown in FIG. 31, draining during washing is insufficient. If a very large area is debris in the spot, such as when the concentration of the solution in the spot is biased, the number of debris in the spot area is small (that is, Even if the number of regions in the spot is small), the reliability of the fluorescence intensity in the spot region is low. In other words, the number of pixels included in the in-spot region or a value representing the area of the in-spot region is suitable for use as a feature amount serving as a reference for determining the spot reliability.

また、例えば、ハイブリダイズ値が高い場合は、そのスポット領域には大きなデブリが存在しなかったり、ハイブリダイズを阻害する要因が少ないということなので、そのスポット領域の蛍光強度の信頼性は、ある程度確保できていると思われるが、これと比較して、ハイブリダイズ値が低い場合、そのスポット領域に備えられているプローブとターゲットとがハイブリダイズされない状態であることのみならず、例えば、そのスポット領域に大きなデブリが存在していたり、溶液の滴下が十分でないなど、なんらかのハイブリダイズを阻害する要因が存在していた状態を想定することができる。すなわち、何かの要因がハイブリダイズを阻害しているが、本来は十分ハイブリダイズしていたスポットであった可能性が残る。すなわち、ハイブリダイズ値が高い場合は、スポット信頼度が高いといえるが、ハイブリダイズ値が低い場合は、スポット信頼度が低い可能性がある。このことより、ハイブリダイズ値は、スポット信頼度の判定の基準となる特徴量として用いるのに適している。   Also, for example, if the hybridization value is high, there is no large debris in the spot area, or there are few factors that inhibit hybridization, so the reliability of the fluorescence intensity in the spot area is secured to some extent. Although it seems that the hybridization value is low compared to this, not only is the probe provided in the spot region and the target not hybridized, but also, for example, the spot region. It is possible to assume a state in which there is some factor that inhibits hybridization, such as large debris in the water or insufficient dripping of the solution. That is, although some factor has inhibited hybridization, there remains a possibility that the spot was originally a sufficiently hybridized spot. That is, when the hybridization value is high, it can be said that the spot reliability is high, but when the hybridization value is low, the spot reliability may be low. Thus, the hybridized value is suitable for use as a feature quantity that is a reference for determining the spot reliability.

そして、式(7)を用いて説明したスポット信頼度も、学習に用いられる特徴量として適しているのは言うまでもない。   Needless to say, the spot reliability described using Expression (7) is also suitable as a feature amount used for learning.

すなわち、学習モードの処理(図39を用いて後述する)において、例えば、図32に示されるように、リンクデータ745とスポットデータ746を有する発現プロファイルデータ744が、特徴量データとして、SVM91に提供される。また、この発現プロファイルデータ744に対応する発現プロファイル画像741における各スポットの画像が、ユーザインターフェース部29の表示部29Aに表示される。そして、ユーザは、ユーザインターフェース部29Bを操作することで、各スポットを採用スポット742とするか、または不採用スポット743とするかを指示する。不採用スポット743は、ユーザが目視により確認して、このスポットを用いた測定結果の信頼性を落としてしまうような大きなデブリ等が存在するため採用すべきではないと判断したスポットを意味する。これに対して採用スポット742は、デブリ等が存在せず、有効なハイブリダイゼーションが起きているとユーザが判断するスポットを意味する。図32においては、図中×印を付して示すスポットが不採用スポット743として指示されたスポットを表し、×印を付していないスポットが採用スポット742として指示されたスポットを表している。   That is, in the learning mode process (described later with reference to FIG. 39), for example, as shown in FIG. 32, expression profile data 744 having link data 745 and spot data 746 is provided to the SVM 91 as feature data. Is done. Further, an image of each spot in the expression profile image 741 corresponding to the expression profile data 744 is displayed on the display unit 29A of the user interface unit 29. Then, the user operates the user interface unit 29 </ b> B to instruct each spot to be the adopted spot 742 or the non-adopted spot 743. The non-adopted spot 743 means a spot that the user visually confirms and determines that it should not be adopted because there is a large debris or the like that reduces the reliability of the measurement result using this spot. On the other hand, the adopted spot 742 means a spot where the user determines that debris or the like does not exist and effective hybridization occurs. In FIG. 32, a spot indicated with an x mark in the drawing represents a spot designated as a non-adopted spot 743, and a spot not marked with an x mark represents a spot designated as an adopted spot 742.

学習モードにおいて、ユーザが、SVM91に対して、スポット毎に採用スポットまたは不採用スポットを指示することは、発現プロファイルデータ744のスポット毎のフラグf1乃至fmとしての教師データを指示することを意味する。 In the learning mode, the user, with respect SVM91, to instruct the adoption spot or Reject spot for each spot, to instruct the training data as a flag f 1 to f m of each spot in the expression profile data 744 means.

SVM91は、ユーザから指示された教師データf1乃至fmと、生徒データとしての発現プロファイルデータ744の各スポット毎のハイブリダイゼーション量ah、信頼度arなどの特徴量データとの関係を学習し、学習した結果をスポット除去パターンデータベース92に記憶する。 SVM91 learns the teacher data f 1 to f m which is instructed by the user, the hybridization amount ah for each spot in the expression profile data 744 as student data, the relationship between the feature amount data, such reliability ar, The learned result is stored in the spot removal pattern database 92.

なお、学習モードにおける処理の詳細については、図39乃至図41を用いて後述する。   Details of the processing in the learning mode will be described later with reference to FIGS.

図32に例示されたように、学習モードにおいて、多くのスポットについて学習を行うことで、スポット除去パターンデータベース92を予め構築しておくと、図33に示されるように、判定モードにおいて、スポット752のデータを有する発現プロファイル画像751から抽出された特徴量をSVM91に提供し、SVM91に、スポット除去パターンデータベース92を参照させて、発現プロファイル画像751の各スポット752のデータの採用または不採用を判定させることができる。   As illustrated in FIG. 32, when the spot removal pattern database 92 is constructed in advance by performing learning for many spots in the learning mode, as shown in FIG. The feature amount extracted from the expression profile image 751 having the following data is provided to the SVM 91, and the SVM 91 is referred to the spot removal pattern database 92 to determine whether the data of each spot 752 of the expression profile image 751 is adopted or not. Can be made.

すなわち、SVM91は、スポット除去パターンデータベース92を参照することで、発現プロファイル画像751のスポット752に対応して抽出された特徴量データに基づいて、各スポットを、採用スポット752A、または不採用スポット752Bとして判定する。図33においては、図中×印を付して示されているスポットが不採用スポット752Bと判定されたスポットであり、図中×印が付されていないスポットが採用スポット752Aと判定されたスポットである。   That is, the SVM 91 refers to the spot removal pattern database 92, and based on the feature amount data extracted corresponding to the spot 752 of the expression profile image 751, each spot is selected as the adopted spot 752A or the non-adopted spot 752B. Judge as. In FIG. 33, spots marked with an x mark in the figure are spots determined as non-adopted spots 752B, and spots not marked with an x mark in the figure are determined as adopted spots 752A. It is.

なお、SVMについては、Nello Cristianini, John Shawe-Taylor, An Introduction to Support Vector Machines and other kernel-based learning methods, Cambridgeに詳細な説明がある。   The SVM is described in detail in Nello Cristianini, John Shawe-Taylor, An Introduction to Support Vector Machines and other kernel-based learning methods, Cambridge.

そして、ステップS255において、判定部722は、そのスポット内領域が機械的学習による信頼度判定で採用されたかを判定する。   In step S <b> 255, the determination unit 722 determines whether the in-spot area has been adopted in the reliability determination by mechanical learning.

ステップS252において、補正されたスポット内領域信頼度が閾値より小さいと判定された場合、または、ステップS255において、そのスポット内領域が機械的学習による信頼度判定で採用されていないと判定された場合(そのスポット領域のデータに対して信頼性による破棄フラグが設定された場合)には、ステップS256において、設定部723は、そのスポット内領域データに信頼性による破棄フラグを設定し、処理は、図22のステップS203に戻り、ステップS204に進む。すなわち、この場合、今処理対象とされているスポット内領域のデータが信頼性を有するものではないということになる。そして、このスポット内領域のデータは、基本的には以後、利用されない。   When it is determined in step S252 that the corrected in-spot area reliability is smaller than the threshold value, or in step S255, it is determined that the in-spot area reliability is not adopted in the reliability determination by mechanical learning. In the case where the discard flag based on reliability is set for the data in the spot area, in step S256, the setting unit 723 sets the discard flag based on reliability in the area data in the spot. Returning to step S203 of FIG. 22, the process proceeds to step S204. That is, in this case, the data in the spot area that is currently processed is not reliable. The data in the spot area is basically not used thereafter.

これに対して、ステップS255において、対象とするスポット領域が機械的学習による信頼度判定で採用されたと判定された場合(信頼性による破棄フラグが設定されていない場合)、そのスポット領域のデータは、機械的学習によれば信頼度があることになるので、ステップS256の処理はスキップされる。すなわち、そのスポット内領域に対しては、信頼性による破棄フラグは設定されず、処理は、図22のステップS203に戻り、ステップS204に進む。   On the other hand, when it is determined in step S255 that the target spot area is adopted in the reliability determination by mechanical learning (when the discard flag based on reliability is not set), the data of the spot area is According to the machine learning, since there is reliability, the process of step S256 is skipped. That is, the discard flag based on reliability is not set for the in-spot region, and the process returns to step S203 in FIG. 22 and proceeds to step S204.

すなわち、補正されたスポット内信頼度が所定の閾値より低い場合においても、SVM91による判定によりスポットの信頼度があると判定された場合、そのスポット内領域データには信頼性による破棄フラグが設定されない。   In other words, even when the corrected in-spot reliability is lower than a predetermined threshold, if it is determined by the SVM 91 that there is a spot reliability, the reliability discard flag is not set in the spot area data. .

なお、機械的学習としては、SVMのほかにニューラルネットワークなどを採用することも可能である。   As the mechanical learning, a neural network or the like can be employed in addition to SVM.

このように、データ自体を実際に破棄するのではなく、破棄フラグをスポット内領域毎に設定しておくことで、以後、必要に応じてこのスポット内領域のデータを利用しないようにすることは勿論、逆に、このフラグを意図的に無視することで、そのデータを利用することも可能となる。   In this way, instead of actually destroying the data itself, it is possible to set the discard flag for each spot area so that the data in the spot area is not used as necessary. Of course, conversely, this data can be used by intentionally ignoring this flag.

なお、ステップS203のスポット内領域選択処理で、ユーザのマニュアル操作(操作者からの指定)により破棄フラグを設定するようにすることも可能である。例えば、図29の例では、デブリ領域735のデブリ境界736が、スポット731のスポット境界732の一部と重なっており、デブリ領域735は、スポット731と、図中右側に隣接するスポット内領域734を有するスポット733の全体を覆っている。このような画像が表示部29Aに表示されている状態において、ユーザがユーザインターフェース部29の入力部29Bを操作することで、スポット731,733に含まれるスポット内領域に対して、信頼性による破棄フラグを設定することができる。   It should be noted that the discard flag may be set by the user's manual operation (designated by the operator) in the spot area selection processing in step S203. For example, in the example of FIG. 29, the debris boundary 736 of the debris region 735 overlaps with a part of the spot boundary 732 of the spot 731, and the debris region 735 is adjacent to the spot 731 and the in-spot region 734 adjacent to the right side in FIG. It covers the entire spot 733 having In a state in which such an image is displayed on the display unit 29A, the user operates the input unit 29B of the user interface unit 29, so that the in-spot areas included in the spots 731 and 733 are discarded due to reliability. A flag can be set.

以上のようにして、ステップS203のスポット内領域選択処理が行われた後、ステップS204において、図21の出力部444は、図35のフローチャートを用いて後述する、スポット単位でのハイブリダイズ値と信頼度の出力処理を実行する。この処理を実行するため図21の出力部444は、例えば、図34に示されるような機能的構成を有している。同図に示されるように、出力部444は、判定部751、生成部752、計算部753、選択部754、および設定部755により構成されている。   As described above, after the in-spot region selection process in step S203 is performed, in step S204, the output unit 444 in FIG. 21 performs the hybridized value for each spot, which will be described later using the flowchart in FIG. Execute reliability output processing. In order to execute this processing, the output unit 444 in FIG. 21 has a functional configuration as shown in FIG. 34, for example. As shown in the figure, the output unit 444 includes a determination unit 751, a generation unit 752, a calculation unit 753, a selection unit 754, and a setting unit 755.

判定部751は、分割されたスポット数と閾値との比較判定を行う。生成部752は、スポット内領域の組み合わせを生成する。計算部753は、スポット単位でのハイブリダイズ量と信頼度を計算する。選択部754は、信頼度が最大となる組み合わせを選択する。設定部755は、発現プロファイルデータにおける各種フラグを設定する。   The determination unit 751 performs a comparison determination between the number of divided spots and a threshold value. The generation unit 752 generates a combination of in-spot areas. The calculation unit 753 calculates the amount of hybridization and the reliability in spot units. The selection unit 754 selects a combination having the maximum reliability. The setting unit 755 sets various flags in the expression profile data.

次に、図35のフローチャートを参照して、出力部444が実行するスポット単位でのハイブリダイズ値と信頼度の出力処理について説明する。   Next, with reference to the flowchart of FIG. 35, the output processing of the hybridization value and reliability in units of spots executed by the output unit 444 will be described.

ステップS301において、判定部751は、分割されたスポット数が予め設定されている所定の閾値より小さいかを判定する。すなわち、対応するプローブが固定されている複数のスポットのうち、図22のステップS201における処理により、スポット内領域に分割されたスポットの数が計数される。   In step S301, the determination unit 751 determines whether the number of divided spots is smaller than a predetermined threshold value set in advance. That is, among the plurality of spots to which the corresponding probes are fixed, the number of spots divided into the spot-internal regions is counted by the process in step S201 in FIG.

ステップS301において、分割されたスポット数が閾値より小さいと判定された場合には、ステップS302において、生成部752はスポット内領域の組み合わせを生成する。図36は、この組み合わせを説明するための図である。同図に示されるように、この例においては、n回の実験が行われたものとされ、各実験においては、1枚の基板の測定が行われるものとされている。すなわち、この図36には、第1回目の実験における基板11A1、第2回目の実験における基板11A2、第n回目の実験における基板11Anといったようにしてn個の基板が示されている。各基板の対応する位置のスポットには、対応するプローブが固定されている。なお、実際には、対応するスポットは異なる実験におけるスポットである必要はなく、同じ実験の異なる基板、あるいは同じ基板の異なる位置のスポットであってもよい。 If it is determined in step S301 that the number of divided spots is smaller than the threshold value, in step S302, the generation unit 752 generates a combination of in-spot areas. FIG. 36 is a diagram for explaining this combination. As shown in the figure, in this example, n experiments were performed, and in each experiment, one substrate was measured. That is, FIG. 36 shows n substrates such as the substrate 11A 1 in the first experiment, the substrate 11A 2 in the second experiment, and the substrate 11A n in the nth experiment. . A corresponding probe is fixed to a spot at a corresponding position on each substrate. Actually, the corresponding spot does not need to be a spot in a different experiment, and may be a different substrate in the same experiment, or a spot at a different position on the same substrate.

例えば、基板11A1の図中右上のスポット7711、基板11A2の右上のスポット7712、そして基板11Anの右上のスポット771nが、それぞれ対応するスポットである。基板11A1のスポット7711は、3つの領域に分割されている。この図36においては、各スポット内領域は、文字Rで示されている。文字Rの下付の数字は基板(実験番号)を表し、上付の数字はそのスポットにおけるスポット内領域(分割領域)の番号を表す。例えば、スポット7711はスポット内領域R1 1,R1 2,R1 3の3つに分割されている。そして、スポット内領域R1 1のハイブリダイズ量(式(4)で表される)はah1 1とされ、スポット内領域R1 2のハイブリダイズ量はah1 2とされ、スポット内領域R1 3のハイブリダイズ量はah1 3とされている。基板11A2のスポット7712のスポット内領域はR2 1の1個とされ、そのハイブリダイズ量はah2 1とされている。さらに、n回目の実験の基板11Anのスポット771nは、スポット内領域Rn 1とRn 2の2つに分割され、それぞれのハイブリダイズ量はahn 1、またはahn 2とされている。 For example, the spot 771 1 in the upper right in the figure in the substrate 11A 1, top right spot 771 2 of the substrate 11A 2, and the upper right spot 771 n of the substrate 11A n is a corresponding spot, respectively. The spot 771 1 of the substrate 11A 1 is divided into three regions. In FIG. 36, each spot area is indicated by the letter R. The subscript number of the letter R represents the substrate (experiment number), and the superscript number represents the number of the in-spot region (divided region) at that spot. For example, the spot 771 1 is divided into three spots in the region R 1 1, R 1 2, R 1 3. The hybridizing amount of the in-spot region R 1 1 (represented by the formula (4)) is ah 1 1 , the hybridizing amount of the in-spot region R 1 2 is ah 1 2, and the in-spot region R The amount of hybridization of 1 3 is ah 1 3 . The area within the spot of the spot 771 2 of the substrate 11A 2 is one R 2 1 and the amount of hybridization is ah 2 1 . Further, the spot 771 n of the substrate 11A n in the n-th experiment is divided into two regions R n 1 and R n 2 in the spot, and the amount of each hybridization is ah n 1 or ah n 2. Yes.

スポット内領域を組み合わせる場合には、各基板のスポットから1つのスポット内領域が選択される。例えば、図37に示されるように、スポット7711には、スポット内領域R1 1,R1 2,R1 3の3個の領域が存在するため、そのうちの1つが選択される。スポット7712には、1個のスポット内領域R2 1しか存在しないので、このスポットにおいては、この領域のみが選択される。そして、スポット771nにおいては、スポット内領域Rn 1とRn 2の2個の領域があるので、そのいずれか一方が選択される。その結果、例えば、n=3の場合、6(=3×1×2)通りの組み合わせが考えられる。 When combining the in-spot regions, one in-spot region is selected from the spots on each substrate. For example, as shown in FIG. 37, the spot 771 1 includes three regions, that is, the in-spot regions R 1 1 , R 1 2 , and R 1 3 , and one of them is selected. Since only one in-spot region R 2 1 exists in the spot 771 2 , only this region is selected in this spot. In the spot 771 n , since there are two areas of the spot areas R n 1 and R n 2 , one of them is selected. As a result, for example, when n = 3, 6 (= 3 × 1 × 2) combinations are possible.

具体的には、スポット内領域としてR1 1−R2 1−R3 1,R1 2−R2 1−R3 1,R1 3−R2 1−R3 1,R1 1−R2 1−R3 2,R1 2−R2 1−R3 2,R1 3−R2 1−R3 2の6通りの組み合わせが考えられる。 Specifically, R 1 1 -R 2 1 -R 3 1 , R 1 2 -R 2 1 -R 3 1 , R 1 3 -R 2 1 -R 3 1 , R 1 1 -R are used as the in-spot regions. Six combinations of 2 1 -R 3 2 , R 1 2 -R 2 1 -R 3 2 , R 1 3 -R 2 1 -R 3 2 are conceivable.

ステップS303において、計算部753は、スポット単位でのハイブリダイズ量と信頼度を計算する。具体的には、次の式(8)と式(9)が計算される。   In step S303, the calculation unit 753 calculates the amount of hybridization and the reliability in units of spots. Specifically, the following equations (8) and (9) are calculated.

Figure 2007017282
Figure 2007017282

式(8)乃至式(10)におけるiは実験の回数を表し、図36における実験の番号を表す(i=1,2,・・・,n)。   In Expressions (8) to (10), i represents the number of experiments, and represents the experiment number in FIG. 36 (i = 1, 2,..., N).

pniは、組み合わせを構成するスポット内領域の中のi回目の実験におけるスポット内領域のピクセル数を表す。Snは組み合わせを構成するスポット内領域の総ピクセル数を表す。例えば、図37における1つの組み合わせを構成するスポット内領域R1 1,R2 1,R3 1のピクセル数の総和を表す。 pn i represents the number of pixels in the spot area in the i-th experiment in the spot area constituting the combination. Sn represents the total number of pixels in the spot area constituting the combination. For example, it represents the sum of the number of pixels of the in-spot regions R 1 1 , R 2 1 , R 3 1 constituting one combination in FIG.

式(8)のahiは、組み合わせを構成するスポット内領域の中のi番目のスポット内領域のハイブリダイズ量を表し、具体的には、式(4)で表される。また、式(9)のariは、組み合わせを構成するスポット内領域の中のi番目のスポット内領域の信頼度を表し、具体的には式(5)で表される。 Ah i of equation (8) represents a hybridized amount of the i-th spot area within the spot region constituting the combination, specifically, the formula (4). Moreover, ar i of formula (9) represents the reliability of the i-th spot area within the spot region constituting the combination is specifically represented by the formula (5).

すなわち、式(8)のShはスポット内領域の組み合わせのハイブリダイズ量を表し、式(9)のSrはスポット領域内の組み合わせの信頼度を表すことになる。   That is, Sh in Expression (8) represents the amount of hybridization of the combination in the spot area, and Sr in Expression (9) represents the reliability of the combination in the spot area.

次に、ステップS304において、選択部754は信頼度が最大(分散が最小)となる組み合わせを選択する。すなわち、ステップS303において計算された各組み合わせの信頼度Srの中から最大のものが選択され、処理は、図22のステップS204に戻り、図6のステップS40に進む。   Next, in step S304, the selection unit 754 selects a combination having the maximum reliability (minimum variance). That is, the maximum one is selected from the reliability Sr of each combination calculated in step S303, and the process returns to step S204 in FIG. 22 and proceeds to step S40 in FIG.

例えば、図37の例においては、6個のスポット内領域の組み合わせが考えられるので、各スポット内領域の組み合わせR1 1−R2 1−R3 1乃至R1 3−R2 1−R3 2のそれぞれにおける信頼度Sr1乃至Sr6のうち、最大の値の組み合わせが求められる。例えば、信頼度Sr1乃至Sr6のうちSr1が最も大きい場合には、このスポット内領域の組み合わせR1 1−R2 1−R3 1の組み合わせが選択される。 For example, in the example of FIG. 37, since combinations of six in-spot regions are conceivable, combinations of in-spot regions R 1 1 -R 2 1 -R 3 1 to R 1 3 -R 2 1 -R 3 Among the reliability Sr 1 to Sr 6 in each of the two , the combination of the maximum values is obtained. For example, when Sr 1 is the highest among the reliability levels Sr 1 to Sr 6 , the combination of the in-spot regions R 1 1 -R 2 1 -R 3 1 is selected.

ステップS301において、分割されたスポット数が閾値と等しいかそれより大きいと判定された場合には、ステップS302乃至ステップS304の処理はスキップされる。そして、ステップS305において、設定部755は、信頼性による破棄フラグを設定し、処理は、図22のステップS204に戻り、図6のステップS40に進む。   If it is determined in step S301 that the number of divided spots is equal to or greater than the threshold value, the processes in steps S302 to S304 are skipped. In step S305, the setting unit 755 sets a reliability discard flag, and the process returns to step S204 in FIG. 22 and proceeds to step S40 in FIG.

すなわち、例えば図36に示される対応するn個のスポット7711乃至771nのうち、閾値n1より多いn2個のスポットがスポット内領域に分割されたような場合、これらのスポットはデブリが多いスポットであり、測定環境自体に何らかの問題がある可能性がある。そこで、このような場合には、スポットそのもののデータの信頼性が既に損なわれていると考えられるので、このようなスポットに対しては信頼性による破棄フラグが設定される。 That is, for example, when n 2 spots larger than the threshold n 1 among the corresponding n spots 771 1 to 771 n shown in FIG. There are many spots, and there may be some problem in the measurement environment itself. Therefore, in such a case, it is considered that the reliability of the data of the spot itself has already been impaired, so a discard flag based on the reliability is set for such a spot.

図38は、図5のステップS14において、図3の出力部146から記憶部147(図1の発現プロファイルデータ記憶部28)に供給され、記憶される発現プロファイルデータのフォーマットを表している。同図に示されるように、発現プロファイルデータ801は、スポット数N、繰り返し実験回数n、並びに各組み合わせのデータにより構成される。1回の実験における1つのプローブのスポットが1個である場合には、スポット数Nは繰り返し実験回数nと等しくなる。m個の各組み合わせのデータは、第1乃至第mの各組み合わせのハイブリダイズ量Sh1乃至Shm、信頼度Sr1乃至Srm、フラグf1乃至fm、並びにその組み合わせを構成するスポットデータの位置を表すポインタP1乃至Pmにより構成されている。例えば、ポインタP1は、第1の組み合わせのポインタであり、第1の組み合わせのリンクデータ802の記憶位置を表している。リンクデータ802は、スポット数N、並びに第1乃至第Nの各スポットデータへのポインタP11乃至P1Nにより構成されている。 FIG. 38 shows the format of the expression profile data supplied and stored in step S14 of FIG. 5 from the output unit 146 of FIG. 3 to the storage unit 147 (expression profile data storage unit 28 of FIG. 1). As shown in the figure, the expression profile data 801 includes the number of spots N, the number n of repeated experiments, and data of each combination. When there is one spot of one probe in one experiment, the number of spots N is equal to the number n of repeated experiments. The data of each of the m combinations includes the amount of hybridization Sh 1 to Sh m , the reliability Sr 1 to Sr m , the flags f 1 to f m of each of the first to mth combinations, and the spot data constituting the combination The pointers P 1 to P m representing the positions of For example, the pointer P 1 is a pointer of the first combination and represents the storage position of the link data 802 of the first combination. The link data 802 includes the number of spots N and pointers P 11 to P 1N to the first to Nth spot data.

例えば、ポインタP11は、第1の組み合わせの第1のスポットのスポットデータの記憶位置を表している。 For example, the pointer P 11 represents the storage position of the spot data of the first spot of the first combination.

スポットデータ803は、そのスポットを構成するスポット内領域の数an、選択されたスポット内領域番号selected-no、並びにスポット信頼度を有している。このスポット信頼度は、式(7)で表される値である。   The spot data 803 has the number of spot areas an constituting the spot an, the selected spot area number selected-no, and the spot reliability. This spot reliability is a value represented by Expression (7).

スポットデータ803は、さらに、そのスポットを構成するスポット内領域毎のハイブリダイズ量ah、信頼度ar、ピクセル数pn、並びにフラグfにより構成されている。図38には、第1のスポットの第1乃至第3のスポット内領域のハイブリダイズ量ah1 1,ah1 2,ah1 3、信頼度ar1 1,ar1 2,ar1 3、ピクセル数pn1 1,pn1 2,pn1 3、フラグf1 1,f1 2,f1 3が示されている。 The spot data 803 further includes a hybridization amount ah, a reliability ar, a pixel number pn, and a flag f for each in-spot region constituting the spot. FIG. 38 shows the amounts of hybridization ah 1 1 , ah 1 2 , ah 1 3 , reliability ar 1 1 , ar 1 2 , ar 1 3 , pixels in the first to third spot regions of the first spot. Numbers pn 1 1 , pn 1 2 , pn 1 3 , and flags f 1 1 , f 1 2 , and f 1 3 are shown.

次に、図5のステップS11において取得されるスポット信頼度判定情報を得るための学習処理について説明する。学習処理は、図1を用いて説明した生体情報処理装置1の学習モードにおいて実行することができる。   Next, the learning process for obtaining the spot reliability determination information acquired in step S11 of FIG. 5 will be described. The learning process can be executed in the learning mode of the biological information processing apparatus 1 described with reference to FIG.

なお、学習処理を行った生体情報処理装置と、その学習結果であるスポット信頼度判定情報を用いたスポットの信頼度の判定を実行して、遺伝子発現量の定量的な測定を行う生体情報処理装置とは、同一の装置であっても良いし、異なる装置であっても良い。   The biological information processing apparatus that performs quantitative measurement of the gene expression level by performing determination of the reliability of the spot using the biological information processing apparatus that has performed the learning process and the spot reliability determination information that is the learning result thereof The devices may be the same device or different devices.

また、特徴量データと教師データの収集も、学習処理を行う装置とは異なる装置において実行することができる。すなわち、複数の装置において、学習に用いる特徴量データと、教師データとを収集し、多くのサンプルデータに基づいて、1つの装置のSVM91において学習を行うことにより、より精度の良い判定を行うことが可能なスポット信頼度判定情報を得ることができる。   Further, the collection of the feature amount data and the teacher data can also be executed by a device different from the device that performs the learning process. That is, more accurate determination is performed by collecting feature amount data used for learning and teacher data in a plurality of devices, and performing learning in the SVM 91 of one device based on a large amount of sample data. Can be obtained.

また、スポット信頼度判定情報を求めたSVM91を含む生体情報処理装置1とは異なる生体情報処理装置1において、スポット信頼度判定情報をスポット除去パターンデータベース92に保存し、判定モードにおいて、SVM91が、保存されているスポット信頼度判定情報を基に、スポット信頼度を判定するようにすることにより、多くの装置で共通の学習結果を 利用することができるので、人が目視での判定を行う場合と比較して、検査者による検査結果のばらつきの発生を防止することが可能となる。   Further, in the biological information processing apparatus 1 different from the biological information processing apparatus 1 including the SVM 91 for which the spot reliability determination information is obtained, the spot reliability determination information is stored in the spot removal pattern database 92, and in the determination mode, the SVM 91 By making the spot reliability determination based on the stored spot reliability determination information, a common learning result can be used in many devices. In comparison with this, it is possible to prevent the occurrence of variations in the inspection results by the inspector.

図39のフローチャートを参照して、学習処理について説明する。   The learning process will be described with reference to the flowchart of FIG.

ステップS351において、ハイブリダイズ量推定部24は、画像データを取得する。すなわち、図4を用いて説明した実験過程の処理1と同様の処理により、学習処理に用いられるターゲットが調整されて、ハイブリダイズが実行され、図7を用いて説明した蛍光強度データに含まれる発現プロファイル画像データが取得されるか、または、発現プロファイルデータ記憶部28に記憶されている図8を用いて説明した発現プロファイルデータに含まれる発現プロファイル画像データが取得される。   In step S351, the hybridization amount estimation unit 24 acquires image data. That is, the target used for the learning process is adjusted and hybridized by the same process as the process 1 of the experimental process described with reference to FIG. 4, and is included in the fluorescence intensity data described with reference to FIG. Expression profile image data is acquired, or expression profile image data included in the expression profile data described with reference to FIG. 8 stored in the expression profile data storage unit 28 is acquired.

ステップS352において、図40を用いて後述する特徴量抽出処理が実行される。   In step S352, a feature amount extraction process to be described later with reference to FIG. 40 is executed.

ステップS353において、ユーザインターフェース部29は、取得された発現プロファイル画像を表示部29Aに表示する。そして、ステップS354において、入力部29Bは、ユーザから、スポット領域ごとに、信頼度の有無、具体的には、図32を用いて説明した図中×印を付して示す不採用スポット743の指示の入力を受け、SVM91に供給する。   In step S353, the user interface unit 29 displays the acquired expression profile image on the display unit 29A. In step S354, the input unit 29B receives the presence / absence of reliability for each spot area from the user, specifically, the non-adopted spot 743 indicated by a cross in the drawing described with reference to FIG. An instruction input is received and supplied to the SVM 91.

ステップS355において、SVM91は、ステップS373において入力された、スポット領域ごとの信頼度の有無を教師データとして、学習処理を行う。   In step S355, the SVM 91 performs a learning process using the presence / absence of reliability for each spot area input in step S373 as teacher data.

SVMは、統計的学習理論に基づく2クラスのパターン認識手法であり、学習データの中で最も他クラスと近い位置にある特徴ベクトル(これをサポートベクトルと称する)を基準として、それぞれのクラスのサポートベクトルとのユークリッド距離が最も大きくなるような位置に識別境界を設定し、その識別境界に基づいて、パターン認識を行うものである。具体的には、SVM91は、学習モードにおいて得られる特徴量ベクトルと教師信号としての信頼度の有無(例えば、図32を用いて説明した採用スポット742または不採用スポット743の情報)を基に、学習処理を行うことにより、特徴量空間に、信頼度ありと信頼度なしのそれぞれのクラスを分割する識別境界を設定することができる。そしてSVM91は、判定モードにおいては、上述したように、学習結果であるスポット信頼度判定情報、すなわち、特徴量空間における識別境界と供給された特徴量ベクトルを基に、対応するスポットの信頼度の有無を判定することができる。   SVM is a pattern recognition method of two classes based on statistical learning theory, and supports each class based on a feature vector (this is called a support vector) that is closest to another class in the learning data. An identification boundary is set at a position where the Euclidean distance from the vector is the largest, and pattern recognition is performed based on the identification boundary. Specifically, the SVM 91 is based on the feature amount vector obtained in the learning mode and the presence or absence of reliability as a teacher signal (for example, information on the adopted spot 742 or the non-adopted spot 743 described with reference to FIG. 32). By performing the learning process, it is possible to set an identification boundary that divides each class with reliability and without reliability in the feature amount space. In the determination mode, as described above, the SVM 91 determines the reliability of the corresponding spot based on the spot reliability determination information as the learning result, that is, based on the identification boundary in the feature amount space and the supplied feature amount vector. Presence / absence can be determined.

ステップS356において、SVM91は、学習結果をスポット除去パターンデータベース92に供給して記憶させ、処理が終了される。   In step S356, the SVM 91 supplies the learning result to the spot removal pattern database 92 for storage, and the process is terminated.

このような処理により、SVMを用いた学習処理が行われ、学習結果であるスポット信頼度判定情報、すなわち、特徴量空間におけるクラスの識別境界(信頼度の有り無しの境界)を求めて記憶することができる。判定モードにおいては、このスポット信頼度判定情報を基に、スポットに対応する特徴量ベクトルに基づいて信頼度の有無が判定される(求められた識別境界に対して、供給された特徴量ベクトルが信頼度ありと信頼度なしのいずれのクラスに分類されるかが判定される)。   By such processing, learning processing using SVM is performed, and spot reliability determination information as a learning result, that is, class identification boundaries (boundaries with or without reliability) in the feature amount space are obtained and stored. be able to. In the determination mode, based on the spot reliability determination information, the presence / absence of reliability is determined based on the feature vector corresponding to the spot (the supplied feature vector is determined with respect to the obtained identification boundary). It is determined whether the class is classified as reliable or not reliable).

次に、図40のフローチャートを参照して、図39のステップS352において実行される、特徴量抽出処理について説明する。   Next, the feature quantity extraction process executed in step S352 of FIG. 39 will be described with reference to the flowchart of FIG.

ステップS381において、励起光強度推定部81は、画像情報を入力する。具体的には、励起光強度推定部81は、蛍光強度取得部22から図4を用いて説明した処理により得られる蛍光強度データの供給を受けるか、または、発現プロファイルデータ記憶部28に記憶されている発現プロファイルデータの供給を受ける。すなわち、学習処理は、上述した実験過程処理装置131によって、実験過程の処理1において、ターゲットが調整され、ハイブリダイズされたDNAチップ11の蛍光強度を取得して、これを用いて行うことも可能であり、他の装置によって得られた発現プロファイルデータを用いて行うことも可能である。   In step S381, the excitation light intensity estimation unit 81 inputs image information. Specifically, the excitation light intensity estimation unit 81 receives supply of fluorescence intensity data obtained by the process described with reference to FIG. 4 from the fluorescence intensity acquisition unit 22 or is stored in the expression profile data storage unit 28. Is supplied with expression profile data. That is, the learning process can be performed using the above-described experimental process processing device 131 by acquiring the fluorescence intensity of the hybridized DNA chip 11 with the target adjusted in the experimental process 1. It is also possible to use expression profile data obtained by other devices.

ステップS382乃至ステップS387において、図6のステップS32乃至ステップS37と基本的に同一の処理が実行される。   In steps S382 to S387, basically the same processing as in steps S32 to S37 of FIG. 6 is executed.

すなわち、励起光強度推定部81は、図8を用いて説明した発現プロファイルデータ記憶部28に記憶されている発現プロファイルデータの供給を受けた場合、入力された画像情報に励起光強度情報があるか否かを判定する。励起光強度情報が存在しないと判定された場合、励起光強度推定部81は、蛍光強度−ハイブリダイズ量変換式記憶部30に記憶されている蛍光強度−ハイブリダイズ量変換式を用いて、励起光強度が推定される。   That is, when the excitation light intensity estimation unit 81 is supplied with the expression profile data stored in the expression profile data storage unit 28 described with reference to FIG. 8, the input image information includes excitation light intensity information. It is determined whether or not. When it is determined that the excitation light intensity information does not exist, the excitation light intensity estimation unit 81 uses the fluorescence intensity-hybridization amount conversion expression stored in the fluorescence intensity-hybridization amount conversion expression storage unit 30 to perform excitation. The light intensity is estimated.

そして、発現プロファイルデータの供給を受けていないと判断された場合、すなわち、図7を用いて説明した光強度取得部22より供給される蛍光強度データの供給を受けた場合、作成部82は、入力された画像情報が複数の励起光強度で撮影した画像の画像情報であるか否かを判定する。複数の励起光強度で撮影した画像の画像情報であると判断された場合、作成部82は、蛍光強度に基づいてハイブリダイズ量を決定する(hybridize(pf))(上述した式(1))を作成する。   When it is determined that the expression profile data is not supplied, that is, when the fluorescence intensity data supplied from the light intensity acquisition unit 22 described with reference to FIG. It is determined whether the input image information is image information of an image captured with a plurality of excitation light intensities. When it is determined that the image information is an image captured with a plurality of excitation light intensities, the creation unit 82 determines the amount of hybridization based on the fluorescence intensity (hybridize (pf)) (the above-described equation (1)). Create

そして、画像処理部83は、図11のフローチャートを用いて説明した画像処理を行うので、DNAチップ11の画像からスポット境界を跨ぐデブリ領域が除去され、画像は各スポット毎の画像に分解される。   Since the image processing unit 83 performs the image processing described with reference to the flowchart of FIG. 11, the debris region straddling the spot boundary is removed from the image of the DNA chip 11, and the image is decomposed into images for each spot. .

ステップS388において、検証部84は、図6のステップS35の処理と同様にして、ハイブリダイズを検証する処理を実行する。具体的には、ハイブリダイズ検証用プローブ111,114の蛍光値を測定し、その蛍光値が、予め設定されている基準値以上であれば、正しいハイブリダイズ処理が行われていることを検証することができる。   In step S388, the verification unit 84 executes a process for verifying hybridization in the same manner as the process in step S35 of FIG. Specifically, the fluorescence values of the hybridization verification probes 111 and 114 are measured, and if the fluorescence values are equal to or higher than a preset reference value, it is verified that correct hybridization processing is performed. be able to.

ステップS389において、ハイブリダイズ量計算部85の分割部441は、図22のステップS201の処理と同様に、スポット内領域を分割する。例えば、図23を用いて説明したように、スポット領域が、デブリを含むスポット内領域と、デブリを含まないスポット内領域に分割され、面積を有しないデブリ464,465は、それがデブリであることが明確であるため除去される。   In step S389, the dividing unit 441 of the hybridization amount calculating unit 85 divides the spot area, similarly to the process in step S201 of FIG. For example, as described with reference to FIG. 23, the spot region is divided into an in-spot region including debris and an in-spot region not including debris, and debris 464 and 465 having no area are debris. It is removed because it is clear.

ステップS390において、ハイブリダイズ量計算部85の信頼度計算部442は、図22のステップS202の処理と同様に、スポット内領域単位でハイブリダイズ値と信頼度を計算する。スポット内領域iのハイブリダイズ値ahi j(反応度情報)とスポット内領域の信頼度ari j(信頼度情報)は上述した式(4)と式(5)で表される。 In step S390, the reliability calculation unit 442 of the hybridization amount calculation unit 85 calculates the hybridization value and the reliability for each spot area, as in the process of step S202 of FIG. Hybridization of the spot area i soybean value ah i j (reactivity information) and a spot in the area reliability ar i j (reliability information) is represented by the above-mentioned equations (4) Equation (5).

この処理により、例えば、スポット信頼度と、ハイブリダイズ量(スポット内領域のハイブリダイズ量の合計値)が特徴量として抽出される。これらの特徴量は、スポットの信頼度と相関があるので、信頼度判定に用いる特徴量として適している。   By this processing, for example, the spot reliability and the amount of hybridization (total value of the amount of hybridization in the spot area) are extracted as feature amounts. Since these feature quantities have a correlation with the reliability of the spot, they are suitable as the feature quantities used for the reliability determination.

ステップS391において、画像処理部83は、スポット領域の蛍光強度を取得する。具体的には、画像処理部388は、図29を用いて説明したスポット731、スポット733、スポット738などのそれぞれのスポットの蛍光強度を取得し、それぞれのスポットの位置情報とともに保持する。   In step S391, the image processing unit 83 acquires the fluorescence intensity of the spot area. Specifically, the image processing unit 388 acquires the fluorescence intensity of each spot such as the spot 731, the spot 733, and the spot 738 described with reference to FIG. 29 and holds them together with the position information of each spot.

スポット領域の蛍光強度が非常に高い場合、例えば、励起光強度が強すぎるためなどにより、図9を用いて説明したハイブリダイズ量の関係を規定する式hybridizee(pf)の右側の端部の領域の部分191B乃至194Bに対応する信頼度の低い状態に対応する可能性が高い。一方、スポット領域の蛍光強度が非常に暗い場合、例えば、励起光強度が弱すぎるか、溶液が均一に滴下されなかったり、均一に洗浄されなかったためなどにより、図9を用いて説明したハイブリダイズ量の関係を規定する式hybridizee(pf)の左側の端部の領域の部分191A乃至194Aに対応する信頼度の低い状態に対応する可能性が高い。すなわち、スポット領域の蛍光強度は、信頼度判定に用いる特徴量として適している。 If the fluorescence intensity of the spot region is very high, for example, due for excitation light intensity is too strong, the right end of the formula hybridize e (pf) defining a hybridized amount of relationship described with reference to FIG. 9 There is a high possibility of corresponding to a low reliability state corresponding to the region portions 191B to 194B. On the other hand, when the fluorescence intensity of the spot area is very dark, for example, the hybridization described with reference to FIG. 9 is performed because the excitation light intensity is too weak, the solution is not uniformly dropped, or is not washed uniformly. It is likely to correspond to the state of low reliability corresponding to the portion 191A or 194A of the area of the left end of the formula Hybridize e defines the relation (pf) amounts. That is, the fluorescence intensity of the spot region is suitable as a feature amount used for reliability determination.

ステップS392において、画像処理部83は、スポット周辺領域の蛍光強度を取得する。具体的には、画像処理部388は、図29を用いて説明したスポット周辺737、スポット周辺739などのそれぞれのスポット周辺領域の蛍光強度を取得し、それぞれのスポット周辺領域の位置情報とともに保持する。   In step S392, the image processing unit 83 acquires the fluorescence intensity of the spot peripheral area. Specifically, the image processing unit 388 acquires the fluorescence intensity of each spot peripheral region such as the spot periphery 737 and the spot periphery 739 described with reference to FIG. 29, and stores the fluorescence intensity together with the position information of each spot periphery region. .

スポット周辺領域の蛍光強度が非常に高い場合、例えば、図29に示されるように、スポットの範囲外に溶液が流れて、デブリ領域が1つまたは複数のスポットの全体を覆ってしまっている可能性がある。この状態は、目視により判定される場合、信頼度が低いと簡単に判定可能であるが、デブリの検出などにより自動的に信頼度を判定しようとした場合には、スポット領域の濃度は一律であるので、デブリがない状態として、蛍光強度が誤検出されてしまう恐れがある。しかしながら、スポット周辺領域の蛍光強度を特徴量として用いることにより、図29に示されるような場合のスポット信頼度を正確に判定する(目視により判定された場合を教師データとして学習する)ことが可能なようになされている。このように、スポット周辺領域の蛍光強度は、信頼度判定に用いる特徴量として適している。   When the fluorescence intensity in the spot peripheral region is very high, for example, as shown in FIG. 29, the solution may flow outside the spot range, and the debris region may cover the entire spot or spots. There is sex. This state can be easily determined if the reliability is low when visually determined, but if the reliability is automatically determined by detecting debris, the density of the spot area is uniform. Therefore, there is a possibility that the fluorescence intensity is erroneously detected in a state where there is no debris. However, it is possible to accurately determine the spot reliability in the case as shown in FIG. 29 by using the fluorescence intensity of the spot peripheral region as a feature amount (learning as a teacher data when determined visually). It is made like that. Thus, the fluorescence intensity in the spot peripheral region is suitable as a feature amount used for reliability determination.

ステップS393において、画像処理部83は、それぞれのスポット内領域に含まれるピクセル数を取得する。   In step S393, the image processing unit 83 acquires the number of pixels included in each spot area.

あるスポットにおいて、スポット内領域数が少なくても、そのスポット内領域に含まれるピクセル数が多い(スポット内領域の面積が大きい)場合、そのスポットには、例えば、図30または図31に示されるような、大きなデブリがある可能性が高いので、スポットの信頼度が低いと考えられるが、一方、あるスポットにおいて、スポット内領域に含まれるピクセル数が少ない(スポット内領域の面積が小さい)ものが多い場合、そのスポットに存在するデブリは小さいものばかりであると考えられる。スポット内領域に小さなデブリがある程度の数存在しても、デブリ除去処理が実行されることにより、このスポットの信頼度は高いと考えられる。このように、スポット領域内に含まれるピクセル数の情報は、信頼度判定に用いる特徴量として適している。   In a certain spot, when the number of pixels contained in the spot area is large (the area of the spot area is large) even if the number of areas in the spot is small, the spot is shown in FIG. 30 or FIG. 31, for example. The probability of large debris is high, so it is considered that the reliability of the spot is low. On the other hand, in a certain spot, the number of pixels included in the spot area is small (the area of the spot area is small). When there are many, it is thought that the debris which exists in the spot is only small. Even if there is a certain number of small debris in the spot area, it is considered that the reliability of this spot is high by executing the debris removal process. As described above, information on the number of pixels included in the spot area is suitable as a feature amount used for reliability determination.

ステップS394において、特徴量抽出部86は、以上の処理において抽出された特徴量を示す情報や、必要に応じて、入力部29Bにより入力された、または、発現プロファイルデータ記憶部28に記憶されているプローブ−ターゲット結合強度行列を取得し、特徴量データを生成して、処理は、図39のステップS352に戻り、ステップS353に進む。   In step S394, the feature amount extraction unit 86 receives information indicating the feature amount extracted in the above processing, and is input by the input unit 29B or stored in the expression profile data storage unit 28 as necessary. The acquired probe-target bond strength matrix is generated to generate feature data, and the process returns to step S352 in FIG. 39 and proceeds to step S353.

このような処理により、特徴量が抽出されて、特徴量データが生成される。この特徴量データを用いて、スポットごとの信頼度を判定するための学習が行われる。   Through such processing, feature amounts are extracted and feature amount data is generated. Learning for determining the reliability for each spot is performed using the feature amount data.

また、ここでは、異なる励起光強度を用いて得られた発現プロファイル画像データのペアは、励起光強度を推定したり、蛍光強度からハイブリダイズ量を一義的に決定する式hybridize(pf)を求めるために用いられるものとして説明したが、異なる励起光強度を用いて得られた発現プロファイル画像データを学習に用いることにより、教師データに対する特徴量を増加させることが可能となる。   In addition, here, pairs of expression profile image data obtained using different excitation light intensities are used to estimate the excitation light intensity, or to determine the hybridize (pf) that uniquely determines the amount of hybridization from the fluorescence intensity. However, it is possible to increase the feature amount for the teacher data by using the expression profile image data obtained by using different excitation light intensities for learning.

すなわち、図41に示されるように、同一のハイブリダイズ状態のDNAチップ11に対して複数の強度の励起光を照射した場合に得られる発現プロファイル画像データ741−1−1および741−2−1において、それぞれの特徴量データが抽出されて、それらが記載されたスポットデータ746を含む発現プロファイルデータ744−1および744−2が生成される。異なる励起光強度が照射された場合に得られる発現プロファイルデータ744−1および744−2に記載される特徴量は、多くの場合、異なる値となる。   That is, as shown in FIG. 41, the expression profile image data 741-1-1 and 741-2-1 obtained when the DNA chip 11 in the same hybridized state is irradiated with a plurality of excitation lights. , Each feature amount data is extracted, and expression profile data 744-1 and 744-2 including spot data 746 in which they are described are generated. In many cases, the feature amounts described in the expression profile data 744-1 and 744-2 obtained when different excitation light intensities are irradiated have different values.

しかしながら、この発現プロファイル画像データ741−1−1および741−2−1においては、同一のハイブリダイズ状態のDNAチップ11に対する蛍光強度を示すものであるので、同一のスポット位置ではスポット内ハイブリダイズ分布量は同一である。すなわち、教師データとしての採用スポット742または不採用スポット743は、発現プロファイル画像データ741−1−1および741−2−1において、同一のスポットに同様に付与される。   However, since the expression profile image data 741-1-1 and 741-2-1 indicate the fluorescence intensity with respect to the DNA chip 11 in the same hybridized state, the hybridization distribution within the spot at the same spot position. The amount is the same. That is, the adopted spot 742 or the non-adopted spot 743 as teacher data is similarly given to the same spot in the expression profile image data 741-1-1 and 741-2-1.

すなわち、異なる励起光強度を用いて得られた発現プロファイル画像データのペアを用いることにより、1つのスポットの教師データに対して、多くの特徴量ベクトルを対応付けることが可能となり、学習効果を向上させることができる。   That is, by using pairs of expression profile image data obtained by using different excitation light intensities, it becomes possible to associate many feature vectors with teacher data of one spot, thereby improving the learning effect. be able to.

このようにして、発現プロファイル画像データの取得条件を変化させ、同一のハイブリダイズ分布量において異なる特徴量データを得ることができるようにすることにより、学習を効果的に行うことができる。   In this way, learning can be effectively performed by changing the acquisition conditions of the expression profile image data so that different feature amount data can be obtained in the same hybridizing distribution amount.

また、ここでは、異なる2つの励起光強度を用いて発現プロファイル画像データが得られた場合について説明しているが、2種類以上の異なる励起光強度をもって発現プロファイルを得るようにした場合にも、同様に、多くの特徴量データを得て学習を効果的に行うことが可能であることは言うまでもない。   In addition, here, the case where the expression profile image data is obtained using two different excitation light intensities has been described, but also when the expression profile is obtained with two or more different excitation light intensities, Similarly, it goes without saying that it is possible to effectively learn by obtaining a large amount of feature data.

以上、DNAチップのハイブリダイゼーションを測定する場合の実施形態を説明したが、本発明はDNAチップに限らず、各種の生体物質が、他の所定の生体物質と生体結合したかどうかを測定する場合に適用することが可能である。   As described above, the embodiment in the case of measuring the hybridization of the DNA chip has been described. However, the present invention is not limited to the DNA chip. In the case of measuring whether various biological materials are biologically bound to other predetermined biological materials. It is possible to apply to.

上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、生体情報処理装置1は、図42に示されるようなパーソナルコンピュータ901により構成される。   The series of processes described above can be executed by hardware or can be executed by software. In this case, for example, the biological information processing apparatus 1 includes a personal computer 901 as shown in FIG.

図42において、CPU(Central Processing Unit)921は、ROM(Read Only Memory)922に記憶されているプログラム、または記憶部928からRAM(Random Access Memory)923にロードされたプログラムに従って各種の処理を実行する。RAM923にはまた、CPU921が各種の処理を実行するうえにおいて必要なデータなども適宜記憶される。   42, a CPU (Central Processing Unit) 921 executes various processes according to a program stored in a ROM (Read Only Memory) 922 or a program loaded from a storage unit 928 to a RAM (Random Access Memory) 923. To do. The RAM 923 also appropriately stores data necessary for the CPU 921 to execute various processes.

CPU921、ROM922、およびRAM923は、バス924を介して相互に接続されている。このバス924にはまた、入出力インタフェース925も接続されている。   The CPU 921, ROM 922, and RAM 923 are connected to each other via a bus 924. An input / output interface 925 is also connected to the bus 924.

入出力インタフェース925には、キーボード、マウスなどよりなる入力部926、CRT(Cathode Ray Tube)、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部927、ハードディスクなどより構成される記憶部928、モデムなどより構成される通信部929が接続されている。通信部929は、インターネットを含むネットワークを介しての通信処理を行う。   The input / output interface 925 includes an input unit 926 including a keyboard and a mouse, a display including a CRT (Cathode Ray Tube) and an LCD (Liquid Crystal display), an output unit 927 including a speaker, and a hard disk. A communication unit 929 including a storage unit 928 and a modem is connected. The communication unit 929 performs communication processing via a network including the Internet.

入出力インタフェース925にはまた、必要に応じてドライブ930が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア931が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部928にインストールされる。   A drive 930 is also connected to the input / output interface 925 as necessary, and a removable medium 931 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is appropriately attached, and a computer program read from them is loaded. It is installed in the storage unit 928 as necessary.

一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。   When a series of processing is executed by software, a program constituting the software executes various functions by installing a computer incorporated in dedicated hardware or various programs. For example, a general-purpose personal computer is installed from a network or a recording medium.

この記録媒体は、図42に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フロッピディスクを含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア931により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM922や、記憶部928に含まれるハードディスクなどで構成される。   As shown in FIG. 42, this recording medium is distributed to provide a program to the user separately from the apparatus main body, and includes a magnetic disk (including a floppy disk) on which the program is recorded, an optical disk (CD- It is not only composed of removable media 931 consisting of ROM (compact disk-read only memory), DVD (including digital versatile disk), magneto-optical disk (including MD (mini-disk)), or semiconductor memory. The program is configured by a ROM 922 in which a program is recorded and a hard disk included in the storage unit 928, which is provided to the user in a state of being incorporated in the apparatus main body in advance.

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。   In the present specification, the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but is not necessarily performed in chronological order. It also includes processes that are executed individually.

また、本明細書において、システムとは、複数の装置(または特定の機能を実現する機能モジュール)が論理的に集合したものを意味し、各装置や機能モジュールが単一の筐体内にあるか否かは問わない。   In addition, in this specification, the system means a logical collection of a plurality of devices (or functional modules that realize a specific function), and whether each device or functional module is in a single casing. It doesn't matter whether or not.

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。   The embodiment of the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the gist of the present invention.

本発明の実施形態としての生体情報処理装置の構成例を表すブロック図である。It is a block diagram showing the example of a structure of the biometric information processing apparatus as embodiment of this invention. DNAチップの構成例を表す斜視図である。It is a perspective view showing the structural example of a DNA chip. 実験過程処理装置の構成例を表すブロック図である。It is a block diagram showing the structural example of an experimental process processing apparatus. 実験過程の処理1を説明するフローチャートである。It is a flowchart explaining the process 1 of an experiment process. 実験過程の処理2を説明するフローチャートである。It is a flowchart explaining the process 2 of an experiment process. 発現量推定処理を説明するフローチャートである。It is a flowchart explaining an expression level estimation process. 入力画像フォーマットの例を示す図である。It is a figure which shows the example of an input image format. 入力画像フォーマットの例を示す図である。It is a figure which shows the example of an input image format. 蛍光強度とハイブリダイズ量の関係を表す図である。It is a figure showing the relationship between fluorescence intensity and the amount of hybridization. 画像処理部の構成例を表すブロック図である。It is a block diagram showing the example of a structure of an image process part. 画像処理を説明するフローチャートである。It is a flowchart explaining an image process. テンプレートによる発現プロファイル画像の抜き出しを説明する図である。It is a figure explaining extraction of the expression profile picture by a template. フィルタの処理を説明する図である。It is a figure explaining the process of a filter. フィルタの生成処理を説明する図である。It is a figure explaining the production | generation process of a filter. トレンドフィルタによる処理を説明する図である。る。It is a figure explaining the process by a trend filter. The デブリの例を示す図であるIt is a figure which shows the example of debris 2値化した画像の例を表す図である。It is a figure showing the example of the binarized image. デブリ境界を太線化した状態を表す図である。It is a figure showing the state which made the debris boundary thick. スポット境界と交差するデブリ領域を説明する図である。It is a figure explaining the debris area | region which cross | intersects a spot boundary. デブリ領域とスポット内領域の境界を説明する図である。It is a figure explaining the boundary of a debris area | region and the area | region in a spot. ハイブリダイズ量計算部の構成例を表すブロック図である。It is a block diagram showing the example of a structure of the amount calculation part of hybridization. ハイブリダイズ量と信頼度の計算処理を説明するフローチャートである。It is a flowchart explaining the calculation process of the amount of hybridization and reliability. デブリを含むスポットの画像の例を表す図である。It is a figure showing the example of the image of the spot containing debris. デブリ領域の内側であることの判定の原理を表す図である。It is a figure showing the principle of determination of being inside a debris area | region. スポット内領域を説明する図である。It is a figure explaining the area | region in a spot. 信頼度confidenceを説明する図である。It is a figure explaining reliability confidence. 選択部の構成例を表すブロック図である。It is a block diagram showing the example of a structure of a selection part. スポット内領域選択処理を説明するフローチャートである。It is a flowchart explaining the area | region selection process in a spot. スポット周辺を説明する図である。It is a figure explaining a spot periphery. 大きな領域のデブリの例について説明する図である。It is a figure explaining the example of the debris of a big area | region. 大きな領域のデブリの例について説明する図である。It is a figure explaining the example of the debris of a big area | region. SVMの学習を説明する図である。It is a figure explaining learning of SVM. SVMの判定を説明する図である。It is a figure explaining determination of SVM. 出力部の構成例を表すブロック図である。It is a block diagram showing the example of a structure of an output part. スポット単位でのハイブリダイズ値と信頼度の出力処理を説明するフローチャートである。It is a flowchart explaining the output process of the hybridization value and reliability in a spot unit. 複数回の実験によるスポットの構成を説明する図である。It is a figure explaining the structure of the spot by experiment of multiple times. 複数回の実験によるスポット内領域の組み合わせの例を示す図である。It is a figure which shows the example of the combination of the area | region in a spot by a multiple times experiment. 発現プロファイルデータの構成例を表す図である。It is a figure showing the structural example of expression profile data. 学習処理を説明するフローチャートである。It is a flowchart explaining a learning process. 特徴量抽出処理を説明するフローチャートである。It is a flowchart explaining a feature-value extraction process. 異なる励起光強度により得られる発現プロファイル画像データを用いた特徴量の抽出を説明する図である。It is a figure explaining extraction of the feature-value using the expression profile image data obtained by different excitation light intensity | strength. パーソナルコンピュータの構成例を表すブロック図である。And FIG. 11 is a block diagram illustrating a configuration example of a personal computer.

符号の説明Explanation of symbols

1 生体情報処理装置, 11 DNAチップ, 21 ピックアップ部, 22 蛍光強度取得部, 23 励起光強度計算部, 24 ハイブリダイズ量推定部, 25 発現量計算部, 28 発現プロファイルデータ記憶部, 29 ユーザインターフェース部, 29A 表示部, 29B 入力部, 30 蛍光強度−ハイブリダイズ量変換式記憶部, 31 機械的学習部, 81 励起光強度推定部, 82 作成部, 83 画像処理部, 84 検証部, 85 ハイブリダイズ量計算部, 91 SVM, 92 スポット除去パターンデータベース   DESCRIPTION OF SYMBOLS 1 Biological information processing apparatus, 11 DNA chip, 21 Pickup part, 22 Fluorescence intensity acquisition part, 23 Excitation light intensity calculation part, 24 Hybridization amount estimation part, 25 Expression amount calculation part, 28 Expression profile data storage part, 29 User interface Unit, 29A display unit, 29B input unit, 30 fluorescence intensity-hybridization amount conversion type storage unit, 31 mechanical learning unit, 81 excitation light intensity estimation unit, 82 creation unit, 83 image processing unit, 84 verification unit, 85 hybrid Soybean amount calculator, 91 SVM, 92 spot removal pattern database

Claims (24)

基板上に設けられた反応領域に固定された第1の生体物質と、前記第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定する生体情報処理装置において、
前記反応領域の画像情報の入力を受ける画像入力手段と、
前記画像入力手段により入力された前記反応領域の画像情報の特徴量を抽出する特徴量抽出手段と、
前記反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報を記憶する記憶手段と、
前記記憶手段により記憶された前記判定基準情報を基に、前記特徴量抽出手段により抽出された前記特徴量を有する前記反応領域の画像情報を測定に用いた場合の信頼度の有無を判定する判定手段と、
前記判定手段による判定結果に基づいて、前記反応領域における前記第1の生体物質と前記第2の生体物質との生体反応の状態を表す反応度情報を計算する計算手段と
を備え、
前記判定基準情報は、学習用の画像情報を用いて、前記反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、前記反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、
前記特徴量は、前記反応領域の画像情報の信頼度に相関を有する値である
生体情報処理装置。
In a biological information processing apparatus for measuring a state of a biological reaction between a first biological material fixed in a reaction region provided on a substrate and a second biological material that performs a biological reaction with respect to the first biological material ,
Image input means for receiving input of image information of the reaction region;
Feature amount extraction means for extracting the feature amount of the image information of the reaction region input by the image input means;
Storage means for storing determination criterion information that is a determination criterion for the presence or absence of reliability when the image information of the reaction region is used for measurement;
Judgment to determine the presence or absence of reliability when the image information of the reaction region having the feature quantity extracted by the feature quantity extraction means is used for measurement based on the judgment criterion information stored by the storage means Means,
Based on a determination result by the determination means, and a calculation means for calculating reactivity information representing a state of a biological reaction between the first biological material and the second biological material in the reaction region,
The determination criterion information includes a correlation between information indicating presence / absence of reliability when the image information of the reaction region is used for measurement using image information for learning and a feature amount of the image information of the reaction region. It was obtained by learning,
The feature amount is a value having a correlation with the reliability of the image information of the reaction region.
前記判定基準情報は、SVMにより得られる
請求項1に記載の生体情報処理装置。
The biological information processing apparatus according to claim 1, wherein the determination criterion information is obtained by SVM.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域に励起光を照射した場合に得られる蛍光強度が含まれる
請求項1に記載の生体情報処理装置。
The biological information processing apparatus according to claim 1, wherein the feature amount extracted by the feature amount extraction unit includes a fluorescence intensity obtained when the reaction region is irradiated with excitation light.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域の周辺の領域に励起光を照射した場合に得られる蛍光強度が含まれる
請求項1に記載の生体情報処理装置。
The biological information processing apparatus according to claim 1, wherein the feature amount extracted by the feature amount extraction unit includes a fluorescence intensity obtained when the region around the reaction region is irradiated with excitation light.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域に含まれる、測定を行うために障害となる物質に対応する画像の面積に対応する値が含まれる
請求項1に記載の生体情報処理装置。
The living body according to claim 1, wherein the feature amount extracted by the feature amount extraction unit includes a value corresponding to an area of an image corresponding to a substance that is an obstacle to perform measurement included in the reaction region. Information processing device.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域における前記第1の生体物質と前記第2の生体物質の生体反応量に対応する値が含まれる
請求項1に記載の生体情報処理装置。
The biometric information according to claim 1, wherein the feature quantity extracted by the feature quantity extraction unit includes a value corresponding to a bioreaction quantity of the first biological material and the second biological material in the reaction region. Processing equipment.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域における前記第1の生体物質と前記第2の生体物質との生体反応のしやすさを示す情報が含まれる
請求項1に記載の生体情報処理装置。
The feature amount extracted by the feature amount extraction unit includes information indicating ease of biological reaction between the first biological material and the second biological material in the reaction region. Biological information processing device.
前記画像入力手段により入力された学習用の前記画像情報を表示する表示手段と、
前記表示手段により表示された前記画像情報を参照したユーザにより、教師情報として、前記反応領域の画像情報の信頼度の有無を示す情報の入力を受ける教師情報入力手段と、
前記教師情報入力手段により入力された前記教師情報と、前記特徴量抽出手段により抽出された前記特徴量との相関を学習することにより、前記判定基準情報を得る学習手段と
を更に備え、
前記記憶手段は、前記学習手段により得られた前記判定基準情報を記憶する
請求項1に記載の生体情報処理装置。
Display means for displaying the image information for learning input by the image input means;
Teacher information input means for receiving, as teacher information, information indicating the presence or absence of reliability of the image information of the reaction region by a user who refers to the image information displayed by the display means;
Learning means for obtaining the determination criterion information by learning the correlation between the teacher information input by the teacher information input means and the feature quantity extracted by the feature quantity extraction means;
The biological information processing apparatus according to claim 1, wherein the storage unit stores the determination criterion information obtained by the learning unit.
前記第1の生体物質と前記第2の生体物質は、相互に相補的な塩基配列を有する遺伝子またはそれから派生する物質であり、
前記反応度情報は、前記第1の生体物質と前記第2の生体物質のハイブリダイゼーションの情報である
請求項1に記載の生体情報処理装置。
The first biological substance and the second biological substance are genes having base sequences complementary to each other or substances derived therefrom,
The biological information processing apparatus according to claim 1, wherein the reactivity information is information on hybridization between the first biological material and the second biological material.
前記ハイブリダイゼーションの情報は、前記第1の生体物質と前記第2の生体物質とがハイブリダイズして得られる蛍光強度から関数に基づき一義的に決定される情報である
請求項9に記載の生体情報処理装置。
The biological information according to claim 9, wherein the hybridization information is information that is uniquely determined based on a function from a fluorescence intensity obtained by hybridizing the first biological material and the second biological material. Information processing device.
基板上に設けられた反応領域に固定された第1の生体物質と、前記第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定する生体情報処理装置の生体情報処理方法において、
前記反応領域の画像情報の入力を制御する画像入力制御ステップと、
前記画像入力制御ステップの処理により入力が制御された前記反応領域の画像情報の特徴量を抽出する特徴量抽出ステップと、
前記反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報の取得を制御する取得制御ステップと、
前記取得制御ステップの処理により取得が制御された前記判定基準情報を基に、前記特徴量抽出ステップの処理により抽出された前記特徴量を有する前記反応領域の画像情報を測定に用いた場合の信頼度の有無を判定する判定ステップと、
前記判定ステップの処理による判定結果に基づいて、前記反応領域における前記第1の生体物質と前記第2の生体物質との生体反応の状態を表す反応度情報を計算する計算ステップと
を含み、
前記判定基準情報は、学習用の画像情報を用いて、前記反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、前記反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、
前記特徴量は、前記反応領域の画像情報の信頼度に相関を有する値である
生体情報処理方法。
A biological information processing apparatus for measuring a state of a biological reaction between a first biological material fixed in a reaction region provided on a substrate and a second biological material that is biologically reactive with the first biological material. In the biological information processing method,
An image input control step for controlling input of image information of the reaction region;
A feature amount extraction step of extracting a feature amount of the image information of the reaction region whose input is controlled by the processing of the image input control step;
An acquisition control step for controlling acquisition of determination criterion information that is a determination criterion for the presence or absence of reliability when the image information of the reaction region is used for measurement;
Reliability in the case where image information of the reaction region having the feature amount extracted by the feature amount extraction step is used for measurement based on the determination criterion information whose acquisition is controlled by the acquisition control step processing A determination step for determining the presence or absence of a degree;
A calculation step for calculating reactivity information representing a state of biological reaction between the first biological material and the second biological material in the reaction region based on a determination result obtained by the determination step;
The determination criterion information includes a correlation between information indicating presence / absence of reliability when the image information of the reaction region is used for measurement using image information for learning and a feature amount of the image information of the reaction region. It was obtained by learning,
The feature amount is a value having a correlation with the reliability of the image information of the reaction region.
基板上に設けられた反応領域に固定された第1の生体物質と、前記第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定する処理をコンピュータに実行させるためのプログラムにおいて、
前記反応領域の画像情報の入力を制御する画像入力制御ステップと、
前記画像入力制御ステップの処理により入力が制御された前記反応領域の画像情報の特徴量を抽出する特徴量抽出ステップと、
前記反応領域の画像情報を測定に用いた場合の信頼度の有無の判定基準となる判定基準情報の取得を制御する取得制御ステップと、
前記取得制御ステップの処理により取得が制御された前記判定基準情報を基に、前記特徴量抽出ステップの処理により抽出された前記特徴量を有する前記反応領域の画像情報を測定に用いた場合の信頼度の有無を判定する判定ステップと、
前記判定ステップの処理による判定結果に基づいて、前記反応領域における前記第1の生体物質と前記第2の生体物質との生体反応の状態を表す反応度情報を計算する計算ステップと
を含み、
前記判定基準情報は、学習用の画像情報を用いて、前記反応領域の画像情報を測定に用いた場合の信頼度の有無を示す情報と、前記反応領域の画像情報の特徴量との相関を学習することにより得られたものであり、
前記特徴量は、前記反応領域の画像情報の信頼度に相関を有する値である
プログラム。
A computer executes a process of measuring a state of a biological reaction between a first biological material fixed in a reaction region provided on a substrate and a second biological material that reacts with the first biological material. In the program to let
An image input control step for controlling input of image information of the reaction region;
A feature amount extraction step of extracting a feature amount of the image information of the reaction region whose input is controlled by the processing of the image input control step;
An acquisition control step for controlling acquisition of determination criterion information that is a determination criterion for the presence or absence of reliability when the image information of the reaction region is used for measurement;
Reliability in the case where image information of the reaction region having the feature amount extracted by the feature amount extraction step is used for measurement based on the determination criterion information whose acquisition is controlled by the acquisition control step processing A determination step for determining the presence or absence of a degree;
A calculation step for calculating reactivity information representing a state of biological reaction between the first biological material and the second biological material in the reaction region based on a determination result obtained by the determination step;
The determination criterion information includes a correlation between information indicating presence / absence of reliability when the image information of the reaction region is used for measurement using image information for learning and a feature amount of the image information of the reaction region. It was obtained by learning,
The feature amount is a value having a correlation with reliability of image information in the reaction area.
請求項12に記載のプログラムが記録されている記録媒体。   A recording medium on which the program according to claim 12 is recorded. 基板上に設けられた反応領域に固定された第1の生体物質と、前記第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定するために、前記反応領域の信頼度の有無の判定に必要な学習処理を実行する学習装置において、
前記反応領域の画像情報の入力を受ける画像入力手段と、
前記画像入力手段により入力された前記画像情報を表示する表示手段と、
前記表示手段により表示された前記画像情報を参照したユーザにより、教師情報として、前記反応領域の画像情報の信頼度の有無を示す情報の入力を受ける教師情報入力手段と、
前記反応領域ごとに、前記反応領域の画像情報の信頼度に相関を有する特徴量を抽出する特徴量抽出手段と、
前記教師情報入力手段により入力された前記反応領域の信頼度の有無を示す前記情報に対する、前記特徴量抽出手段により抽出された前記特徴量の相関を学習する学習手段と
を備える学習装置。
In order to measure the state of the biological reaction between the first biological material fixed in the reaction region provided on the substrate and the second biological material that reacts with the first biological material, the reaction In a learning device that executes a learning process necessary for determining the presence or absence of reliability of a region,
Image input means for receiving input of image information of the reaction region;
Display means for displaying the image information input by the image input means;
Teacher information input means for receiving, as teacher information, information indicating the presence or absence of reliability of the image information of the reaction region by a user who refers to the image information displayed by the display means;
Feature amount extraction means for extracting a feature amount having a correlation with the reliability of the image information of the reaction region for each reaction region;
A learning device comprising: learning means for learning a correlation of the feature quantity extracted by the feature quantity extraction means with respect to the information indicating the reliability of the reaction region input by the teacher information input means.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域に励起光を照射した場合に得られる蛍光強度が含まれる
請求項14に記載の学習装置。
The learning apparatus according to claim 14, wherein the feature amount extracted by the feature amount extraction unit includes a fluorescence intensity obtained when the reaction region is irradiated with excitation light.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域の周辺の領域に励起光を照射した場合に得られる蛍光強度が含まれる
請求項14に記載の学習装置。
The learning apparatus according to claim 14, wherein the feature amount extracted by the feature amount extraction unit includes a fluorescence intensity obtained when the region around the reaction region is irradiated with excitation light.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域に含まれる、測定を行うために障害となる物質に対応する画像の面積に対応する値が含まれる
請求項14に記載の学習装置。
15. The learning according to claim 14, wherein the feature amount extracted by the feature amount extraction unit includes a value corresponding to an area of an image corresponding to a substance that is an obstacle to perform the measurement, which is included in the reaction region. apparatus.
前記特徴量抽出手段により抽出される特徴量には、前記反応領域における前記第1の生体物質と前記第2の生体物質の生体反応量に対応する値が含まれる
請求項14に記載の学習装置。
The learning device according to claim 14, wherein the feature amount extracted by the feature amount extraction unit includes a value corresponding to a biological reaction amount of the first biological material and the second biological material in the reaction region. .
前記特徴量抽出手段により抽出される特徴量には、前記反応領域における前記第1の生体物質と前記第2の生体物質との生体反応のしやすさを示す情報が含まれる
請求項14に記載の学習装置。
The feature amount extracted by the feature amount extraction unit includes information indicating ease of biological reaction between the first biological material and the second biological material in the reaction region. Learning device.
前記学習手段は、SVMにより学習処理を行う
請求項14に記載の学習装置。
The learning device according to claim 14, wherein the learning unit performs a learning process using SVM.
前記画像入力手段は、前記画像情報を得るために前記基板に照射される励起光の強度が異なる場合に得られる同一の基板における複数の画像情報を入力し、
前記特徴量抽出手段は、励起光の強度が異なる場合に得られた複数の画像情報のそれぞれの前記反応領域ごとに、前記特徴量を抽出し、
前記教師情報入力手段は、前記表示手段により表示された前記画像情報を参照したユーザにより、1つの前記反応領域に対して1クラスの教師情報の入力を受け、
前記学習手段は、前記教師情報入力手段により入力された1クラスの教師情報に対して、前記特徴量抽出手段により抽出された、励起光の強度が異なる場合に得られたそれぞれの前記特徴量の相関を学習する
請求項14に記載の学習装置。
The image input means inputs a plurality of pieces of image information on the same substrate obtained when the intensity of excitation light irradiated on the substrate is different in order to obtain the image information,
The feature amount extraction means extracts the feature amount for each of the reaction regions of each of a plurality of pieces of image information obtained when the intensity of excitation light is different,
The teacher information input means receives an input of one class of teacher information for one reaction region by a user referring to the image information displayed by the display means,
The learning unit is configured to obtain each of the feature amounts obtained when the intensity of excitation light extracted by the feature amount extraction unit is different from the one class of teacher information input by the teacher information input unit. The learning apparatus according to claim 14, wherein correlation is learned.
基板上に設けられた反応領域に固定された第1の生体物質と、前記第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定するために、前記反応領域の信頼度の有無の判定に必要な学習処理を実行する学習装置の学習制御方法において、
前記反応領域の画像情報の入力を制御する画像入力制御ステップと、
前記画像入力制御ステップの処理により入力が制御された前記画像情報の表示を制御する表示制御ステップと、
前記表示制御ステップの処理により表示が制御された前記画像情報を参照したユーザによる、教師情報としての、前記反応領域の画像情報の信頼度の有無を示す情報の入力を制御する教師情報入力制御ステップと、
前記反応領域ごとに、前記反応領域の画像情報の信頼度に相関を有する特徴量を抽出する特徴量抽出ステップと、
前記教師情報入力制御ステップの処理により入力が制御された前記反応領域の信頼度の有無を示す前記情報に対する、前記特徴量抽出ステップの処理により抽出された前記特徴量の相関を学習する学習ステップと
を含む学習制御方法。
In order to measure the state of the biological reaction between the first biological material fixed in the reaction region provided on the substrate and the second biological material that reacts with the first biological material, the reaction In the learning control method of the learning device that executes the learning process necessary for determining the presence or absence of the reliability of the region,
An image input control step for controlling input of image information of the reaction region;
A display control step for controlling display of the image information whose input is controlled by the processing of the image input control step;
Teacher information input control step for controlling input of information indicating the reliability of the image information of the reaction region as teacher information by a user who refers to the image information whose display is controlled by the processing of the display control step. When,
For each reaction region, a feature amount extraction step for extracting a feature amount having a correlation with the reliability of the image information of the reaction region;
A learning step for learning a correlation of the feature amount extracted by the feature amount extraction step with respect to the information indicating the reliability of the reaction region whose input is controlled by the teacher information input control step; Learning control method.
基板上に設けられた反応領域に固定された第1の生体物質と、前記第1の生体物質に対して生体反応する第2の生体物質との生体反応の状態を測定するために、前記反応領域の信頼度の有無の判定に必要な学習処理をコンピュータに実行させるためのプログラムであって、
前記反応領域の画像情報の入力を制御する画像入力制御ステップと、
前記画像入力制御ステップの処理により入力が制御された前記画像情報の表示を制御する表示制御ステップと、
前記表示制御ステップの処理により表示が制御された前記画像情報を参照したユーザによる、教師情報としての、前記反応領域の画像情報の信頼度の有無を示す情報の入力を制御する教師情報入力制御ステップと、
前記反応領域ごとに、前記反応領域の画像情報の信頼度に相関を有する特徴量を抽出する特徴量抽出ステップと、
前記教師情報入力制御ステップの処理により入力が制御された前記反応領域の信頼度の有無を示す前記情報に対する、前記特徴量抽出ステップの処理により抽出された前記特徴量の相関を学習する学習ステップと
を含むプログラム。
In order to measure the state of the biological reaction between the first biological material fixed in the reaction region provided on the substrate and the second biological material that reacts with the first biological material, the reaction A program for causing a computer to execute a learning process necessary for determining whether or not a region has reliability,
An image input control step for controlling input of image information of the reaction region;
A display control step for controlling display of the image information whose input is controlled by the processing of the image input control step;
Teacher information input control step for controlling input of information indicating the reliability of the image information of the reaction region as teacher information by a user who refers to the image information whose display is controlled by the processing of the display control step. When,
For each reaction region, a feature amount extraction step for extracting a feature amount having a correlation with the reliability of the image information of the reaction region;
A learning step for learning a correlation of the feature amount extracted by the feature amount extraction step with respect to the information indicating the reliability of the reaction region whose input is controlled by the teacher information input control step; Including programs.
請求項23に記載のプログラムが記録されている記録媒体。   A recording medium on which the program according to claim 23 is recorded.
JP2005199016A 2005-07-07 2005-07-07 Biological data processor, biological data processing method, learning device, learning control method, program and recording medium Withdrawn JP2007017282A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005199016A JP2007017282A (en) 2005-07-07 2005-07-07 Biological data processor, biological data processing method, learning device, learning control method, program and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005199016A JP2007017282A (en) 2005-07-07 2005-07-07 Biological data processor, biological data processing method, learning device, learning control method, program and recording medium

Publications (1)

Publication Number Publication Date
JP2007017282A true JP2007017282A (en) 2007-01-25

Family

ID=37754571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005199016A Withdrawn JP2007017282A (en) 2005-07-07 2005-07-07 Biological data processor, biological data processing method, learning device, learning control method, program and recording medium

Country Status (1)

Country Link
JP (1) JP2007017282A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014512546A (en) * 2011-04-28 2014-05-22 コーニンクレッカ フィリップス エヌ ヴェ Analytical evaluation by optical inhomogeneity
JP2018530815A (en) * 2015-08-17 2018-10-18 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Multilevel architecture for pattern recognition in biometric data
WO2020012528A1 (en) * 2018-07-09 2020-01-16 オリンパス株式会社 Photoanalysis device, photoanalysis method, and learned model
WO2020066209A1 (en) * 2018-09-27 2020-04-02 株式会社堀場製作所 Method for generating data for particle analysis, program for generating data for particle analysis, and device for generating data for particle analysis

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014512546A (en) * 2011-04-28 2014-05-22 コーニンクレッカ フィリップス エヌ ヴェ Analytical evaluation by optical inhomogeneity
US10466163B2 (en) 2011-04-28 2019-11-05 Koninklijke Philips N.V. Concurrently evaluating assays with optical inhomogeneities
JP2018530815A (en) * 2015-08-17 2018-10-18 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Multilevel architecture for pattern recognition in biometric data
US11710540B2 (en) 2015-08-17 2023-07-25 Koninklijke Philips N.V. Multi-level architecture of pattern recognition in biological data
WO2020012528A1 (en) * 2018-07-09 2020-01-16 オリンパス株式会社 Photoanalysis device, photoanalysis method, and learned model
WO2020066209A1 (en) * 2018-09-27 2020-04-02 株式会社堀場製作所 Method for generating data for particle analysis, program for generating data for particle analysis, and device for generating data for particle analysis
JPWO2020066209A1 (en) * 2018-09-27 2021-09-09 株式会社堀場製作所 Particle analysis data generation method, particle analysis data generation program, and particle analysis data generation device

Similar Documents

Publication Publication Date Title
US7317820B2 (en) System and method for automatically identifying sub-grids in a microarray
US6731781B1 (en) System and method for automatically processing microarrays
JP4736516B2 (en) Biological information processing apparatus and method, program, and recording medium
KR101513602B1 (en) Method of scanning biochip
CA2604317A1 (en) Methods and system for validating sample images for quantitative immunoassays
JP2013526717A5 (en)
TWI425443B (en) Analysis processing method and device
US6633659B1 (en) System and method for automatically analyzing gene expression spots in a microarray
Kim et al. A novel method using edge detection for signal extraction from cDNA microarray image analysis
US7099502B2 (en) System and method for automatically processing microarrays
JP2007017282A (en) Biological data processor, biological data processing method, learning device, learning control method, program and recording medium
EP1569155B1 (en) Method of detecting an error spot in a DNA chip and system using the method
JP3537752B2 (en) Method for displaying experimental results of hybridization reaction using biochip and method for evaluating experimental errors
EP2824444B1 (en) Determination method, determination device, determination system, and program
JP2006300795A (en) Biological data measuring instrument, biological data measuring method, program and recording medium
US20040181342A1 (en) System and method for automatically analyzing gene expression spots in a microarray
JP2006300798A (en) Biological data processor, biological data measuring method, program and recording medium
US20080123898A1 (en) System and Method for Automatically Analyzing Gene Expression Spots in a Microarray
JP2006300797A (en) Biological data processor, biological data measuring method, program, recording medium and substrate
Bergemann et al. A statistically driven approach for image segmentation and signal extraction in cDNA microarrays
JP2006300796A (en) Biological data processor, biological data measuring method, program and recording medium
KR102610794B1 (en) Method and apparatus for microarray spot analysis
CN115345863A (en) Biochip detection method, system and storage medium
WO2021179997A1 (en) Detection method, apparatus, and device for biochip
KR20100111098A (en) The method and apparatus for detecting data spot&#39;s position of a microarray

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007