WO2014050160A1 - 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム - Google Patents

動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム Download PDF

Info

Publication number
WO2014050160A1
WO2014050160A1 PCT/JP2013/053188 JP2013053188W WO2014050160A1 WO 2014050160 A1 WO2014050160 A1 WO 2014050160A1 JP 2013053188 W JP2013053188 W JP 2013053188W WO 2014050160 A1 WO2014050160 A1 WO 2014050160A1
Authority
WO
WIPO (PCT)
Prior art keywords
cluster
factor
index
measurement data
dnb
Prior art date
Application number
PCT/JP2013/053188
Other languages
English (en)
French (fr)
Inventor
合原 一幸
洛南 陳
鋭 劉
治平 劉
美儀 李
Original Assignee
独立行政法人科学技術振興機構
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 独立行政法人科学技術振興機構 filed Critical 独立行政法人科学技術振興機構
Priority to US14/430,724 priority Critical patent/US11328792B2/en
Priority to CA2885634A priority patent/CA2885634C/en
Priority to KR1020157010816A priority patent/KR102111820B1/ko
Publication of WO2014050160A1 publication Critical patent/WO2014050160A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the present invention relates to a detection apparatus, a detection method, and a detection program for detecting a candidate for a biomarker that is an index of a symptom of a living body based on measurement data of a plurality of factor items obtained by measurement related to the living body.
  • Non-Patent Documents 1 to 5 the progression process of disease deterioration (eg, asthma attack, cancer onset) is modeled as a time-dependent nonlinear dynamic system, and the modeled system is observed It has already been clarified that the disease rapidly deteriorates due to the phase transition at the branch point (see Non-Patent Documents 1 and 6).
  • FIG. 1 is an explanatory diagram conceptually showing a disease progression process.
  • FIG. 1a schematically illustrates the disease progression process.
  • b, c, and d show the stability of the modeled system described above as a potential function in the course of the progress process, the horizontal axis indicates the time of progress, and the vertical axis indicates the value of the potential function.
  • the progression process of disease deterioration can be expressed as a normal state (health state), a pre-disease state, and a disease state. In the normal state, the system is stable and the value of the potential function is the minimum value as shown by the position of the black circle in FIG.
  • the system In the pre-disease state, the system has a high potential function value, as shown by the black circle position in FIG. Therefore, it is in a state that is easily affected by disturbance, and is located near the branch point where the phase transition occurs only by receiving a small disturbance, that is, at the limit of the normal state. However, the pre-disease state can be easily restored to a normal state by appropriate treatment. On the other hand, in a disease state, the system is stable, and the value of the potential function is a global minimum as shown by the black circle position in FIG. Therefore, it is difficult for this disease state caused by the phase transition from the normal state to recover to the normal state.
  • the patient can be removed from the pre-disease state by taking appropriate measures. There is a high possibility that it can be restored to a normal state.
  • a bifurcation point (critical threshold) can be detected, a critical transition can be predicted and early diagnosis of a disease can be realized.
  • biomarkers have been used as methods for diagnosing disease states.
  • Conventional biomarkers that have been used in the past include body fluids such as serum and urine collected from living bodies, as well as molecular level DNA, RNA, proteins, metabolites, etc. contained in tissues. It is an index that can quantitatively grasp the scientific change.
  • the conventional method for diagnosing diseases using biomarkers is to compare the biomarkers extracted from normal samples (samples collected in a healthy state) with the biomarkers extracted from abnormal samples (samples collected in a disease state). It is a method of diagnosing.
  • the pre-disease state is the boundary of the normal state, and it is difficult for significant changes to occur before reaching the bifurcation point. Therefore, it is difficult to distinguish between the normal state and the pre-disease state in the diagnosis by the conventional technique such as biomarker and snapshot measurement.
  • the target of the pre-disease state is the patient, and usually the number of samples obtained from a single patient is limited, making it difficult to obtain sufficient samples for prediction over a long period of time. It is.
  • a conventional method for diagnosing a disease using a biomarker is a method of making a diagnosis by comparing a normal state and a disease state, and at the time of diagnosis, the patient has already entered a disease state and has returned to the previous normal state. It is difficult to go back.
  • the present invention provides a detection device, a detection method, and a detection program that can detect a pre-disease state before transitioning to a disease state, and further, a disease model is unnecessary and diagnosis is performed with only a few biological samples.
  • An object of the present invention is to provide a detection device or the like that can assist.
  • the detection apparatus is a biomarker candidate serving as an index of a symptom of a living body to be measured based on measurement data on a plurality of factor items obtained by measurement related to a living body.
  • a classifying unit that classifies a plurality of factor items into a plurality of clusters based on a correlation of time-series changes of respective measurement data of each factor item, and from each classified cluster,
  • a selection means for selecting a cluster corresponding to a selection condition set in advance based on the correlation between the time series change of each measurement data of each factor item and the time series change of the measurement data between each factor item, and the selected cluster
  • Detecting means for detecting a factor item included in the biomarker candidate as a biomarker candidate.
  • the detection device having the above-described features can detect a biomarker candidate serving as a warning signal indicating a pre-disease state before transitioning from a normal state to a disease state. Moreover, if the biomarker can be specified, the pre-disease state can be determined by collecting only a few samples from the detection target.
  • the selecting means includes means for calculating an average value of values indicating the correlation of measurement data between the factor items in the cluster as a first index, and measurement of the factor items in the cluster.
  • Means for calculating an average value of correlation values between the data and the measurement data of the factor items outside the cluster as a second index, and an average value of the standard deviation of the measurement data for each factor item in the cluster Means for calculating as an index, and a cluster including a factor item to be a biomarker is selected from a plurality of clusters based on the first index, the second index, and the third index.
  • the characteristics of each cluster can be quantitatively evaluated, and biomarkers can be easily selected.
  • the selecting means selects a cluster having a maximum total index based on a product of the first index, the second index, and the reciprocal of the third index.
  • the detection apparatus further comprises a differential test means for testing whether each measurement data of each factor item changes with time with significance, and the classification means includes It classifies about the factor item tested that there is significance in a change.
  • biomarker candidates can be efficiently detected from a large amount of measurement data by selecting factor items that show a significant change over time.
  • the detection apparatus is characterized in that the differential test means is based on the measurement data of each factor item and a comparison result with reference data preset for each factor item and time series. It is characterized by performing such a test.
  • a biological sample serving as a reference standard is acquired as reference data, so that the measurement data is compared with the reference data, and the disturbance is eliminated and detected. It can be performed.
  • the detection device calculates, for each factor item, a reference standard deviation indicating an average value of standard deviations of corresponding reference data, and a reference correlation value indicating an average value of values indicating correlation between factor items.
  • Means for detecting wherein the first index increases significantly with respect to the reference standard deviation, the second index decreases with significance with respect to the reference correlation value, and When the third index increases with significance compared to the reference standard deviation, an item included in the cluster is detected as a biomarker candidate.
  • the selected factor item is appropriate as a biomarker.
  • the detection means includes means for testing the significance of a plurality of factor items included in the cluster based on the statistical value of the measurement data. Is detected as a candidate for a biomarker.
  • any one of the plurality of factor items is a measurement item related to a gene, a measurement item related to a protein, a measurement item related to a metabolite, or a measurement item related to an image obtained from a living body.
  • the detection method according to the present invention includes a detection device that detects a candidate for a biomarker that is an index of a symptom of a living body that is a measurement target, based on measurement data for a plurality of factor items obtained by measurement related to the living body.
  • the detection device classifies a plurality of factor items into a plurality of clusters based on a correlation of time series changes of measurement data of each factor item, and classifies each of the classified items.
  • the detection method is a detection method for detecting a candidate for a biomarker that is an index of a symptom of a living body that is a measurement target, based on measurement data for a plurality of factor items obtained by measurement related to a living body.
  • a molecular screening step for calculating differential biomolecules and highly correlated biomolecules as one cluster
  • a clustering step for classifying the differential biomolecules selected in the molecular screening step into a plurality of clusters, and a plurality of clusters obtained in the clustering step among the biomolecules in the clusters.
  • a candidate selection step that preempts a cluster having the most significant reduction in correlation between a child and another biomolecule as a candidate for the biomarker, and whether the biomarker candidate selected in the candidate selection step is the biomarker. And a determination step of determining whether or not by a significance test.
  • the detection method having the above characteristics can detect a biomarker candidate serving as a warning signal indicating a pre-disease state before a transition from a normal state to a disease state. Moreover, if the biomarker can be specified, the pre-disease state can be determined by collecting only a few samples from the detection target.
  • the detection program detects a biomarker candidate serving as an index of a symptom of a living body to be measured based on measurement data on a plurality of factor items obtained by measurement related to a living body on a computer.
  • a detection program for executing processing wherein a computer classifies a plurality of factor items into a plurality of clusters based on a correlation of time-series changes of respective measurement data of each factor item, and each classified
  • the computer When the detection program having the above features is executed by a computer, the computer operates as the detection device according to the present invention. Therefore, it is possible to detect a biomarker candidate serving as a warning signal indicating a pre-disease state before transitioning from a normal state to a disease state. Moreover, if the biomarker can be specified, the pre-disease state can be determined by collecting only a few samples from the detection target.
  • a diagnosis is performed by collecting a biological sample from a diagnosis target and examining whether the biomarker serving as a warning signal indicating a pre-disease state immediately before a disease state exists in the collected biological sample. Whether or not the subject is in a pre-disease state can be diagnosed. Therefore, it is not necessary to construct a disease deterioration model, and it is not necessary to specify a driving factor for disease deterioration, and early diagnosis of the disease can be realized at a stage before becoming a disease.
  • FIG. 1 is a schematic diagram illustrating a disease progression process.
  • FIG. 2 is a schematic view illustrating the dynamic characteristics of DNB according to the detection method of the present invention.
  • FIG. 3 is a flowchart illustrating an example of the DNB detection method according to the embodiment.
  • FIG. 4 is a flowchart illustrating an example of differential biomolecule selection processing according to the embodiment.
  • FIG. 5 is a flowchart illustrating an example of DNB candidate selection processing according to the embodiment.
  • FIG. 6 is a flowchart illustrating an example of DNB determination processing according to the embodiment.
  • FIG. 7 is a diagram illustrating an example of a diagnosis schedule according to a disease early diagnosis method using DNB according to the embodiment.
  • FIG. 8 is a flowchart illustrating an example of a disease early diagnosis method using DNB in the embodiment.
  • FIG. 9 is an example of a graphic displaying a disease risk proportional to the overall index I.
  • FIG. 10 is an example of a graphic displaying a disease risk proportional to the overall index I.
  • FIG. 11 is a block diagram illustrating a configuration example of a detection device according to the present invention.
  • FIG. 12 is a flowchart showing an example of DNB detection processing by the detection apparatus according to the present invention.
  • FIG. 13 is a table showing diagnostic data in the first verification example.
  • FIG. 14A is a graph illustrating an example of a time-series change in the average value of the standard deviations of the detected DNB candidates in the first verification example.
  • FIG. 14B is a graph illustrating an example of a time-series change in the average value of the absolute values of the Pearson correlation coefficients between members of the detected candidate cluster of the DNB in the first verification example.
  • FIG. 14C is a graph showing an example of a time-series change in the average value of the absolute values of the Pearson correlation coefficients between members of the detected DNB candidate cluster and other genes in the first verification example.
  • FIG. 14D is a graph illustrating an example of a time-series change in the average value of the overall indexes of the detected DNB candidates in the first verification example.
  • FIG. 15 is a map showing an example of dynamic characteristics of DNB over time in a network configured by case group genes in the first verification example.
  • FIG. 16 is a table of diagnostic data in the second verification example.
  • FIG. 17A is a graph illustrating an example of a time-series change in an average value of standard deviations of detected DNB candidates in the second verification example.
  • FIG. 17B is a graph illustrating an example of a time-series change in the average value of the absolute values of the Pearson correlation coefficients between the members of the detected candidate cluster of the DNB in the second verification example.
  • FIG. 17C is a graph showing an example of a time-series change in the average absolute value of the Pearson correlation coefficient between a member of a detected candidate cluster of DNB and another gene in the second verification example.
  • FIG. 17D is a graph illustrating an example of a time-series change in the average value of the total indexes of the detected DNB candidates in the second verification example.
  • the inventors of the present invention utilize genomic high-throughput technology capable of obtaining thousands of information, that is, high-dimensional data, from one sample, and based on the bifurcation process theory, A mathematical model was constructed to study the progression mechanism of disease deterioration at the molecular network level.
  • a dynamic network biomarker DNB: Dynamical Network Biomarker
  • DNB Dynamical Network Biomarker
  • system (1) a system related to a disease progression process
  • P is a slowly changing parameter that drives the state transition of the system (1). For example, genetic factors such as SNP (Single Nucleotide Polymorphism), CNV (Copy Number Variation), non-methylation, acetylation, etc. It can be information such as genetic factors.
  • f (f1,..., fn) is a nonlinear function of Z (k).
  • the inventors of the present invention focused on the critical transition state of the system immediately before the transition from the normal state to the disease state, that is, the pre-disease state.
  • the system (1) has an equilibrium point having the following characteristics.
  • the inventors theoretically clarified from the above characteristics that when the system (1) enters a critical transition state, the following unique characteristics appear. That is, when the system (1) is in a critical transition state, a control group (sub-group) composed of some nodes in the network (1) in which each variable z1,..., Zn of the system (1) is configured as a node. Network) appears.
  • the dominant group appearing in the critical transition state ideally has the following characteristics.
  • PCC (zi, zj) is a Pearson correlation coefficient between zi and zj
  • SD (zi) and SD (zj) are standard deviations between zi and zj.
  • the appearance of the dominant group having the above-mentioned unique characteristics (I) to (III) is taken as an indication that the system (1) is transitioning to a critical transition state (pre-disease state). be able to. Therefore, the critical transition of the system (1) can be detected by detecting the dominating group. That is, the control group can be a warning signal indicating a critical transition, that is, a pre-disease state immediately before a disease worsening. Then, no matter how complicated the system (1) is, even if the driving element is unknown, if only the dominant group that becomes the warning signal is detected, the mathematical model of the system (1) is not handled directly, It is possible to identify the pre-disease state. By specifying the pre-disease state, it is possible to realize advance measures and early treatment for the disease.
  • the control group serving as a warning signal indicating a pre-disease state is referred to as a dynamic network biomarker (hereinafter abbreviated as DNB).
  • DNB dynamic network biomarker
  • the DNB is a dominating group having unique characteristics (I) to (III).
  • the DNB is a network ( Appears in 1).
  • the network (1) if each node (z1,..., Zn) is a factor item to be measured for a biomolecule such as a gene, protein, metabolite, etc., the DNB has the unique characteristic (I )
  • To (III) is a group (subnetwork) composed of factor items related to some biomolecules.
  • conditions for determining DNB can be determined as follows.
  • Condition (I) a group consisting of some biomolecules (genes, proteins or metabolites) existing in the network (1), and the absolute value of the Pearson correlation coefficient PCC between the biomolecules in the group The average value of increases significantly.
  • Condition (II) The average absolute value of the Pearson correlation coefficient OPCC between the biomolecules in the group and other biomolecules is significantly reduced.
  • Condition (III) The average value of the standard deviation SD of the biomolecules in the group is significantly increased.
  • a group consisting of biomolecules that simultaneously satisfy the conditions (I) to (III) for determining the DNB is recognized as a DNB.
  • FIG. 2 is a schematic view illustrating the dynamic characteristics of DNB according to the detection method of the present invention.
  • FIG. 2a shows a normal state, a pre-disease state, and a disease state as disease progression processes.
  • B, c and d in FIG. 2 show the stability of the modeled system (1) as a potential function in the normal state, the pre-disease state and the disease state with respect to the progress process, and the horizontal axis shows the course. It is the graph which took time and took the value of the potential function on the vertical axis, and showed conceptually.
  • FIG. 2 has shown notionally the example of the network state of the system (1) corresponding to each of a normal state, a pre-disease state, and a disease state. Further, h in FIG. 2 shows an example of the temporal change in the molecular concentration that is a factor item of DNB in the pre-disease state.
  • Nodes z1 to z6 represent factor items relating to different types of biomolecules such as genes, proteins, and metabolites
  • the connection lines between the nodes z1 to z6 indicate the correlation between the nodes.
  • the size indicates the size of the Pearson correlation coefficient PCC
  • the drawing method of circles surrounding z1 to z6 indicates the size of the standard deviation SD of each node.
  • the standard deviation SD is the smallest when the circle is blank, and the standard deviation SD is larger as the slanted line in one direction and the slanted line in two directions.
  • each node In the normal state, as shown in FIG. 2e, each node is at an intermediate level where the mutual correlation and the respective standard deviations are equal.
  • groups (z1 to z3) that show significantly unique characteristics appear compared to other nodes.
  • Nodes z1 to z3 in the group have a significantly increased Pearson correlation coefficient between the nodes z1 to z6 and a significant decrease in the Pearson correlation coefficient with the other nodes z4 to z6, as shown in FIG. Yes.
  • the standard deviations of the nodes z1 to z3 in the group are slightly larger, but the Pearson correlation coefficient between the nodes is equal. Returning to the middle level. That is, the unique characteristics of the group (z1 to z3) are lost.
  • DNB Dynamic Network Biomarker
  • DNB can be used for early diagnosis of a disease as a warning signal indicating a pre-disease state.
  • the average value of the absolute value of the Pearson correlation coefficient PCC between the nodes in the DNB described above, and the absolute value of the Pearson correlation coefficient OPCC between the node in the DNB and another node are used.
  • the standard deviation SD of DNB can be used.
  • an overall index I represented by the following formula (2) is introduced.
  • Equation (2) PCCd represents the average value of the absolute value of the Pearson correlation function between the nodes in the DNB, and OPCCd represents the average value of the absolute value of the Pearson correlation coefficient between the node in the DNB and another node.
  • SDd represents an average value of standard deviations of nodes in the DNB.
  • FIG. 3 is a flowchart illustrating an example of the DNB detection method according to the embodiment.
  • the detection method of the present invention first, it is necessary to obtain measurement data by measurement related to a living body. If a high-throughput technique such as a DNA chip is used, 20,000 or more genes can be measured from one biological sample.
  • a high-throughput technique such as a DNA chip
  • 20,000 or more genes can be measured from one biological sample.
  • a plurality (6 or more) of biological samples are collected at different time points from the measurement target, and the measurement data obtained by measuring the collected biological samples are aggregated and statistically collected. Get the data.
  • the DNB detection method mainly includes a high-throughput data acquisition process (s1), a differential biomolecule selection process (s2), a clustering process (s3), as shown in FIG. , DNB candidate selection processing (s4), and DNB determination processing (s5) by significance analysis. Next, each of these processes will be described in detail.
  • the sample to be detected is a case sample
  • the reference sample is a control sample
  • physiological data using each high-throughput technique that is, a biomolecule
  • the reference sample is a sample such as a sample collected in advance from a patient to be examined or a sample collected first at the time of collection, and is used as a control sample having a purpose such as calibration of a measuring apparatus.
  • a control sample is not necessary, but is useful for eliminating error factors and improving measurement reliability.
  • the selection process of the differential biomolecule in step s2 is a process of selecting a biomolecule that showed a significant change in the expression level.
  • FIG. 4 is a flowchart illustrating an example of differential biomolecule selection processing according to the embodiment.
  • FIG. 4 shows in detail the biological treatment of the differential biomolecule in step s2 shown in FIG.
  • step s22 Student's t-test is exemplified as a method for selecting the biomolecule D2c showing a significant change in the expression level, but the method is not particularly limited.
  • the value of the significance level ⁇ can be appropriately set to a value such as 0.05 or 0.01.
  • each case sample biomolecule D2c is corrected for multiple comparisons (multiple comparisons) or t-tests of multiple students, and each case sample gene after correction is corrected.
  • protein data D3c is selected (s23).
  • the Dc whose standard deviation SD changes relatively remarkably from each case sample gene or protein data D3c after correction is selected as a differential biomolecule.
  • the differential biomolecule Dc selected here not only shows a significant difference compared to the biomolecule Dr of the control sample, but also deviates greatly from its own average value.
  • the test method is not limited to the student t test.
  • the clustering process here is a process of classifying a plurality of biomolecules into groups highly correlated with each other, and each group into which biomolecules are classified is referred to as a cluster. That is, the differential biomolecule Dc selected in step s24 shown in FIG. 4 is classified into n clusters so that biomolecules highly correlated with each other are made into one cluster. All the resulting clusters are potential dominating groups, ie, candidates for DNB to be detected.
  • FIG. 5 is a flowchart illustrating an example of DNB candidate selection processing according to the embodiment.
  • FIG. 5 shows details of the DNB candidate selection process in step s4 shown in FIG. That is, the DNB candidate selection process is performed based on the flowchart of the DNB candidate selection process shown in FIG. In the cyclic loop shown in FIG.
  • the clusters calculate the mean value OPCCd (k) of the absolute value of the Pearson correlation function between the nodes in the cluster and other nodes, the mean value SDd (k) of the standard deviation of the nodes in the cluster, and the overall index I (k) (S41 to s46). Then, the cluster having the largest overall index I value is selected from all the clusters as a DNB candidate (s47).
  • FIG. 6 is a flowchart illustrating an example of DNB determination processing according to the embodiment.
  • FIG. 6 shows details of the DNB determination processing by the superiority analysis in step s5 shown in FIG. That is, based on the above-described DNB determination conditions (I) to (III), it is determined whether or not the cluster (m) selected as a DNB candidate in step s47 is a DNB.
  • the processing is performed based on the flowchart of the DNB determination processing shown in FIG.
  • the average value PCCdr of the absolute value of the Pearson correlation coefficient between the nodes of the data acquired from the control sample and the average value SDdr of the standard deviation of each node are calculated (s51, s52). ). Then, compared with the average value PCCdr of the Pearson correlation coefficient of the control sample, the average value PCCd (m) of the absolute value of the Pearson correlation coefficient between the nodes in the cluster (m) selected in step s47 is significantly increased. It is determined whether or not (s53). If it is determined that there is no significant increase (NO), a result that there is no DNB is output, and the process is terminated (s57).
  • step s54 whether the average value OPCCd (m) of the Pearson correlation coefficient between each node in the cluster (m) and another node is significantly reduced as compared to the average value PCCdr of the Pearson correlation coefficient of the control sample It is determined whether or not (s54). If it is determined that there is no significant reduction (NO), a result indicating that there is no DNB is output (s57), and the process is terminated. On the other hand, if it is determined that it has been significantly reduced (YES), the process proceeds to the next step s55.
  • step s55 it is determined whether or not the standard deviation average value SDd (m) of the nodes in the cluster (m) has significantly increased compared to the standard deviation average value SDr of the control sample. If it is determined that there is no significant increase (NO), it is determined that there is no DNB (s57), and the process is terminated. On the other hand, if it is determined that it has increased significantly, the cluster (m) is recognized as DNB (s56), and the process is terminated.
  • FIG. 7 is a diagram illustrating an example of a diagnosis schedule for early diagnosis of a disease using DNB in the embodiment.
  • samples are taken at a plurality of stages (stage-1, stage-2,..., Stage-T).
  • stage-1, stage-2,..., Stage-T stages
  • the interval between two successive stages can be set as long as days, weeks, months or years depending on the disease situation, but each stage takes samples at different time points in a short period of time. It is desirable to do.
  • 6 samples are taken at 6 time points of the day.
  • the interval between each time point can be, for example, several minutes or several hours depending on the situation.
  • FIG. 8 is a flowchart showing an example of an early diagnosis method of disease by DNB in the embodiment.
  • the disease early diagnosis method using DNB mainly includes a sample collection process (s100), a differential biomolecule selection (s200), a DNB candidate selection process (s300), A DNB determination process based on significance analysis (s400) and a diagnosis result output process (s500) are included.
  • s100 sample collection process
  • s200 differential biomolecule selection
  • s300 DNB candidate selection process
  • s400 DNB determination process based on significance analysis
  • s500 diagnosis result output process
  • Sample collection processing Similar to a general disease diagnosis method, a sample for collecting necessary physiological data is collected according to the disease to be diagnosed. For example, in the case of liver damage, samples such as blood and liver tissue are collected.
  • a sample collected from the diagnosis target when making a diagnosis is a control sample. It can be.
  • differential biomolecule s200: According to the differential biomolecule selection process flowchart shown in FIG. 4, a differential biomolecule is selected from the sample collected in step s100.
  • DNB candidate selection process (s300): According to the DNB candidate selection flowchart shown in FIG. 5, a dominant group that is a candidate for DNB is selected from the differential biomolecules selected in step s200.
  • DNB determination process by significance analysis (s400): According to the flowchart showing the DNB determination method by significance analysis shown in FIG. 6, it is determined whether or not the DNB candidate selected in step s300 is a DNB. .
  • Diagnosis result output (s500): If it is determined in step s400 that there is no DNB, the DNB candidate data selected in step s300 is stored in the storage device as reference data for the next diagnosis, and an abnormality is recognized. Outputs the diagnostic result to the effect. On the other hand, if it is determined in step s400 that there is a cluster certified as a DNB, the biomolecule data of the certified cluster is stored as a member of the DNB, and a diagnosis result indicating that it is in a pre-disease state is output. In addition, a diagnosis result associated with the detected DNB can be output. In addition, although shown as a diagnosis result here, it is a result used as a reference of the diagnosis by a doctor. That is, the diagnosis result output in step s500 is not diagnosis by the doctor itself but output data that serves as a reference for diagnosis in order to support diagnosis as an aid to the diagnosis of the doctor.
  • a comprehensive index I that comprehensively reflects the characteristics of DNB can be output as a diagnosis result.
  • FIG. 9 and FIG. 10 are examples of figures that display the disease risk proportional to the overall index I.
  • the entire arrow indicates the pre-disease state (pre-morbidity)
  • the flow in the direction indicated by the arrow indicates the temporal change of the disease state (onset)
  • the diamond mark located on the left side of the arrow indicates diagnosis. It is a disease risk pointer whose position changes according to the value of the obtained overall index I. The larger the value of the overall index I is, the larger the diamond mark is set to approach the right side of the arrow.
  • the dotted rhombus marks indicate the total index obtained by the diagnosis on July 1, 2011, and the solid rhombus marks indicate the total index obtained by the diagnosis on September 1, 2011. It is possible to intuitively determine that the disease state is approached from the positional change of the rhombus mark.
  • a map of all networks including the detected DNB or a part of the network including the DNB (for example, FIG. 15 described later) can be output.
  • DNB appears in a pre-disease state that transitions from a normal state to a disease state, but a biomolecule detected as DNB, that is, a gene, protein, or metabolite itself is not necessarily a factor that exacerbates the disease. It is not necessarily a pathological gene, protein, or metabolite. However, some DNB members have been found to be associated with disease.
  • a substance (gene, protein or metabolite) related to a specific disease contained in the detected member of DNB is extracted, for example, a diagnosis subject such as a examiner may develop due to a doctor's diagnosis. A certain degree of sexual disease can be grasped.
  • a database storing the correspondence between genes, proteins or metabolites and diseases is used to detect the relationship between the detected DNB and the disease.
  • a gene, protein, or metabolite can be extracted and output as a diagnostic result that serves as a reference for diagnosis.
  • FIG. 11 is a block diagram illustrating a configuration example of a detection device according to the present invention.
  • the detection apparatus 1 shown in FIG. 11 is realized using a personal computer, a client computer connected to a server computer, and other various computers.
  • the detection apparatus 1 includes various mechanisms such as a control unit 10, a recording unit 11, a storage unit 12, an input unit 13, an output unit 14, and an acquisition unit 15.
  • the control unit 10 is configured using a circuit such as a CPU (Central Processing Unit) and is a mechanism that controls the entire detection apparatus 1.
  • a CPU Central Processing Unit
  • the recording unit 11 is a non-volatile auxiliary recording mechanism such as a magnetic recording mechanism such as an HDD (Hard Disk Disk Drive) or a non-volatile semiconductor recording mechanism such as an SSD (Solid State Disk).
  • the recording unit 11 records various programs and data such as the detection program 11a according to the present invention.
  • the storage unit 12 is a volatile main storage mechanism such as SDRAM (Synchronous Dynamic Random Access Memory), SRAM (Static Random Access Memory) or the like.
  • SDRAM Serial Dynamic Random Access Memory
  • SRAM Static Random Access Memory
  • the input unit 13 is an input mechanism including hardware such as a keyboard and a mouse, and software such as a driver.
  • the output unit 14 is an output mechanism including hardware such as a monitor and a printer, and software such as a driver.
  • the acquisition unit 15 is a mechanism for acquiring various data from the outside. Specifically, these are various hardware such as a LAN (Local Area Network) port for capturing data via a communication network, a port connected to a dedicated line such as a parallel cable connectable to a measuring device, and software such as a driver. .
  • LAN Local Area Network
  • the computer executes various procedures related to the detection program 11a. It functions as the detection device 1.
  • storage part 12 both have the same function of recording various information, and which mechanism is made to record according to a specification, an operation form, etc. of an apparatus? Can be determined as appropriate.
  • FIG. 12 is a flowchart showing an example of DNB detection processing by the detection apparatus 1 according to the present invention.
  • the process of the detection apparatus 1 according to the present invention executes the above-described DNB detection process.
  • the control unit 10 of the detection apparatus 1 uses the acquisition unit 15 to acquire measurement data for a plurality of factor items obtained by measurement related to the living body (Sc1).
  • Step Sc1 corresponds to the high-throughput data acquisition process shown as step s1 in FIG.
  • the factor item here refers to a measurement item related to a gene that can be a node of the above-mentioned DNB, a measurement item related to a protein, and a metabolite. Measurement items such as measurement items are shown. It is also possible to use measurement items related to images obtained from in-vivo images output by a measurement device such as a CT scan.
  • Step Sc2 corresponds to the differential biomolecule selection process shown as step s2 in FIG.
  • the control unit 10 performs a test on significance based on the measurement data of each factor item and the comparison result with the factor item and reference data set in advance for each time series ( Sc21) includes a process (Sc22) for selecting a factor item that has been tested to be significant over time. That is, the various processes shown in FIG. 4 are executed.
  • the data processed as reference data by the detection device 1 is a control sample.
  • the detection device 1 uses the reference data for the sample based on the setting such that the first acquired sample is a control sample. As the handling.
  • the control unit 10 classifies the plurality of factor items into a plurality of clusters based on the correlation of the time series changes of the respective measurement data of each selected factor item (Sc3).
  • Step Sc3 corresponds to the clustering process shown as step s3 in FIG.
  • the control unit 10 corresponds to a selection condition set in advance from each classified cluster based on the correlation between the time series change of each measurement data of each factor item and the time series change of the measurement data between each factor item.
  • a cluster is selected (Sc4).
  • Step Sc4 corresponds to the DNB candidate selection process shown as step s4 in FIG.
  • the control unit 10 calculates, for each cluster, the average value of the values indicating the correlation of the measurement data of each factor item in the cluster as the first index (Sc41). An average value of values indicating correlation between the measurement data of the factor item and the measurement data of the factor item outside the cluster is calculated as a second index (Sc42), and the standard deviation of the measurement data for each factor item in the cluster is calculated.
  • the process (Sc43) which calculates an average value as a 3rd index
  • the control unit 10 calculates a comprehensive index based on the product of the first index, the second index, and the reciprocal of the third index (Sc44), and the calculated total index is the maximum.
  • a process of selecting a cluster is included. That is, various processes shown in FIG. 5 are executed.
  • the first index, the second index, the third index, and the overall index for example, the average value PCCd (k) of the absolute value of the Pearson correlation coefficient between the nodes in the cluster, The average value OPPCd (k) of the absolute value of the Pearson correlation function between the nodes, the average value SDd (k) of the standard deviation of the nodes in the cluster, and the overall index I (k) are used.
  • the control unit 10 detects factor items included in the selected cluster as biomarker candidates (Sc5).
  • Step Sc5 corresponds to the DNB determination process shown as step s5 in FIG.
  • the control unit 10 calculates the reference standard deviation indicating the average value of the standard deviation of the corresponding reference data for each factor item (Sc51), and averages the values indicating the correlation between the factor items.
  • a reference correlation value indicating the value is calculated (Sc52).
  • the first index increases with significance compared to the reference standard deviation
  • the second index decreases with significance compared to the reference correlation value
  • the third index increases with significance compared to the reference standard deviation.
  • a process (Sc53) of detecting an item included in the cluster as a biomarker is included. That is, various processes shown in FIG. 6 are executed.
  • the reference standard deviation and the reference correlation value for example, the average value PCCdr of the absolute value of the Pearson correlation coefficient between the nodes and the average value SDdr of the standard deviation of each node are used.
  • control part 10 outputs the factor item detected as a biomarker candidate from the output part 14 (Sc6), and complete
  • the diagnosis method of the present invention is used for diagnosis using the experimental data of the mouse in which the lung injury is caused, and the diagnosis result is used as the actual medical condition Compared with the progress, the effectiveness of the diagnostic method of the present invention was verified.
  • the experimental data is divided into a group of experiments and a control group of CD-1 male mice.
  • the case group is in a normal air environment, and the control group is in an air environment containing phosgene, a toxic gas. It was obtained from an experiment to observe the health status of both groups of mice and investigate the molecular mechanisms of acute lung injury from phosgene inhalation.
  • the health status of mice in case groups exposed to phosgene was diagnosed using the diagnostic method of the present invention. Normally, mice inhal a certain amount of phosgene and develop phosgene-induced lung injury.
  • FIG. 13 is a table showing diagnostic data in the first verification example.
  • the diagnosis object is a mouse (CD-1 male mouse) suffering from phosgene-induced lung injury
  • the sample collection object is a mouse of a case group to be a diagnosis object and a control group to be a reference object.
  • the sampling point is the time point when 0, 0.5, 1, 4, 8, 12, 24, 48, 72 hours have elapsed since the start of the experiment, and the sampling point of the gene used for the detection of DNB The number is 22690.
  • differentially expressed genes are selected from high-throughput gene data measured from each sample. At each sampling point, six case samples and six control samples are provided. At the first sampling point (0h), the case sample data is the same as the control sample data.
  • the selected gene set B was clustered by collecting highly correlated ones into one cluster at each sampling point, and 40 clusters were obtained.
  • the cluster with the largest overall index I is selected as a DNB candidate from each cluster in the calculated case group, and the average value of the standard deviation of the control group is selected for the DNB candidate.
  • SDc the average value of the Pearson correlation coefficient between genes, whether or not it is DNB is determined by significance analysis.
  • PCCc the average value of the Pearson correlation coefficient between genes
  • DNB was detected at the fifth sampling point (8h), and the DNB is the 111th cluster having 220 genes.
  • FIG. 14A is a graph showing an example of a time-series change in the average value SDd of the standard deviations of the detected DNB candidates in the first verification example.
  • FIG. 14B is a graph illustrating an example of a time-series change in the average value PCCd of the absolute values of the Pearson correlation coefficients between members of the detected candidate cluster of the DNB in the first verification example.
  • FIG. 14C is a graph showing an example of a time-series change in the average value OPCCd of the absolute value of the Pearson correlation coefficient between a member of the detected candidate cluster of DNB and another gene in the first verification example. is there.
  • FIG. 14D is a graph showing an example of a time-series change of the overall index I of the detected DNB candidates in the first verification example.
  • the horizontal axis represents the time stage t
  • the vertical axis represents the average value SDd of the standard deviation (FIG. 14A), the average value PCCd of the absolute value of the Pearson correlation coefficient between the members of the cluster, respectively.
  • FIG. 14B shows the average value OPCCd (FIG. 14C) of the absolute value of the Pearson correlation coefficient between cluster members and other genes, and the overall index I (FIG. 14D).
  • the broken line shows the change with time of various indexes of DNB candidates detected from the case group, and the solid line shows the change with time of various indexes of one cluster selected from the control group.
  • the fourth time stage ie, after 4 hours
  • the first index PCCd, the third index SDd, and the overall index I of the DNB candidates start to increase greatly
  • the peak is reached at the time stage (ie, after 8 hours).
  • the third index OPCCd of the DNB candidate decreases from the second time stage, and shows a minimum value at the same fifth time stage (ie, 8 hours have elapsed).
  • FIG. 15 is a map showing an example of dynamic characteristics of DNB over time in a network configured by case group genes in the first verification example.
  • FIG. 15 shows the gene network of the case group (3452 genes, 9238 links) at each sampling point of 0.5, 1, 4, 8, 12, 24, 48, 72h in order.
  • a node indicated by “ ⁇ ” is a gene belonging to a DNB candidate
  • a node indicated by “ ⁇ ” is another gene in the vicinity of the candidate node for DNB
  • a node between nodes The line shows the correlation between both nodes.
  • the color density of “ ⁇ ” indicates the magnitude of the standard deviation SD of the gene
  • the density of the connection line of both nodes indicates the magnitude of the absolute value of the correlation coefficient PCC of both nodes.
  • DNB candidate characteristics change over time, and gradually evolve from a normal cluster that behaves the same as other genes to a DNB.
  • SD DNB candidate characteristics
  • PCC pre-disease state defect
  • mice developed pulmonary edema 8 hours after inhalation of phosgene, 50% to 60% died 12 hours later, and another 60% after 24 hours. ⁇ 70% died.
  • ⁇ Second verification example> In the first verification example described above, the effectiveness of the method for early diagnosis of diseases by DNB of the present invention was verified using data from animal experiments. In this verification example, the diagnostic accuracy of the method for early diagnosis of disease by DNB of the present invention is further verified using clinical data of B cell lymphoma.
  • FIG. 16 is a table listing diagnosis data in the second verification example.
  • the samples were resting (P1), active (P2), critical (P3), metastatic (P4), aggressive (P5 ) Is divided into groups of five stages.
  • the number of samples is 5, 3, 6, 5, 7 respectively.
  • the splenomegaly is “None”, “None”, “+/ ⁇ ”, “+”, “++++”, respectively.
  • the flow cytometry is “normal rest”, “normal activity”, “abnormal”, “mixed”, and “B-1 clone”, respectively.
  • a sample collected in the rest period (P1) is used as a control sample, and samples collected in other stages (P2 to P5) are used as case samples.
  • FIGS. 17A to 17D show indexes of DNB candidates detected from case group genes.
  • FIG. 17A is a graph showing an example of a time-series change in the average value SDd of the standard deviations of the detected DNB candidates in the second verification example.
  • FIG. 17B is a graph illustrating an example of a time-series change in the average value PCCd of the absolute values of the Pearson correlation coefficients between members of the detected candidate cluster of the DNB in the second verification example.
  • FIG. 17A is a graph showing an example of a time-series change in the average value SDd of the standard deviations of the detected DNB candidates in the second verification example.
  • FIG. 17B is a graph illustrating an example of a time-series change in the average value PCCd of the absolute values of the Pearson correlation coefficients between members of the detected candidate cluster of the DNB in the second verification example.
  • FIG. 17C is a graph showing an example of a time-series change in the average value OPCCd of the absolute value of the Pearson correlation coefficient between the member of the detected candidate cluster of DNB and another gene in the second verification example. is there.
  • FIG. 17D is a graph illustrating an example of a time-series change in the overall index I of the detected DNB candidates in the second verification example.
  • the horizontal axis indicates the number of the stage (P1 to P4), and the vertical axis indicates the mean value SDd of the standard deviation (FIG. 17A) and the Pearson correlation coefficient between the cluster members, respectively.
  • Average value PCCd of absolute values (FIG. 17B), average value OPCCd of absolute values of Pearson correlation coefficients between cluster members and other genes (FIG. 17C), and overall index I are shown (FIG. 17D). .
  • the diagnosis result shows that there is no abnormality.
  • a warning signal indicating a pre-disease state was detected in the active period, so that a diagnosis result that “a sign of abnormality is seen” is obtained. Can tell the patient. Therefore, the patient stops the worsening of the medical condition by taking treatment measures at an early stage.
  • the DNB according to the present invention can not only notify a patient of an abnormality at an early stage as a warning signal indicating a pre-disease state, but also can specifically identify a gene associated with the disease. It seems to be very useful for the treatment of complex diseases and pharmaceuticals.
  • the above embodiment discloses only a part of the myriad examples of the present invention, and the design can be appropriately changed in consideration of various factors such as the type of disease and the purpose to be detected. is there.
  • various measurement data can be used as long as it is information obtained by measurement related to a living body.
  • the measurement data is not limited to the measurement data related to the genes, proteins, and metabolites described above, but is converted into measurement data by quantifying various situations of each part based on in-vivo images output by a measurement device such as a CT scan. It is possible to use.
  • a measurement device such as a CT scan.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Immunology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Organic Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)

Abstract

 健康状態から疾病状態への遷移を示す疾病前状態の診断に用いるることが可能なバイオマーカーの候補を検出する検出装置、検出方法及び検出プログラムを提供する。 測定対象から複数の生体サンプルを異なる時間点で採取し、採取した生体サンプルを測定して得られた測定データを集計して統計データを取得する。そして、ハイスループットデータの取得処理(s1)と、差次的生体分子の選出処理(s2)と、クラスター化処理(s3)と、DNBの候補の選出処理(s4)と、有意性分析によるDNBの判定処理(s5)とを行う。

Description

動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
 本発明は、生体に関する測定により得られた複数の因子項目の測定データに基づいて、前記生体の症状の指標となるバイオマーカーの候補を検出する検出装置、検出方法及び検出プログラムに関する。
 様々な研究結果によると、多くの疾病、特に複雑な疾病の悪化進行のプロセスは、気候システム、生態システム、経済システム等のシステムと同様に、ある臨界閾値を超えた時点、いわゆる分岐点に達すると、状態遷移が突然発生し、健康状態から急激に疾病状態に変化する(例えば、非特許文献1~5参照)。このような複雑疾病の動的メカニズムに関する研究において、疾病悪化(例えば、喘息発作、癌の発病)の進行プロセスを、時間に依存した非線形動力学システムとしてモデル化し、モデル化したシステムを観測することによって、分岐点での相転移で病気が急激に悪化することが既に判明している(非特許文献1、6参照)。
 図1は、疾病の進行プロセスを概念的に示す説明図である。図1のaは、疾病の進行プロセスを模式的に示している。図1のb、c及びdは、進行プロセスの過程において、前述のモデル化したシステムの安定性をポテンシャル関数として示し、横軸に経過を示す時刻をとり、縦軸にポテンシャル関数の値をとって概念的に示したグラフである。図1のaに示すように、疾病悪化の進行プロセスは、正常状態(健康状態)、疾病前状態、疾病状態として表すことができる。正常状態において、システムは安定して、図1のbに黒丸の位置として示すように、ポテンシャル関数の値が最小値になっている。疾病前状態において、システムは、図1のcに黒丸の位置として示すように、ポテンシャル関数の値が高くなっている。したがって、外乱の影響を受けやすい状態であり、小さな外乱を受けるだけで相転移してしまう分岐点の付近、即ち、正常状態の限界に位置している。但し、当該疾病前状態は、適切な処置によって、容易に正常状態に回復することができる。一方、疾病状態において、システムは安定して、図1のdに黒丸の位置として示すように、ポテンシャル関数の値が大局的最小値になっている。そのため、正常状態から相転移で生じたこの疾病状態が、正常状態へ回復することは困難である。
 したがって、もし疾病前状態を検知して、疾病状態に遷移する前に、疾病状態に遷移しつつあることを患者に予告することができれば、適切な措置を取ることによって、患者を疾病前状態から正常状態へ回復させることができる可能性が高い。
 即ち、分岐点(臨界閾値)を検出することができれば、臨界遷移の予測が可能であり、病気の早期診断を実現することができる。
 なお、従来から疾病状態を診断する方法として、バイオマーカーが用いられている。従来から用いられている通常のバイオマーカーは、生体から採取された血清、尿等の体液、更には、組織に含まれる分子レベルのDNA、RNA、蛋白質、代謝物等であり、生体内の生物学的変化を定量的に把握することができる指標である。従来のバイオマーカーによる疾病の診断方法は、ノーマルサンプル(健康状態で採取したサンプル)から抽出したバイオマーカーと異常サンプル(疾病状態で採取したサンプル)から抽出したバイオマーカーとを比較することにより、病気を診断する方法である。
ヴェネガス・ジェイ・ジー(Venegas,J.G.)等著,「破壊変化に対する前奏曲のような喘息の自己組織(Self-organized patchiness in asthma as a prelude to catastrophic shifts.),(英国),ネイチャー(Nature),ネイチャーパブリッシンググループ(Nature Publishing Group ),2005年,434巻,p.777-782 マックシャーリー・ピー・イー(McSharry,P.E. )、スミス・エル・エー(Smith,L.A.)、タラッセンコ・エル(Tarassenko,L)著,「癇癪発作の予測:非線形方法が適切であるか。(Prediction of epileptic seizures:are nonlinear methods relevant.)」,(英国),ネイチャー・メディシン(Nature Medicine ),ネイチャーパブリッシンググループ(Nature Publishing Group ),2003年,9巻,p.241-242 ロベルト・ピー・ビー(Roberto,P.B.)、エリセオ・ジー(Eliseo, G.)、ジョセフ・エフ・シー(Josef,C.),「物流回帰の変化点推定のための転移モデル(Transition models for change-point estimation in logistic regression. )」,(米国),医学における統計(Statistics in Medicine),ワイリーブラックウェル(Wiley-Blackwell ),2003年,22巻,p.1141-1162 ペック・エス(Paek,S.)等著,「音響神経腫に対するガンマナイフ手術後、聴覚保存(Hearing preservation after gamma knife stereotactic radiosurgery of vestibular schwannoma.)」,(米国),キャンサー(Cancer),ワイリーブラックウェル(Wiley-Blackwell ),2005年,1040巻,p.580-590 リウ・ジェイ・ケイ(Liu,J.K.)、ロビット・アール・エル(Rovit,R.L.)、クッドウェル・ダブリュー・ティー(Couldwell,W.T.),「脳下垂体卒中(Pituitary Apoplexy)」,(米国),セミナーズ・イン・ニューロサージェリー(Seminars in neurosurgery),ティーメ(Thieme)2001年,12巻,p.315-320 タナカ・ジー(Tanaka,G. ),ツモト・ケイ(Tsumoto,K.),ツジ・エス(Tsuji,S.)、アイハラ・ケイ(Aihara,K. )著,「前立腺癌に対する間歇的なホルモン療法のハイブリッドシステムモデルの分岐点分析。(Bifurcation analysis on a hybrid systems model ofintermittent hormonal therapy for prostate cancer.)」,(米国),フィジカル・レビュー(Physical Review ),アメリカ物理学会,2008年,237巻,p.2616-2627
 しかしながら、複雑疾病の場合、臨界遷移の予測は極めて困難である。その理由は以下の通りである。
 第一に、疾病前状態は、正常状態の境界であり、分岐点に達する前に、著しい変化が生じ難い。そのため、従来のバイオマーカー、スナップショット測定等の手法による診断では、正常状態と疾病前状態とを区別することが難しい。
 第二に、様々な研究がなされている中で、分岐点を予測するための早期診断用の警告信号を精度高く検出することができる信頼性の高い疾病モデルがまだ開発されていない。特に、同じ疾病でも、個人によって、疾病悪化の進行プロセスが異なるため、モデルベースの診断方法は、成功する確率が低い。
 第三に、疾病前状態の検出対象は患者であり、通常、一人の患者から得られるサンプルの数が限られているため、長期間にわたって、予測に必要な十分なサンプルを採取することが困難である。
 しかも、従来のバイオマーカーによる疾病の診断方法は、正常状態と疾病状態とを比較することによって診断を行う方法であり、診断された時点では、患者はすでに疾病状態に陥り、以前の正常状態に戻ることは難しい。
 それに対して、本発明は、疾病状態へ遷移する前の疾病前状態を検出することができる検出装置、検出方法及び検出プログラムを提供し、さらに、疾病モデルが不要で、数少ない生体サンプルだけで診断を補助することが可能な検出装置等を提供することを目的としている。
 上記目的を達成するために、本発明に係る検出装置は、生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する検出装置であって、前記各因子項目のそれぞれの測定データの時系列変化の相関関係に基づいて複数の因子項目を複数のクラスターに分類する分類手段と、分類した各クラスターから、前記各因子項目のそれぞれの測定データの時系列変化及び各因子項目間の測定データの時系列変化の相関関係に基づいて予め設定された選出条件に該当するクラスターを選出する選出手段と、選出したクラスターに含まれる因子項目をバイオマーカーの候補として検出する検出手段とを備えることを特徴とする。
 上記特徴を有する検出装置は、正常状態から疾病状態へ遷移する前の疾病前状態を示す警告信号となるバイオマーカーの候補を検出することができる。また、バイオマーカーを特定することができれば、検出対象から数少ないサンプルを採取するだけで疾病前状態を判別することができる。
 また、本発明に係る検出装置において、前記選出手段は、クラスター内の各因子項目間の測定データの相関を示す値の平均値を第1指数として算出する手段と、クラスター内の因子項目の測定データと当該クラスター外の因子項目の測定データとの間の相関を示す値の平均値を第2指数として算出する手段と、クラスター内の各因子項目について測定データの標準偏差の平均値を第3指数として算出する手段とを含み、複数のクラスターのうちから、第1指数、第2指数及び第3指数に基づいて、バイオマーカーとすべき因子項目を含むクラスターを選出することを特徴とする。
 したがって、前記第1指数、第2指数、第3指数を用いることにより、各クラスターの特性を定量的評価することができ、バイオマーカーを容易に選出することができる。
 また、本発明に係る検出装置において、前記選出手段は、前記第1指数と、前記第2指数と、前記第3指数の逆数との積に基づく総合指数が最大であるクラスターを選択することを特徴とする。
 したがって、総合指数に基づいてクラスターを選択することにより、バイオマーカーの候補となる因子項目の信頼性を高めることができる。
 また、本発明に係る検出装置は、前記各因子項目のそれぞれの測定データが、有意性をもって経時的に変化しているか否かを検定する差次検定手段を更に備え、前記分類手段は、経時的変化に有意性があると検定された因子項目について分類することを特徴とする。
 したがって、経時的に著しい変化を示した因子項目を選出することにより、膨大な測定データから、バイオマーカーの候補を効率的に検出することができる。
 また、本発明に係る検出装置は、前記差次検定手段は、各因子項目の測定データ、並びに因子項目及び時系列毎に予め設定されている参照データとの比較結果に基づいて、有意性に係る検定を行うことを特徴とする。
 したがって、検出対象となる前記複数の因子項目に係る測定データの他に、参照基準となる生体サンプルを参照データとして取得することによって、測定データと参照データとを比較し、外乱を排除して検出を行うことができる。
 また、本発明に係る検出装置は、各因子項目について、対応する参照データの標準偏差の平均値を示す参照標準偏差、及び因子項目間の相関を示す値の平均値を示す参照相関値を算出する手段を更に備え、前記検出手段は、前記第1指数が前記参照標準偏差に比べて有意性をもって増大し、前記第2指数が前記参照相関値に比べて有意性をもって減少し、かつ、前記第3指数が前記参照標準偏差に比べて有意性をもって増大した場合に、当該クラスターに含まれる項目をバイオマーカーの候補として検出することを特徴とする。
 したがって、選出された因子項目がバイオマーカーとして適切か否かを判定することができる。
 また、本発明に係る検出装置において、前記検出手段は、クラスターに含まれる複数の因子項目の有意性を、測定データの統計値に基づいて検定する手段を含み、有意性がある場合に、クラスターに含まれる項目をバイオマーカーの候補として検出することを特徴とする。
 したがって、検定により誤検出の発生を極力防止することができる。
 また、本発明に係る検出装置は、前記複数の因子項目のいずれかは、遺伝子に関する測定項目、タンパク質に関する測定項目、代謝物に関する測定項目、又は生体から得られる画像に関する測定項目であることを特徴とする。
 したがって、遺伝子、タンパク質、代謝物に関して測定項目を因子項目とすることにより、生体内の生物変化を定量的に把握して、検出結果の信頼性を向上させることができる。
 さらに、本発明に係る検出方法は、生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する検出装置を用いた検出方法であって、前記検出装置は、前記各因子項目のそれぞれの測定データの時系列変化の相関関係に基づいて複数の因子項目を複数のクラスターに分類する分類ステップと、分類した各クラスターから、前記各因子項目のそれぞれの測定データの時系列変化及び各因子項目間の測定データの時系列変化の相関関係に基づいて予め設定された選出条件に該当するクラスターを選出する選出ステップと、選出したクラスターに含まれる因子項目をバイオマーカーの候補として検出する検出ステップとを実行することを特徴とする。
 また、本発明に係る検出方法は、生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する検出方法であって、異なる時間点で採取した複数の生体サンプルのそれぞれから測定したハイスループットデータの中から、差次的生体分子を算出する分子スクリーニングステップと、相関の高い生体分子同士を1つのクラスターとするように、前記分子スクリーニングステップで選出した前記差次的生体分子を複数のクラスターに分類するクラスター化ステップと、前記クラスター化ステップで得られた複数のクラスターの中から、クラスター内の生体分子の間の相関の増大、クラスター内の生体分子の標準偏差の増大、及びクラスター内の生体分子と他の生体分子との間の相関の低減が最も著しいクラスターを、前記バイオマーカーの候補として先取する候補選択ステップと、前記候補選択ステップで選出したバイオマーカーの候補が前記バイオマーカーであるか否かを、有意性検定によって判定する判定ステップとを実行することを特徴とする。
 上記特徴を有する検出方法は、正常状態から疾病状態へ遷移する前の疾病前状態を示す警告信号となるバイオマーカーの候補を検出することができる。また、バイオマーカーを特定することができれば、検出対象から数少ないサンプルを採取するだけで疾病前状態を判別することができる。
 さらに、本発明に係る検出プログラムは、コンピュータに、生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する処理を実行させる検出プログラムであって、コンピュータに、前記各因子項目のそれぞれの測定データの時系列変化の相関関係に基づいて複数の因子項目を複数のクラスターに分類する分類ステップと、分類した各クラスターから、前記各因子項目のそれぞれの測定データの時系列変化及び各因子項目間の測定データの時系列変化の相関関係に基づいて予め設定された選出条件に該当するクラスターを選出する選出ステップと、選出したクラスターに含まれる因子項目をバイオマーカーの候補として検出する検出ステップとを実行させることを特徴とする。
 上記特徴を有する検出プログラムは、コンピュータにて実行することにより、コンピュータが、本発明に係る検出装置として動作する。したがって、正常状態から疾病状態へ遷移する前の疾病前状態を示す警告信号となるバイオマーカーの候補を検出することができる。また、バイオマーカーを特定することができれば、検出対象から数少ないサンプルを採取するだけで疾病前状態を判別することができる。
 本発明によれば、生体サンプルを診断対象から採取し、採取した生体サンプルにおいて、疾病状態になる直前の疾病前状態を示す警告信号となるバイオマーカーが存在するか否かを調べることにより、診断対象が疾病前状態にあるか否かを診断することができる。そのため、疾病悪化のモデルを構築する必要がなく、疾病悪化の駆動要素を特定する必要もなく、疾病になる前の段階で、疾病の早期診断を実現することができる。
図1は、疾病の進行プロセスを説明する模式図である。 図2は、本発明の検出方法に係るDNBの動的特性を例示する模式図である。 図3は、実施の形態におけるDNBの検出方法の一例を示すフローチャートである。 図4は、実施の形態における差次的生体分子の選出処理の一例を示すフローチャートである。 図5は、実施の形態におけるDNBの候補の選出処理の一例を示すフローチャートである。 図6は、実施の形態におけるDNBの判定処理の一例を示すフローチャートである。 図7は、実施の形態におけるDNBによる疾病の早期診断方法による診断スケジュールの一例を示す図である。 図8は、実施の形態におけるDNBによる疾病の早期診断方法の一例を示すフローチャートである。 図9は、総合指数Iに比例した疾病リスクを表示する図形の一例である。 図10は、総合指数Iに比例した疾病リスクを表示する図形の一例である。 図11は、本発明に係る検出装置の構成例を示すブロック図である。 図12は、本発明に係る検出装置によるDNBの検出処理の一例を示すフローチャートである。 図13は、第1の検証例における診断用のデータを示すテーブルである。 図14Aは、第1の検証例において、検出されたDNBの候補の標準偏差の平均値の時系列変化の例を示すグラフである。 図14Bは、第1の検証例において、検出されたDNBの候補のクラスターのメンバー間のピアソン相関係数の絶対値の平均値の時系列変化の例を示すグラフである。 図14Cは、第1の検証例において、検出されたDNBの候補のクラスターのメンバーと他の遺伝子との間のピアソン相関係数の絶対値の平均値の時系列変化の例を示すグラフである。 図14Dは、第1の検証例において、検出されたDNBの候補の総合指数の平均値の時系列変化の例を示すグラフである。 図15は、第1の検証例において、ケースグループの遺伝子によって構成されたネットワークにおけるDNBの動的特性の一例を経時的に示すマップである。 図16は、第2の検証例における診断データのテーブルである。 図17Aは、第2の検証例において、検出されたDNBの候補の標準偏差の平均値の時系列変化の例を示すグラフである。 図17Bは、第2の検証例において、検出されたDNBの候補のクラスターのメンバー間のピアソン相関係数の絶対値の平均値の時系列変化の例を示すグラフである。 図17Cは、第2の検証例において、検出されたDNBの候補のクラスターのメンバーと他の遺伝子との間のピアソン相関係数の絶対値の平均値の時系列変化の例を示すグラフである。 図17Dは、第2の検証例において、検出されたDNBの候補の総合指数の平均値の時系列変化の例を示すグラフである。
 本発明の発明者らは、1つのサンプルから数千個の情報、即ち高次元データを得ることが可能なゲノムハイスループットテクノロジーを利用して、分岐プロセス理論に基づいて、複雑疾病の時間発展の数理モデルを構築し、分子ネットワークレベルにおける疾病悪化の進行メカニズムの研究を行った。その結果、疾病前状態において、臨界遷移発生前の直前分岐(突然悪化)状態を検出することができる動的ネットワークバイオマーカー(DNB:Dynamical Network Biomarker )の存在を解明した。当該動的ネットワークバイオマーカーを疾病前状態の警告信号として利用すれば、疾病モデルが不要で、数少ないサンプルだけで複雑疾病の早期診断を実現することができる。以下に、動的ネットワークバイオマーカーに基づく本発明を実施するための形態について説明する。
<理論根拠>
 先ず、本発明の基となる理論根拠について説明する。通常、疾病の進行プロセスに係るシステム(以下、システム(1)という)を次の式(1)で表すことができる。
  Z(k+1)=f(Z(k);P)   …式(1)
 ここで、Z(k)=(z1(k)、... 、zn(k))は、時刻k(k=0、1、... )で観測されたシステム(1)の動的状態を表す変数であり、遺伝子発現量、タンパク質発現量、代謝物発現量等の情報とすることができる。詳細には、遺伝子、タンパク質等の分子に係る濃度、個数等の情報である。Pは、システム(1)の状態遷移を駆動する緩やかに変化するパラメータであり、例えば、SNP(Single Nucleotide Polymorphism),CNV(Copy Number Variation )等の遺伝的要因、メチル化、アセチル化等の非遺伝的要因等の情報とすることができる。f=(f1、... 、fn)はZ(k)の非線形関数である。
 正常状態、疾病状態はそれぞれ、状態方程式Z(k+1)=f(Z(k);P)のアトラクタで表すことができる。複雑疾病の進行プロセスは、非常に複雑な動的特性を有するため、関数fは、数千個の変数を有する非線形関数である。しかも、システム(1)を駆動する要素Pは特定しにくいものである。そのため、正常状態及び疾病状態のシステムモデルを構築し解析することは大変困難である。
 それに対して、本発明の発明者らが着目したのは、正常状態から疾病状態へ遷移する直前のシステムの臨界遷移状態、即ち疾病前状態である。一般的に、システム(1)には、次の特性を有する平衡点が存在する。
 1. Z* は、システム(1)の固定点とすれば、Z* =f(Z* ;P)、
 2. Pcをシステムが分岐する閾値とすれば、P=Pcの時、ヤコビ行列∂f(Z;Pc)/∂Z|Z=Z* の1つの実数固有値又は1対の複素共役の固有値の絶対値が1になる、
 3. P≠Pcの時、一般的に、システム(1)の固有値の絶対値が1ではない。
 発明者らは、上記特性から、システム(1)が臨界遷移状態になると、次のような特異な特性が現れることを理論的に解明した。即ち、システム(1)が臨界遷移状態になると、システム(1)の各変数z1,... ,znのそれぞれをノードとして構成したネットワーク(1)において、一部のノードからなる支配グループ(サブネットワーク)が現れる。臨界遷移状態に現れる支配グループは、理想的には、次のような得意な特性を有する。
(I) ziとzjは支配グループに属するノードである場合、
PCC(zi,zj)→±1;
SD(zi)→∞;
SD(zj)→∞.
(II) ziは支配グループに属するノードであるが、zjは支配グループに属するノードではない場合、
PCC(zi,zj)→0;
SD(zi)→∞;
SD(zj)→境界値.
(III) ziとzjは支配グループに属するノードではない場合
 PCC(zi,zj)→α、α∈(-1,1)\{0};
SD(zi)→境界値;
SD(zj)→境界値.
 ここで、PCC(zi,zj)はziとzjとの間のピアソン相関係数であり、SD(zi)、SD(zj)はziとzjとの標準偏差である。
 即ち、ネットワーク(1)において、上記特異な特性(I)~(III)を有する支配グループの出現は、システム(1)が臨界遷移状態(疾病前状態)に遷移していることの兆候として捉えることができる。したがって、当該支配グループを検出することにより、システム(1)の臨界遷移を検出することができる。即ち、当該支配グループを臨界遷移、即ち、疾病悪化直前の疾病前状態を示す警告信号とすることができる。そうすれば、システム(1)がいくら複雑であっても、駆動要素が不明であっても、警告信号となる支配グループだけを検出すれば、システム(1)の数理モデルを直接扱うことなく、疾病前状態であることを特定することができる。疾病前状態であることを特定することにより、疾病に対する事前対策及び早期治療を実現することが可能となる。
 本発明において、疾病前状態を示す警告信号となる当該支配グループを動的ネットワークバイオマーカー(以下、DNBと略称する)と称する。
<DNBの特性及び判定条件>
 上述したように、DNBは、特異な特性(I)~(III)を有する支配グループであって、複数のノードからなるサブネットワークとして、システム(1)が疾病前状態になるときに、ネットワーク(1)に現れるものである。ネットワーク(1)において、各ノード(z1,... ,zn)を、遺伝子、タンパク質、代謝物等の生体分子について測定の対象となる因子項目とすれば、DNBは、上記特異な特性(I)~(III)を満たした一部の生体分子に係る因子項目からなるグループ(サブネットワーク)である。
 さらに、上記特異な特性(I)~(III)に基づいて、DNBを判定する条件を以下の通り定めることができる。
 ・条件(I):ネットワーク(1)に存在する一部の生体分子(遺伝子、タンパク質又は代謝物)からなるグループであって、当該グループ内の生体分子の間のピアソン相関係数PCCの絶対値の平均値が著しく増大する。
 ・条件(II):当該グループ内の生体分子と他の生体分子との間のピアソン相関係数OPCCの絶対値の平均値が著しく低減する。
 ・条件(III):当該グループ内の生体分子の標準偏差SDの平均値が著しく増加する。
 上記DNBを判定する条件(I)~(III)を同時に満たした生体分子からなるグループをDNBと認定する。
 DNBの特性を直観的に説明するために、次に、6つのノードを有するネットワークを例として、当該ネットワークにおけるDNBの動的特性を説明する。図2は、本発明の検出方法に係るDNBの動的特性を例示する模式図である。図2のaは、疾病の進行プロセスとして、正常状態、疾病前状態及び疾病状態を示している。図2のb、c及びdは、進行プロセスの過程につき、正常状態、疾病前状態及び疾病状態において、モデル化したシステム(1)の安定性を、ポテンシャル関数として示し、横軸に経過を示す時刻をとり、縦軸にポテンシャル関数の値をとって概念的に示したグラフである。また、図2のe、f及びgは、正常状態、疾病前状態及び疾病状態のそれぞれに対応したシステム(1)のネットワーク状態の一例を概念的に示している。さらに、図2のhは、疾病前状態におけるDNBの因子項目となる分子濃度の時間変化の一例を示している。
 ノードz1~z6は、遺伝子、タンパク質、代謝物等の異なる種類の生体分子に係る因子項目を表すものであり、ノードz1~z6の間の接続ラインは、ノード間の相関を示し、ラインの太さは、ピアソン相関係数PCCの大きさを示し、z1~z6を囲む丸印の描画方法は、各ノードの標準偏差SDの大きさを示している。接続ラインの描画方法として、丸印内が空白の場合に標準偏差SDは最も小さく、一方向の斜線、二方向の斜線となるにつれて標準偏差SDが大きいことを示している。
 正常状態において、図2のeに示すように、各ノードは、相互の相関及びそれぞれの標準偏差がいずれも均等で、中レベルになっている。しかしながら、疾病前状態になると、他のノードに比べて、著しい特異な特性を示すグループ(z1~z3)が現れる。当該グループ内のノードz1~z3は、図2のfに示すように、相互間のピアソン相関係数が著しく増大し、他のノードz4~z6との間のピアソン相関係数が著しく低下している。また、当該グループ内のノードz1~z3の標準偏差は大きくなっている。その理由は、当該グループ内のノードz1~z3は、図2のhに示すように、異なる時刻(t=1、t=2、t=3)における濃度の変化が激しいからである。
 しかしながら、疾病状態へ遷移した後は、図2のgに示すように、当該グループ内の各ノードz1~z3の標準偏差はすこし大きくなっているが、各ノード間のピアソン相関係数は均等に中レベルに戻っている。即ち、当該グループ(z1~z3)の上記の特異な特性が消失している。
 図2に概念的に示すように、疾病前状態においては、その特性を有する一部のノードを含む支配グループが出現する。DNBと称するこのような支配グループの出現は、疾病前状態にあることを示し、疾病状態への遷移を予見することができる警告信号であり、疾病の早期診断のためのバイオマーカーとして使用することができる。また、DNBは、通常の疾病診断に使われている静的バイオマーカーと異なり、特性が変化しているネットワークにおいて現れるサブネットワークである。そこで、本願においては、当該支配グループをDNB(動的ネットワークバイオマーカー)と呼ぶこととした。
<警告信号>
 上述したように、DNBは、疾病前状態を示す警告信号として、疾病の早期診断に使用することができる。当該警告信号の強度を測るものとして、上述したDNB内のノード間のピアソン相関係数PCCの絶対値の平均値、DNB内のノードと他のノードとの間のピアソン相関係数OPCCの絶対値の平均値、及びDNBの標準偏差SDを用いることができる。さらに、DNBの特性を総合的に反映することができる総合指数Iを導入することができる。本発明において、一例として、次の式(2)で表す総合指数Iを導入する。
 I=SDd×PCCd/OPCCd  …式(2)
 式(2)において、PCCdはDNB内のノード間のピアソン相関関数の絶対値の平均値を示し、OPCCdはDNB内のノードと他のノードとのピアソン相関係数の絶対値の平均値を示し、SDdはDNB内のノードの標準偏差の平均値を示す。当該式(2)から分かるように、SDd及びPCCdが増大し、かつ、OPCCdが減少すると、当該総合指数Iは大幅に増大する。そのため、DNBの特性を高い感度で検出することができる。さらに、当該総合指数Iの値から、疾病状態との距離をある程度把握することができる。
<DNBの検出方法>
 図3は、実施の形態におけるDNBの検出方法の一例を示すフローチャートである。本発明の検出方法においては、先ず、生体に関する測定により測定データを得ることが必要である。DNAチップ等のハイスループット技術を利用すれば、1つの生体サンプルから2万個以上の遺伝子を測定することができる。統計的に分析するために、本発明において、測定対象から複数(6個以上)の生体サンプルを異なる時間点で採取し、採取した生体サンプルを測定して得られた測定データを集計して統計データを取得する。本発明におけるDNBの検出方法は、主に、図3に示すように、ハイスループットデータの取得処理(s1)と、差次的生体分子の選出処理(s2)と、クラスター化処理(s3)と、DNBの候補の選出処理(s4)と、有意性分析によるDNBの判定処理(s5)とを含む。次に、これらの各処理について詳細に説明する。
 ステップs1のハイスループットデータの取得処理は、検出対象となるサンプルをケースサンプルとし、参照用サンプルをコントロールサンプルとし、各サンプルから、それぞれのハイスループット技術を利用した生理学的データ、即ち、生体分子の発現量の測定データ(例えば、マイクロアレイデータ)を取得する処理である。参照用サンプルとは、検査の対象となる患者から事前に採取したサンプル、採取時に最初に採取したサンプル等のサンプルであり、測定装置の校正等の目的を有するコントロールサンプルとして用いられる。コントロールサンプルは、必ずしも必要ではないが、誤差要因を排除し、測定の信頼性を向上させるために有用である。
 ステップs2の差次的生体分子の選出処理は、発現量に著しい変化を示した生体分子を選択する処理である。図4は、実施の形態における差次的生体分子の選出処理の一例を示すフローチャートである。図4は、図3に示したステップs2の差次的生体分子の生体処理を詳細に示したものである。
 図4に示すように、まず、n個のケースサンプルからそれぞれ測定したハイスループットデータ(生体分子の発現量)に基づく統計データをD1cとし、コントロールサンプルから測定したデータをDrとする(s21)。次に、各ケースサンプル生体分子D1cに対して、スチューデントのt検定を行い、コントロールサンプルのハイスループットデータDrに比べて発現量に著しい変化を示した生体分子D2cを選出する(s22)。ステップs22では、発現量に著しい変化を示した生体分子D2cを選出する方法として、スチューデントのt検定を例示しているが、特に手法を限定するものではない。例えば、マン・ホイットニーのU検定等の他の検定方法を適用することも可能であり、このようなノンパラメトリック手法による検定は、母集団となるD1cが正規分布に従わない場合に、特に有効である。また、スチューデントのt検定をする場合においても、有意水準αの値は、0.05、0.01等の値を適宜設定することができる。
 次に、誤発現率FDR(False Discovery Rate)を用いて、各ケースサンプル生体分子D2cに対して、多重比較(multiple comparisons)又は複数のスチューデントのt検定を補正し、補正後の各ケースサンプル遺伝子又はタンパクデータD3cを選出する(s23)。次に、2倍変更方法(The two-fold change method)を用いて、補正後の各ケースサンプル遺伝子又はタンパクデータD3cから標準偏差SDが比較的著しく変化するDcを差次的生体分子として選出する。ここで選出された差次的生体分子Dcは、コントロールサンプルの生体分子Drに比べて、著しい差異を示すだけではなく、自分の平均値からも大きく逸脱している。ステップs23においても、検定方法はスチューデントのt検定に限るものではない。
 次に、クラスター化処理(図3のs3)を行う。ここでいうクラスター化処理とは、複数の生体分子を、互いに相関の高いグループにそれぞれ分類する処理であり、生体分子が分類されたそれぞれのグループをクラスターと称する。即ち、互いに相関の高い生体分子を1つのクラスターにするように、図4に示すステップs24で選択した差次的生体分子Dcを、n個のクラスターに分類する。得られた全てのクラスターは、潜在的な支配グループ、即ち、検出すべきDNBの候補となる。
 次に、図3に示すDNBの候補の選出処理(s4)を行う。図5は、実施の形態におけるDNBの候補の選出処理の一例を示すフローチャートである。図5は、図3に示したステップs4のDNBの候補の選出処理を詳細に示したものである。即ち、DNBの候補の選出処理は、図5に示すDNBの候補の選出処理のフローチャートに基づいて処理を行う。図5に示す循環ループで、すべてのクラスター(k)(k=1,... ,n)について、クラスター内のノードの間のピアソン相関係数の絶対値の平均値PCCd(k)、クラスター内のノードと他のノードとの間のピアソン相関関数の絶対値の平均値OPCCd(k)、クラスター内のノードの標準偏差の平均値SDd(k)、及び総合指数I(k)を計算する(s41~s46)。そして、すべてのクラスターから、総合指数Iの値が一番大きいクラスターをDNBの候補として選出する(s47)。
 次に、図3に示す有意性分析によるDNBの判定処理(図3のs5)を行う。図6は、実施の形態におけるDNBの判定処理の一例を示すフローチャートである。図6は、図3に示したステップs5の優位性分析によるDNBの判定処理を詳細に示したものである。即ち、上述したDNBの判定条件(I)~(III)に基づいて、ステップs47でDNBの候補として選出されたクラスター(m)はDNBであるか否かを判定する。様々な有意性分析によって判定することができるが、一例として、図6に示すDNBの判定処理のフローチャートに基づいて処理を行う。
 図6に示すように、まず、コントロールサンプルから取得したデータの各ノード間のピアソン相関係数の絶対値の平均値PCCdr、及び各ノードの標準偏差の平均値SDdrをそれぞれ計算する(s51、s52)。そして、コントロールサンプルのピアソン相関係数の平均値PCCdrに比べて、ステップs47で選出したクラスター(m)内の各ノード間のピアソン相関係数の絶対値の平均値PCCd(m)が有意に増大したか否かを判断する(s53)。有意に増大していないと判断した場合(NO)、DNBが存在しないとの結果を出力し、処理を終了する(s57)。他方、有意に増大したと判断した場合(YES)、次のステップs54に進む。ステップs54において、コントロールサンプルのピアソン相関係数の平均値PCCdrに比べて、クラスター(m)内の各ノードと他のノードとのピアソン相関係数の平均値OPCCd(m)が有意に低減したか否かを判断する(s54)。有意に低減していないと判断した場合(NO)、DNBが存在しないとの結果を出力し(s57)、処理を終了する。他方、有意に低減したと判断した場合(YES)、次のステップs55に進む。ステップs55において、コントロールサンプルの標準偏差平均値SDrに比べて、クラスター(m)内のノードの標準偏差平均値SDd(m)が有意に増大したか否かを判断する。有意に増大していないと判断した場合(NO)、DNBが存在しないと判断して(s57)、処理を終了させる。他方、有意に増大したと判断した場合、クラスター(m)をDNBと認定して(s56)、処理を終了させる。
<DNBによる疾病の早期診断方法>
 診断スケジュールとしては、一定の間隔を開けて、複数回診断を行い、毎回の診断で数個のサンプルを取ることが望ましい。図7は、実施の形態におけるDNBを用いた疾病の早期診断の診断スケジュールの一例を示す図である。図7に示すように、複数の段階(段階-1、段階-2、…、段階-T)で、サンプルを採取する。各段階で採取するサンプルの数は、データの精度を確保するために、通常、1つの段階において、6個以上のサンプルを採取することが望ましい。2つの連続した段階の間の間隔は、疾病の状況によって、数日、数週間、数カ月、又は数年と長く設定することができるが、各段階では、短い期間において異なる時間点でサンプルを採取することが望ましい。例えば、6個のサンプルを1日のうちの6つの時間点で採取する。各時間点の間の間隔は、状況に応じて、例えば、数分間、数時間とすることができる。
 図8は、実施の形態におけるDNBによる疾病の早期診断方法の一例を示すフローチャートである。図8に示すように、DNBによる疾病の早期診断方法は、主に、サンプル採取処理(s100)と、差次的生体分子の選出(s200)と、DNBの候補の選出処理(s300)と、有意性分析によるDNBの判定処理(s400)と、診断結果の出力処理(s500)とを含む。次に、これらの処理内容について詳細に説明する。
 サンプル採取処理(s100):一般の疾病診断方法と同じように、診断する疾病に応じて、必要な生理データを取るためのサンプルを採取する。例えば、肝臓障害の場合、血液、肝臓の組織などのサンプルを採取する。
 また、診断する際に診断対象から採取したサンプルをケースサンプルとする他に、参照用のサンプルとして、診断対象以外の健康な人から採取したサンプル、又は診断対象から最初に採取したサンプルをコントロールサンプルとすることができる。
 差次的生体分子の選出(s200):図4に示した差次的生体分子の選出処理フローチャートにしたがって、上記ステップs100で採取したサンプルから、差次的生体分子を選出する。
 DNBの候補の選出処理(s300):図5に示したDNBの候補の選出フローチャートにしたがって、上記ステップs200で選出した差次的生体分子から、DNBの候補となる支配グループを選出する。
 有意性分析によるDNBの判定処理(s400):図6に示した有意性分析によるDNBの判定方法を示すフローチャートにしたがって、上記ステップs300で選出したDNBの候補がDNBであるか否かを判定する。
 診断結果の出力(s500):上記ステップs400において、DNBが存在しないと判断した場合、上記ステップs300で選出したDNBの候補のデータを次回の診断の参照データとして記憶装置に保存し、異常が認めない旨の診断結果を出力する。一方、上記ステップs400において、DNBと認定されたクラスターが存在すると判断した場合、認定されたクラスターの生体分子データをDNBのメンバーとして記憶し、疾病前状態にある旨の診断結果を出力する。また、検出したDNBに関連づけた診断結果を出力することもできる。なお、ここでは、診断結果として示しているが、医師による診断の参考となる結果である。即ち、ステップs500にて出力される診断結果は、医師による診断そのものではなく、医師の診断の補助として、診断を支援すべく診断の参考となる出力データである。
 例えば、診断結果としてDNBの特性を総合的に反映する総合指数Iを出力することができる。当該総合指数Iが大きければ大きいほど、分岐点に近いので、総合指数Iに比例した疾病リスクを直観的に見ることができる図形又は画像の形で出力すると、ワーンニング効果が高くなる。
 図9及び図10は、総合指数Iに比例した疾病リスクを表示する図形の一例である。図9において、矢印全体は疾病前状態(発病前期)を示し、矢印により示される方向の流れが疾病状態(発病)の経時変化を指しており、矢印内の左側に位置するひし形マークは診断で得られた総合指数Iの値に応じて位置が変化する発病リスクポインターである。総合指数Iの値が大きければ大きいほどひし形マークが矢印の右側に近づくように設定する。
 また、以前にもDNBを用いて疾病の早期診断を受けたことがある場合、前回診断で得られた総合指数と一緒に、図10のように、総合指数Iに比例した疾病リスクを表示することができる。図10において、点線のひし形マークが2011年7月1日の診断で得られた総合指数を示し、実線のひし形マークが2011年9月1日の診断で得られた総合指数を示している。ひし形マークの位置変動から、疾病状態に近づいていくことを直観的に判断することができる。
 また、DNBに関連づけた情報として、検出したDNBを含んだ全ネットワーク、又は当該DNBを含んだ一部のネットワークのマップ(例えば、後述の図15)を出力することができる。
 さらに、DNBのメンバーである生体分子のリストを出力することもできる。上述したように、DNBは、正常状態から疾病状態へ遷移する疾病前状態に現れるものであるが、DNBとして検出された生体分子、即ち遺伝子、タンパク質又は代謝物自身が、必ずしも疾病を悪化させる要因となる病的遺伝子、タンパク質又は代謝物とは限らない。ただし、DNBメンバーの一部が疾病と関連していることが判明している。
 そのため、検出したDNBのメンバーに含まれた、特定の疾病と関連性のあるもの(遺伝子、タンパク質又は代謝物)を抽出すると、例えば、医師の診断により、検診者等の診断対象が発症する可能性のある疾病をある程度把握することができる。
 したがって、上述した「診断結果の出力」(図8のs500)に続いて、遺伝子、タンパク質又は代謝物と疾病との対応関係を記憶したデータベースを利用して、検出したDNBから疾病と関連性のある遺伝子、タンパク質又は代謝物を抽出して、診断の参考となる診断結果として出力することができる。
 そうすれば、健康診断を受ける人から例えば血液を採取して、その血液から得た遺伝子、タンパク質又は代謝物のデータからDNBを検出した場合、当該DNBに含まれている遺伝子、タンパク質又は代謝物と関連性がある疾病をある程度特定することができ、検診者が持つ潜在的疾病を早期段階で診断することができる。
<検出装置>
 以上詳述したDNBの検出方法は、コンピュータを用いた検出装置として本発明を具現化することができる。図11は、本発明に係る検出装置の構成例を示すブロック図である。図11に示す検出装置1は、パーソナルコンピュータ、サーバコンピュータに接続されるクライアントコンピュータ、その他各種コンピュータを用いて実現される。検出装置1は、制御部10、記録部11、記憶部12、入力部13、出力部14、取得部15等の各種機構を備えている。
 制御部10は、CPU(Central Processing Unit )等の回路を用いて構成され、検出装置1全体を制御する機構である。
 記録部11は、HDD(Hard Disk Drive)等の磁気記録機構、SSD(Solid State Disk)等の不揮発性半導体記録機構等の不揮発性の補助記録機構である。記録部11には、本発明に係る検出プログラム11a等の各種プログラム及びデータが記録されている。
 記憶部12は、SDRAM(Synchronous Dynamic Random Access Memory)、SRAM(Static Random Access Memory)等の揮発性の主記憶機構である。
 入力部13は、キーボード、マウス等のハードウェア、及びドライバ等のソフトウェアを備える入力機構である。
 出力部14は、モニタ、プリンタ等のハードウェア、及びドライバ等のソフトウェアを備える出力機構である。
 取得部15は、外部から各種データを取得する機構である。具体的には、通信網を介してデータを取り込むLAN(Local Area Network)ポート、測定機器に接続可能なパラレルケーブル等の専用線に接続するポート等の各種ハードウェア、及びドライバ等のソフトウェアである。
 そして、記録部11に記録されている検出プログラム11aを、記憶部12に記憶し、制御部10の制御に基づき実行することにより、コンピュータは、検出プログラム11aに係る各種手順を実行し、本発明の検出装置1として機能する。なお、便宜上、記録部11及び記憶部12として分けているが、両者とも各種情報の記録という同様の機能を有するものであり、装置の仕様、運用形態等に応じていずれの機構に記録させるかは、適宜決定することが可能である。
 図12は、本発明に係る検出装置1によるDNBの検出処理の一例を示すフローチャートである。本発明に係る検出装置1の処理は、前述のDNBの検出処理を実行するものである。検出装置1の制御部10は、取得部15により、生体に関する測定により得られた複数の因子項目についての測定データを取得する(Sc1)。ステップSc1は、図3のステップs1として示したハイスループットデータの取得処理に対応する。なお、ここではコンピュータ処理の対象として表現するため、因子項目として表現しているが、ここでいう因子項目とは、前述のDNBのノードとなり得る遺伝子に関する測定項目、タンパク質に関する測定項目、代謝物に関する測定項目等の測定項目を示している。なお、CTスキャン等の測定装置にて出力される体内画像から得られる画像に関する測定項目を用いることも可能である。
 制御部10は、取得した因子項目のそれぞれの測定データが、有意性をもって経時的に変化しているか否かを検定し、検定した結果に基づいて差次的生体分子を選出する(Sc2)。ステップSc2は、図3のステップs2として示した差次的生体分子の選出処理に対応する。
 したがって、ステップSc2の処理は、制御部10が、各因子項目の測定データ、並びに因子項目及び時系列毎に予め設定されている参照データとの比較結果に基づいて、有意性に関する検定を行い(Sc21)、経時変化に有意性があると検定された因子項目を選出する処理(Sc22)を含む。即ち、図4に示した各種処理を実行する。なお、検出装置1が参照データとして処理するデータとは、コントロールサンプルであり、例えば、最初に取得したサンプルをコントロールサンプルとする等の設定に基づき、検出装置1は、当該サンプルに対して参照データとしての取り扱いを行う。
 制御部10は、選出した各因子項目のそれぞれの測定データの時系列変化の相関関係に基づいて複数の因子項目を複数のクラスターに分類する(Sc3)。ステップSc3は、図3のステップs3として示したクラスター化処理に対応する。
 制御部10は、分類した各クラスターから、各因子項目のそれぞれの測定データの時系列変化及び各因子項目間の測定データの時系列変化の相関関係に基づいて予め設定された選出条件に該当するクラスターを選出する(Sc4)。ステップSc4は、図3のステップs4として示したDNBの候補の選出処理に対応する。
 したがって、ステップSc4の処理は、制御部10が、それぞれのクラスターに対し、クラスター内の各因子項目の測定データの相関を示す値の平均値を第1指数として算出し(Sc41)、クラスター内の因子項目の測定データと当該クラスター外の因子項目の測定データとの間の相関を示す値の平均値を第2指数として算出し(Sc42)、クラスター内の各因子項目について測定データの標準偏差の平均値を第3指数として算出する処理(Sc43)を含む。さらに、ステップSc4の処理は、制御部10が、第1指数と、第2指数と、第3指数の逆数との積に基づく総合指数を算出し(Sc44)、算出した総合指数が最大であるクラスターを選出する処理(Sc45)を含む。即ち、図5に示した各種処理を実行する。なお、第1指数、第2指数、第3指数及び総合指数としては、例えば、クラスター内のノードの間のピアソン相関係数の絶対値の平均値PCCd(k)、クラスター内のノードと他のノードとの間のピアソン相関関数の絶対値の平均値OPPCd(k)、クラスター内のノードの標準偏差の平均値SDd(k)、及び総合指数I(k)がそれぞれ用いられる。
 制御部10は、選出したクラスターに含まれる因子項目をバイオマーカーの候補として検出する(Sc5)。ステップSc5は、図3のステップs5として示したDNBの判定処理に対応する。
 したがって、ステップSc5の処理は、制御部10が、各因子項目について、対応する参照データの標準偏差の平均値を示す参照標準偏差を算出し(Sc51)、因子項目間の相関を示す値の平均値を示す参照相関値を算出する(Sc52)。そして、第1指数が参照標準偏差に比べて有意性をもって増大し、第2指数が参照相関値に比べて有意性をもって減少し、かつ、第3指数が参照標準偏差に比べて有意性をもって増大した場合に、当該クラスターに含まれる項目をバイオマーカーとして検出する処理(Sc53)を含む。即ち、図6に示した各種処理を実行する。なお、参照標準偏差及び参照相関値としては、例えば、各ノード間のピアソン相関係数の絶対値の平均値PCCdr及び各ノードの標準偏差の平均値SDdrがそれぞれ用いられる。
 そして、制御部10は、バイオマーカーの候補として検出した因子項目を出力部14から出力し(Sc6)、処理を終了する。
<第1の検証例>
 本発明のDNBによる疾病の早期診断方法の診断精度を検証するために、肺障害が引き起こされたマウスの実験データを用いて、本発明の診断方法で診断を行い、その診断結果を実際の病状進行状況と比較して、本発明の診断方法の有効性を検証した。次に、当該検証例を詳細に説明する。実験データは、複数の実験用CD-1雄マウスをケースグループと、コントロールグループとに分けて、ケースグループを通常の空気環境に、コントロールグループを有毒ガスであるホスゲンが含まれている空気環境に置き、そして、両グループのマウスの健康状況を観察し、ホスゲンの吸入による急性肺損傷の分子レベルのメカニズムを調べるという実験から得られたものである。当該実験データを用いて、本発明の診断方法を用いて、ホスゲン曝露されているケースグループのマウスの健康状況を診断した。通常、マウスは一定量のホスゲンを吸入すると、ホスゲン誘発性肺障害を発症する。
 図13は、第1の検証例における診断用のデータを示すテーブルである。図13に示すように、診断対象は、ホスゲン誘発性肺障害にかかったマウス(CD-1雄マウス)であり、サンプル採取対象は、診断対象となるケースグループ及び参照対象となるコントロールグループのマウスの肺組織であり、サンプリングポイントは、実験開始後の0、0.5、1、4、8、12、24、48、72時間が経過した時間点であり、DNBの検出に用いた遺伝子の数は22690個である。
 本発明の診断方法を用いて、具体的に、次の処理を行った。
 まず、それぞれのサンプルから測定したハイスループット遺伝子データから差次的発現遺伝子を選択する。各々のサンプリングポイントにおいて、6つのケースサンプルと6つコントロールサンプルが提供されている。最初のサンプリングポイント(0h)において、ケースサンプルのデータはコントロールサンプルのデータと同じである。
 各々のサンプリングポイントにおいて、有意水準p<0.05のスチューデントのt検定を用いて、それぞれ、A=[0、53、184、1325、1327、738、980、1263、915]の差次的遺伝子を選出した。
 そして、選出した差次的遺伝子のセットAに対して、誤発現率(FDR)及び2倍変更スクリーニングを用いることにより、各サンプリングポイントに対して、それぞれ、B=[0、29、72、195、269、163、173、188、176]の遺伝子を選出した。
 選出した遺伝子セットBに対して、各サンプリングポイントにおいて、相関の高いものを1つのクラスターにまとめるクラスター化を行い、それぞれ、40個のクラスターを得た。
 さらに、各サンプリングポイントにおいて、得られた40個のクラスター内の全ての遺伝子に対して、データの正規化を行う。そして、各サンプリングポイントにおいて、正規化されたコントロールグループ及びケースグループにおける各クラスターのそれぞれの標準偏差の平均値SDd(第3指数)、クラスターのメンバー間のピアソンの相関係数の絶対値の平均値PCCd(第2指数)、クラスターのメンバーと他の遺伝子との間のピアソン相関係数の絶対値の平均値OPCCd(第1指数)、及び総合指数Iを計算する。
 そして、各サンプリングポイントにおいて、計算したケースグループにおける各クラスターから、総合指数Iが一番大きいクラスターをDNBの候補として選出し、さらに、当該DNBの候補に対して、コントロールグループの標準偏差の平均値SDc、遺伝子間のピアソン相関係数の絶対値の平均値PCCcを基準に、有意性分析により、DNBであるか否かを判断する。その結果、各サンプリングポイントにおいて、DNBとなるクラスターの数は、[0、0、0、0、1、0、0、0、0]であった。
 即ち、第5のサンプリングポイント(8h)でDNBが検出された、当該DNBは220個の遺伝子を有する第111番目のクラスターである。
 図14Aは、第1の検証例において、検出されたDNBの候補の標準偏差の平均値SDdの時系列変化の例を示すグラフである。図14Bは、第1の検証例において、検出されたDNBの候補のクラスターのメンバー間のピアソン相関係数の絶対値の平均値PCCdの時系列変化の例を示すグラフである。図14Cは、第1の検証例において、検出されたDNBの候補のクラスターのメンバーと他の遺伝子との間のピアソン相関係数の絶対値の平均値OPCCdの時系列変化の例を示すグラフである。図14Dは、第1の検証例において、検出されたDNBの候補の総合指数Iの時系列変化の例を示すグラフである。図14A~図14Dにおいて、横軸は時間段階tを表し、縦軸は、それぞれ、標準偏差の平均値SDd(図14A)、クラスターのメンバー間のピアソン相関係数の絶対値の平均値PCCd(図14B)、クラスターのメンバーと他の遺伝子との間のピアソン相関係数の絶対値の平均値OPCCd(図14C)、及び総合指数Iを示している(図14D)。破線は、ケースグループから検出したDNBの候補の各種指数の経時変化を示し、実線は、コントロールグループから選んだ1クラスターの各種指数の経時変化を示している。
 図14A~図14Dから分かるように、第4の時間段階 (即ち、4時間経過)から、DNBの候補の第1指数PCCd、第3指数SDd及び総合指数Iは大きく増加し始め、第5の時間段階 (即ち、8時間経過)でピークに達している。一方、DNBの候補の第3指数OPCCdは第2の時間段階から低減し、同じ第5の時間段階 (即ち、8時間経過)で極小値を示している。
 また、DNBの動的特性を直観的に示すために、DNBを含む全遺伝子ネットワークの動的特性を図15に示す。図15は、第1の検証例において、ケースグループの遺伝子によって構成されたネットワークにおけるDNBの動的特性の一例を経時的に示すマップである。図15には、順に0.5、1、4、8、12、24、48、72hの各サンプリングポイントで、ケースグループの遺伝子ネットワーク(3452個の遺伝子、9238個のリンク)が表示されており、「〇」で表示しているノードはDNBの候補に属する遺伝子であり、「□」で表示しているノードはDNBの候補のノード付近の他の遺伝子であり、ノードとノードとの間のラインは両ノードの相関性を示している。また、「〇」の色の濃さが遺伝子の標準偏差SDの大きさを示し、両ノードを接続ラインの濃さが両ノードの相関係数PCCの絶対値の大きさを示している。図15に例示した全てのマップは、データ解析に係るオープンソースプラットフォームであるCytoscape (http://www.cytoscape.org/)を用いて構成されたものである。
 図15に示すように、DNBの候補の特性(SD、PCC)が時間の経過とともに変化し、他の遺伝子と同じ振る舞いをする通常のクラスターから、次第にDNBへと進化していく。図15のeに示す第5の段階(8hが経過した時)で、DNBとしての特徴が最も著しく、疾病前状態 (8h)である警告信号をはっきり示している。しかしながら、疾病状態へ遷移した後(24h、48h、72h)、DNBのメンバーは、再び他の遺伝子と同じ振る舞いをするようになっている。
当該結果から、疾病前状態は第5の時間段階の近くに存在し、第5の時間段階の後、システムは疾病状態へ遷移するということが判明される。
 したがって、本発明のDNBによる疾病の早期診断方法で診断する場合、第4の時間段階での診断で、疾病になる警告信号が少し見えているため、近いうち疾病が悪化するとの診断結果を出すことができる。そして、第5の時間段階での診断では、疾病になる警告信号をはっきり見えているため、間もなく疾病になるとの診断結果を出すことができる。
 一方、実際のマウス実験の結果では、ケースグループのマウスは、ホスゲンを吸入してから8時間後に、肺水腫が起こし、12時間後に50%~60%が死亡し、24時間後に、さらに60%~70% が死亡した。
 したがって、本発明のDNBによる早期診断の診断結果は、マウスの実際の病気悪化状況と完全に一致しているということができる。
<第2の検証例>
 上述した第1の検証例において、動物実験のデータを用いて、本発明のDNBによる疾病の早期診断方法の有効性を検証した。本検証例では、B細胞リンパ腫の臨床データを用いて、さらに、本発明のDNBによる疾病の早期診断方法の診断精度を検証する。
 図16は、第2の検証例における診断データをリストしたテーブルである。図16に示すように、臨床像、病変及びフローサイトメトリーに基づいて、サンプルは、安静期(P1)、活性期(P2)、限界期(P3)、転移期(P4)、侵攻期(P5)の5つの段階のグループに分けられている。各段階において、サンプルの数は、それぞれ、5、3、6、5、7である。各段階において、脾腫は、それぞれ、「None」、「None」、「+/-」、「+」、「+++」である。各段階において、フローサイトメトリーは、それぞれ、「正常安静」、「正常活性」、「異常」、「ミックスト」、「B-1クローン」である。また、安静期(P1)で採取したサンプルをコントロールサンプルとし、他の段階(P2~P5)で採取したサンプルをケースサンプルとする。
 上記26個のサンプルから測定した遺伝子発現データから13712個の遺伝子を対象に、上述したDNBによる疾病の早期診断方法で診断を行った。その結果として、図17A~図17Dに、ケースグループの遺伝子から検出したDNBの候補の各指数を示す。図17Aは、第2の検証例において、検出されたDNBの候補の標準偏差の平均値SDdの時系列変化の例を示すグラフである。図17Bは、第2の検証例において、検出されたDNBの候補のクラスターのメンバー間のピアソン相関係数の絶対値の平均値PCCdの時系列変化の例を示すグラフである。図17Cは、第2の検証例において、検出されたDNBの候補のクラスターのメンバーと他の遺伝子との間のピアソン相関係数の絶対値の平均値OPCCdの時系列変化の例を示すグラフである。図17Dは、第2の検証例において、検出されたDNBの候補の総合指数Iの時系列変化の例を示すグラフである。
 図17A~図17Dにおいて、横軸は段階(P1~P4)の番号を示しており、縦軸は、それぞれ、標準偏差の平均値SDd(図17A)、クラスターのメンバー間のピアソン相関係数の絶対値の平均値PCCd(図17B)、クラスターのメンバーと他の遺伝子との間のピアソン相関係数の絶対値の平均値OPCCd(図17C)、及び総合指数Iを示している(図17D)。
 図17A~図17Dから明らかなように、第2の段階(P2)、即ち活性期において、DNBの候補の総合指数Iがピークに達しており、疾病状態を示す警告信号が最も強くなっている。この診断結果は、実際の病変と完全に一致している。実際の臨床データでも、活性期の直後の限界期から病状が悪化して、脾腫が「+/-」となり、フローサイトメトリーが「異常」になっている。したがって、本検証例におけるDNB特定の解析結果と実際の臨床データと完全に一致している。
 また、通常の診断では、図16に示すように、活性期における脾腫が「None」、フローサイトメトリーが「正常活性」となっているため、異常が認めないとの診断結果になる。それに対して、本発明のDNBによる疾病の早期診断方法で診断する場合、活性期において、疾病前状態を示す警告信号(DNB)を検出したため、「異常の兆候が見られる」との診断結果を患者に伝えることができる。そのため、患者は早期段階で治療措置を取ることにより、病状の悪化を止める。
 したがって、本発明のDNBによる疾病の早期診断は、リンパ腫のような複雑疾病の早期診断に大変有効であることが検証されている。
 また、本検証例におけて検出されたDNBの中に、22個の遺伝子とTFsが含まれており、そのうち、13個の遺伝子が明らかにB細胞リンパ腫と関連しており、さらに、当該13個の遺伝子のうちの8個が増殖のマスタレギューレターであることが判明されている。したがって、本発明におけるDNBは、疾病前状態を示す警告信号として、早期段階で異常の兆候を患者に伝えることができるだけではなく、疾病と関連している遺伝子も具体的に特定することができるため、複雑疾病の治療、製薬に非常に役に立つと思われる。
 前記実施の形態は、本発明の無数に存在する実施例の一部を開示したに過ぎず、疾病の種類、検出すべき目的等の様々な要因を加味して適宜設計変更することが可能である。特に、因子項目としては、生体に関する測定により得られた情報であれば、様々な測定データを用いることができる。例えば、前述の遺伝子、タンパク質、代謝物に関する測定データに限らず、CTスキャン等の測定装置にて出力される体内画像に基づいて、各部位の様々な状況を数値化することにより、測定データとして用いることが可能である。更には、画像以外にも、声又は体内から発せられる音を測定し、数値化した上で測定データとして用いることも可能である。
1 検出装置
10 制御部
11 記録部
12 記憶部
13 入力部
14 出力部
15 取得部
11a 検出プログラム

Claims (11)

  1.  生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する検出装置であって、
     前記各因子項目のそれぞれの測定データの時系列変化の相関関係に基づいて複数の因子項目を複数のクラスターに分類する分類手段と、
     分類した各クラスターから、前記各因子項目のそれぞれの測定データの時系列変化及び各因子項目間の測定データの時系列変化の相関関係に基づいて予め設定された選出条件に該当するクラスターを選出する選出手段と、
     選出したクラスターに含まれる因子項目をバイオマーカーの候補として検出する検出手段と
     を備えることを特徴とする検出装置。
  2.  請求項1に記載の検出装置であって、
     前記選出手段は、
     クラスター内の各因子項目間の測定データの相関を示す値の平均値を第1指数として算出する手段と、
     クラスター内の因子項目の測定データと当該クラスター外の因子項目の測定データとの間の相関を示す値の平均値を第2指数として算出する手段と、
     クラスター内の各因子項目について測定データの標準偏差の平均値を第3指数として算出する手段と
     を含み、
     複数のクラスターのうちから、第1指数、第2指数及び第3指数に基づいて、バイオマーカーとすべき因子項目を含むクラスターを選出する
     ことを特徴とする検出装置。
  3.  請求項2に記載の検出装置であって、
     前記選出手段は、前記第1指数と、前記第2指数と、前記第3指数の逆数との積に基づく総合指数が最大であるクラスターを選択する
     ことを特徴とする検出装置。
  4.  請求項2又は請求項3に記載の検出装置であって、
     前記各因子項目のそれぞれの測定データが、有意性をもって経時的に変化しているか否かを検定する差次検定手段を更に備え、
     前記分類手段は、経時的変化に有意性があると検定された因子項目について分類する
     ことを特徴とする検出装置。
  5.  請求項4に記載の検出装置であって、
     前記差次検定手段は、各因子項目の測定データ、並びに因子項目及び時系列毎に予め設定されている参照データとの比較結果に基づいて、有意性に係る検定を行う
     ことを特徴とする検出装置。
  6.  請求項5に記載の検出装置であって、
     各因子項目について、対応する参照データの標準偏差の平均値を示す参照標準偏差、及び因子項目間の相関を示す値の平均値を示す参照相関値を算出する手段を更に備え、
     前記検出手段は、前記第1指数が前記参照標準偏差に比べて有意性をもって増大し、前記第2指数が前記参照相関値に比べて有意性をもって減少し、かつ、前記第3指数が前記参照標準偏差に比べて有意性をもって増大した場合に、当該クラスターに含まれる項目をバイオマーカーの候補として検出する
     ことを特徴とする検出装置。
  7.  請求項1乃至請求項6のいずれかに記載の検出装置であって、
     前記検出手段は、
     クラスターに含まれる複数の因子項目の有意性を、測定データの統計値に基づいて検定する手段を含み、
     有意性がある場合に、クラスターに含まれる項目をバイオマーカーの候補として検出する
     ことを特徴とする検出装置。
  8.  請求項1乃至請求項7のいずれかに記載の検出装置であって、
     前記複数の因子項目のいずれかは、遺伝子に関する測定項目、タンパク質に関する測定項目、代謝物に関する測定項目、又は生体から得られる画像に関する測定項目である
     ことを特徴とする検出装置。
  9.  生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する検出装置を用いた検出方法であって、
     前記検出装置は、
     前記各因子項目のそれぞれの測定データの時系列変化の相関関係に基づいて複数の因子項目を複数のクラスターに分類する分類ステップと、
     分類した各クラスターから、前記各因子項目のそれぞれの測定データの時系列変化及び各因子項目間の測定データの時系列変化の相関関係に基づいて予め設定された選出条件に該当するクラスターを選出する選出ステップと、
     選出したクラスターに含まれる因子項目をバイオマーカーの候補として検出する検出ステップと
     を実行することを特徴とする検出方法。
  10.  生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する検出方法であって、
     異なる時間点で採取した複数の生体サンプルのそれぞれから測定したハイスループットデータの中から、差次的生体分子を算出する分子スクリーニングステップと、
     相関の高い生体分子同士を1つのクラスターとするように、前記分子スクリーニングステップで選出した前記差次的生体分子を複数のクラスターに分類するクラスター化ステップと、
     前記クラスター化ステップで得られた複数のクラスターの中から、クラスター内の生体分子の間の相関の増大、クラスター内の生体分子の標準偏差の増大、及びクラスター内の生体分子と他の生体分子との間の相関の低減が最も著しいクラスターを、前記バイオマーカーの候補として先取する候補選択ステップと、
     前記候補選択ステップで選出したバイオマーカーの候補が前記バイオマーカーであるか否かを、有意性検定によって判定する判定ステップと
     を実行することを特徴とする検出方法。
  11.  コンピュータに、生体に関する測定により得られた複数の因子項目についての測定データに基づいて、測定対象である生体の症状の指標となるバイオマーカーの候補を検出する処理を実行させる検出プログラムであって、
     コンピュータに、
     前記各因子項目のそれぞれの測定データの時系列変化の相関関係に基づいて複数の因子項目を複数のクラスターに分類する分類ステップと、
     分類した各クラスターから、前記各因子項目のそれぞれの測定データの時系列変化及び各因子項目間の測定データの時系列変化の相関関係に基づいて予め設定された選出条件に該当するクラスターを選出する選出ステップと、
     選出したクラスターに含まれる因子項目をバイオマーカーの候補として検出する検出ステップと
     を実行させることを特徴とする検出プログラム。
PCT/JP2013/053188 2012-09-26 2013-02-12 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム WO2014050160A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US14/430,724 US11328792B2 (en) 2012-09-26 2013-02-12 Device for detecting a dynamical network biomarker, method for detecting same, and program for detecting same
CA2885634A CA2885634C (en) 2012-09-26 2013-02-12 Device for detecting a dynamical network biomarker, method for detecting same, and program for detecting same
KR1020157010816A KR102111820B1 (ko) 2012-09-26 2013-02-12 동적 네트워크 바이오마커의 검출 장치, 검출 방법 및 검출 프로그램

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012211921A JP5963198B2 (ja) 2012-09-26 2012-09-26 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
JP2012-211921 2012-09-26

Publications (1)

Publication Number Publication Date
WO2014050160A1 true WO2014050160A1 (ja) 2014-04-03

Family

ID=50387586

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/053188 WO2014050160A1 (ja) 2012-09-26 2013-02-12 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム

Country Status (5)

Country Link
US (1) US11328792B2 (ja)
JP (1) JP5963198B2 (ja)
KR (1) KR102111820B1 (ja)
CA (1) CA2885634C (ja)
WO (1) WO2014050160A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016129601A1 (ja) * 2015-02-13 2016-08-18 国立研究開発法人産業技術総合研究所 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム
CN116304766A (zh) * 2023-05-25 2023-06-23 山东艾迈科思电气有限公司 基于多传感器的开关柜状态快速评估方法
US11848075B2 (en) 2017-05-12 2023-12-19 Japan Science And Technology Agency Biomarker detection method, disease assessment method, biomarker detection device, and computer readable medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11210124B2 (en) * 2019-01-11 2021-12-28 Hewlett Packard Enterprise Development Lp Movement of virtual machine data across clusters of nodes
KR102573416B1 (ko) * 2021-07-16 2023-09-04 주식회사 휴이노 생체 신호 분석 모델의 출력 데이터를 관리하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004524604A (ja) * 2000-12-07 2004-08-12 ユーロプロテオーム エージー 遺伝的疾患の分類および予測のため、ならびに分子遺伝的パラメーターと臨床的パラメーターとの関連付けのためのエキスパートシステム
JP2005527904A (ja) * 2002-05-20 2005-09-15 ロゼッタ インファーマティクス エルエルシー 複雑性疾患を構成疾患に細分するコンピュータ・システムおよび方法
WO2008102825A1 (ja) * 2007-02-20 2008-08-28 Articell Systems Corporation 遺伝子発現パターンから遺伝子を分類する方法
JP2009057337A (ja) * 2007-08-31 2009-03-19 Dainippon Sumitomo Pharma Co Ltd メタボロームデータの解析方法および代謝関与マーカー
JP2012094143A (ja) * 2010-10-27 2012-05-17 Samsung Sds Co Ltd バイオマーカー抽出装置および方法
JP2012514783A (ja) * 2009-01-06 2012-06-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 進化クラスタ化アルゴリズム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU1853600A (en) 1999-01-06 2000-07-24 Choong-Chin Liew Method for the detection of gene transcripts in blood and uses thereof
US7473528B2 (en) 1999-01-06 2009-01-06 Genenews Inc. Method for the detection of Chagas disease related gene transcripts in blood
US20060134635A1 (en) 2001-02-28 2006-06-22 Chondrogene Limited Method for the detection of coronary artery disease related gene transcripts in blood
US20070031841A1 (en) 2001-02-28 2007-02-08 Choong-Chin Liew Method for the detection of gene transcripts in blood and uses thereof
US20050123938A1 (en) 1999-01-06 2005-06-09 Chondrogene Limited Method for the detection of osteoarthritis related gene transcripts in blood
JP2004536575A (ja) 2001-02-28 2004-12-09 コンドロジーン・インコーポレイテッド 変形性関節症に関連する組成物および方法
CA2584505A1 (en) * 2004-10-12 2006-04-27 Lenard M. Lichtenberger Purified phospholipid-non-steroidal anti-inflammatory drug associated compositions and methods for preparing and using same

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004524604A (ja) * 2000-12-07 2004-08-12 ユーロプロテオーム エージー 遺伝的疾患の分類および予測のため、ならびに分子遺伝的パラメーターと臨床的パラメーターとの関連付けのためのエキスパートシステム
JP2005527904A (ja) * 2002-05-20 2005-09-15 ロゼッタ インファーマティクス エルエルシー 複雑性疾患を構成疾患に細分するコンピュータ・システムおよび方法
WO2008102825A1 (ja) * 2007-02-20 2008-08-28 Articell Systems Corporation 遺伝子発現パターンから遺伝子を分類する方法
JP2009057337A (ja) * 2007-08-31 2009-03-19 Dainippon Sumitomo Pharma Co Ltd メタボロームデータの解析方法および代謝関与マーカー
JP2012514783A (ja) * 2009-01-06 2012-06-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 進化クラスタ化アルゴリズム
JP2012094143A (ja) * 2010-10-27 2012-05-17 Samsung Sds Co Ltd バイオマーカー抽出装置および方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHEN, L.: "Detecting early-warning signals for sudden deterioration of complex diseases by dynamical network biomarkers", SCIENTIFIC REPORTS, vol. 2, no. 342, 29 March 2012 (2012-03-29), pages 1 - 8 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016129601A1 (ja) * 2015-02-13 2016-08-18 国立研究開発法人産業技術総合研究所 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム
JP2016148604A (ja) * 2015-02-13 2016-08-18 国立研究開発法人産業技術総合研究所 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム
US11238959B2 (en) 2015-02-13 2022-02-01 National Institute Of Advanced Industrial Science And Technology Biomarker search method, biomarker search device, and program
US11848075B2 (en) 2017-05-12 2023-12-19 Japan Science And Technology Agency Biomarker detection method, disease assessment method, biomarker detection device, and computer readable medium
CN116304766A (zh) * 2023-05-25 2023-06-23 山东艾迈科思电气有限公司 基于多传感器的开关柜状态快速评估方法

Also Published As

Publication number Publication date
KR20150079641A (ko) 2015-07-08
US20150278433A1 (en) 2015-10-01
US11328792B2 (en) 2022-05-10
CA2885634A1 (en) 2014-04-03
CA2885634C (en) 2021-01-26
JP2014064515A (ja) 2014-04-17
KR102111820B1 (ko) 2020-05-15
JP5963198B2 (ja) 2016-08-03

Similar Documents

Publication Publication Date Title
Arnatkeviciute et al. Toward best practices for imaging transcriptomics of the human brain
JP5963198B2 (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
JP6164678B2 (ja) ネットワークエントロピーに基づく生体の状態遷移の予兆の検出を支援する検出装置、検出方法及び検出プログラム
JP7124265B2 (ja) バイオマーカー検出方法、疾病判断方法、バイオマーカー検出装置、及びバイオマーカー検出プログラム
Rahnenführer et al. Statistical analysis of high-dimensional biomedical data: a gentle introduction to analytical goals, common approaches and challenges
JP2015043782A (ja) 遺伝子及び老化判定方法
Sotirakis et al. Identification of motor progression in Parkinson’s disease using wearable sensors and machine learning
KR101067352B1 (ko) 생물학적 네트워크 분석을 이용한 마이크로어레이 실험 자료의 작용기작, 실험/처리 조건 특이적 네트워크 생성 및 실험/처리 조건 관계성 해석을 위한 알고리즘을 포함한 시스템 및 방법과 상기 방법을 수행하기 위한 프로그램을 갖는 기록매체
JP6198161B2 (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
JP6948722B2 (ja) 検出装置及び検出プログラム
JP2023545704A (ja) エクスポソーム臨床応用のためのシステム及び方法
JP2024501620A (ja) 生物学的障害の動的免疫組織化学プロファイリングのためのシステム及び方法
Shen et al. Cohort research in “Omics” and preventive medicine
JP2018005925A (ja) バイオマーカーの候補及び治療用製薬
EP1681981A2 (en) Generation of biochemical images and methods of use
WO2017205733A1 (en) Decision support system for cns drug development
JP2023172951A (ja) 病理スライド画像の品質を評価する方法及び装置
CN118202415A (zh) 生化样品的全电子分析

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13842067

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2885634

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 14430724

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 20157010816

Country of ref document: KR

Kind code of ref document: A

122 Ep: pct application non-entry in european phase

Ref document number: 13842067

Country of ref document: EP

Kind code of ref document: A1