JP2002525079A - 遺伝子発現に基づく幾何的および階層的分類 - Google Patents
遺伝子発現に基づく幾何的および階層的分類Info
- Publication number
- JP2002525079A JP2002525079A JP2000570378A JP2000570378A JP2002525079A JP 2002525079 A JP2002525079 A JP 2002525079A JP 2000570378 A JP2000570378 A JP 2000570378A JP 2000570378 A JP2000570378 A JP 2000570378A JP 2002525079 A JP2002525079 A JP 2002525079A
- Authority
- JP
- Japan
- Prior art keywords
- subsequence
- type
- pair
- cell
- cells
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 206
- 239000002773 nucleotide Substances 0.000 claims description 188
- 125000003729 nucleotide group Chemical group 0.000 claims description 188
- 150000007523 nucleic acids Chemical class 0.000 claims description 174
- 239000012634 fragment Substances 0.000 claims description 171
- 102000039446 nucleic acids Human genes 0.000 claims description 144
- 108020004707 nucleic acids Proteins 0.000 claims description 144
- 239000013615 primer Substances 0.000 claims description 82
- 239000000523 sample Substances 0.000 claims description 78
- 108091008146 restriction endonucleases Proteins 0.000 claims description 60
- 239000011159 matrix material Substances 0.000 claims description 59
- 239000013598 vector Substances 0.000 claims description 56
- 230000000875 corresponding effect Effects 0.000 claims description 45
- 239000003814 drug Substances 0.000 claims description 45
- 238000004458 analytical method Methods 0.000 claims description 39
- 230000000295 complement effect Effects 0.000 claims description 38
- 229940079593 drug Drugs 0.000 claims description 36
- 101710163270 Nuclease Proteins 0.000 claims description 33
- 108020004414 DNA Proteins 0.000 claims description 32
- 108091093088 Amplicon Proteins 0.000 claims description 30
- 239000003795 chemical substances by application Substances 0.000 claims description 27
- 230000000694 effects Effects 0.000 claims description 26
- 210000000056 organ Anatomy 0.000 claims description 21
- 239000008177 pharmaceutical agent Substances 0.000 claims description 21
- 238000000513 principal component analysis Methods 0.000 claims description 20
- 102000053602 DNA Human genes 0.000 claims description 19
- 108091034117 Oligonucleotide Proteins 0.000 claims description 19
- 230000003321 amplification Effects 0.000 claims description 19
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 19
- 206010028980 Neoplasm Diseases 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 18
- 238000005284 basis set Methods 0.000 claims description 16
- 201000011510 cancer Diseases 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000000556 factor analysis Methods 0.000 claims description 15
- 230000029087 digestion Effects 0.000 claims description 14
- 230000037361 pathway Effects 0.000 claims description 14
- 230000002596 correlated effect Effects 0.000 claims description 13
- 230000000670 limiting effect Effects 0.000 claims description 12
- 229910019142 PO4 Inorganic materials 0.000 claims description 11
- 239000010452 phosphate Substances 0.000 claims description 11
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 7
- 238000005259 measurement Methods 0.000 claims description 7
- 230000000144 pharmacologic effect Effects 0.000 claims description 7
- 230000001575 pathological effect Effects 0.000 claims description 6
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 6
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 6
- 239000003155 DNA primer Substances 0.000 claims description 5
- 108091060211 Expressed sequence tag Proteins 0.000 claims description 5
- 229920001184 polypeptide Polymers 0.000 claims description 5
- 108010042407 Endonucleases Proteins 0.000 claims description 4
- 102000004533 Endonucleases Human genes 0.000 claims description 4
- 108020005187 Oligonucleotide Probes Proteins 0.000 claims description 4
- 239000002751 oligonucleotide probe Substances 0.000 claims description 4
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 claims description 4
- 238000009396 hybridization Methods 0.000 claims description 3
- 230000006461 physiological response Effects 0.000 claims description 3
- 230000002829 reductive effect Effects 0.000 claims description 3
- 238000003196 serial analysis of gene expression Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000008685 targeting Effects 0.000 claims 3
- 102000054765 polymorphisms of proteins Human genes 0.000 claims 2
- 230000037452 priming Effects 0.000 claims 2
- 108700026220 vif Genes Proteins 0.000 claims 2
- 238000000636 Northern blotting Methods 0.000 claims 1
- 238000012300 Sequence Analysis Methods 0.000 claims 1
- 238000010224 classification analysis Methods 0.000 claims 1
- 239000000126 substance Substances 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 139
- 210000001519 tissue Anatomy 0.000 description 20
- 108090000623 proteins and genes Proteins 0.000 description 19
- 238000011002 quantification Methods 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 229940124597 therapeutic agent Drugs 0.000 description 7
- 238000003491 array Methods 0.000 description 6
- 238000000018 DNA microarray Methods 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 238000012453 sprague-dawley rat model Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 238000011331 genomic analysis Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 3
- 210000001072 colon Anatomy 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000009274 differential gene expression Effects 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000008223 sterile water Substances 0.000 description 3
- 241000233866 Fungi Species 0.000 description 2
- UGJMXCAKCUNAIE-UHFFFAOYSA-N Gabapentin Chemical compound OC(=O)CC1(CN)CCCCC1 UGJMXCAKCUNAIE-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 208000005652 acute fatty liver of pregnancy Diseases 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007826 nucleic acid assay Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 241000182988 Assa Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102100033040 Carbonic anhydrase 12 Human genes 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000867855 Homo sapiens Carbonic anhydrase 12 Proteins 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 208000001873 Pseudoaminopterin syndrome Diseases 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002763 arrhythmic effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 229960002870 gabapentin Drugs 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 238000003304 gavage Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000005033 mesothelial cell Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000037323 metabolic rate Effects 0.000 description 1
- 238000006241 metabolic reaction Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 210000001428 peripheral nervous system Anatomy 0.000 description 1
- 230000002974 pharmacogenomic effect Effects 0.000 description 1
- DDBREPKUVSBGFI-UHFFFAOYSA-N phenobarbital Chemical compound C=1C=CC=CC=1C1(CC)C(=O)NC(=O)NC1=O DDBREPKUVSBGFI-UHFFFAOYSA-N 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 230000028070 sporulation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012109 statistical procedure Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- PJDFLNIOAUIZSL-UHFFFAOYSA-N vigabatrin Chemical compound C=CC(N)CCC(O)=O PJDFLNIOAUIZSL-UHFFFAOYSA-N 0.000 description 1
- 229960005318 vigabatrin Drugs 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Complex Calculations (AREA)
Abstract
(57)【要約】
本発明は、少なくとも2つの種類の細胞の間の関連性の程度の表現物を生成するための方法を提供する。
Description
【0001】 (発明の分野) 本発明は、ソフトウェアアルゴリズムに基づく分析を用いる遺伝子発現のゲノ
ム分析に基づく細胞、細胞株、組織、器官、または発現配列間の関連性の程度の
表現物に関する。
ム分析に基づく細胞、細胞株、組織、器官、または発現配列間の関連性の程度の
表現物に関する。
【0002】 (関連出願) 本出願は、米国出願番号 (1999年9月16日出願;表題「遺伝子
発現に基づく幾何的および階層的分類」)および米国仮出願番号第60/101
,009号(1998年9月17日出願;表題「系統ゲノミクスおよび薬理ゲノ
ミクス」の両方に対して優先権の利益を主張し、これらはその全体が本明細書中
に参考として援用される。
発現に基づく幾何的および階層的分類」)および米国仮出願番号第60/101
,009号(1998年9月17日出願;表題「系統ゲノミクスおよび薬理ゲノ
ミクス」の両方に対して優先権の利益を主張し、これらはその全体が本明細書中
に参考として援用される。
【0003】 (発明の背景) 近年において、ゲノミクスおよびプロテオミクスの急速な発達が、提供された
新規な情報を使用する適用の拡大に至っている。このような情報が使用されるよ
うになる重要な領域は、病理学的状態における遺伝子の示差的な発現に従うこの
ような状態の群分けおよび特徴付けにある。最終的な適用は、種々の病的状態の
処置に用いられる既知または候補の薬剤の治療効果の群分けおよび特徴づけにあ
る。種々の統計学的手順を用いるアルゴリズムは、このような分析から得られる
情報の発見的表示を作製するために使用されている。これらの表示は、特定の実
験結果を表現するために、要素が、例えば、偽カラーコード化によってコード化
される、大きな二次元のまたはより高い次元でさえあるアレイを備える。別の表
示は、実験データが、関連性の表現として分岐状または放射状のツリー構造を生
成するために使用されるアレイを備える。さらに、いくつかの異なる生物学的状
態にわたる同時発現のパターンに従って発現配列を群分けするために同様の方法
を使用することもまた可能である。
新規な情報を使用する適用の拡大に至っている。このような情報が使用されるよ
うになる重要な領域は、病理学的状態における遺伝子の示差的な発現に従うこの
ような状態の群分けおよび特徴付けにある。最終的な適用は、種々の病的状態の
処置に用いられる既知または候補の薬剤の治療効果の群分けおよび特徴づけにあ
る。種々の統計学的手順を用いるアルゴリズムは、このような分析から得られる
情報の発見的表示を作製するために使用されている。これらの表示は、特定の実
験結果を表現するために、要素が、例えば、偽カラーコード化によってコード化
される、大きな二次元のまたはより高い次元でさえあるアレイを備える。別の表
示は、実験データが、関連性の表現として分岐状または放射状のツリー構造を生
成するために使用されるアレイを備える。さらに、いくつかの異なる生物学的状
態にわたる同時発現のパターンに従って発現配列を群分けするために同様の方法
を使用することもまた可能である。
【0004】 例えば、酵母Saccharomyces cerevisiaeおよび初代
ヒト線維芽細胞におけるゲノム広域発現のためのクラスター分析のシステムが、
Eisenら(Proc.Natl.Acad.Sci.USA 95:148
63−14868(1998))により提示されている。酵母での作業において
、この生物由来の本質的にあらゆるORFを有するDNAマイクロチップアレイ
が使用された。示差的な発現を、生理学的状態(ジオーキシンシフト(diau
xic shift)、有糸分裂細胞分裂周期、胞子形成、ならびに温度および
減少ショック(reducing shock)を含む)を変動させることによ
り研究した。ヒト線維芽細胞が、血清枯渇後の血清で刺激し、そして約8,60
0の異なるヒト転写物を表現する9,800のcDNAを有するマイクロアレイ
を用いて試験された。さらに、これらの実験におけるさらなる独立した変数は、
アッセイ点を採った時間である。種々の研究における示差遺伝子発現を反映する
データが、対形成平均連鎖クラスター分析(Sokaiら、Univ.Kans
.Sci.Bull.38:1409−1438(1958))を用いて分析さ
れた。この分析は、全ての要素を一つのツリーに集合する系統樹を計算するため
に使用された。
ヒト線維芽細胞におけるゲノム広域発現のためのクラスター分析のシステムが、
Eisenら(Proc.Natl.Acad.Sci.USA 95:148
63−14868(1998))により提示されている。酵母での作業において
、この生物由来の本質的にあらゆるORFを有するDNAマイクロチップアレイ
が使用された。示差的な発現を、生理学的状態(ジオーキシンシフト(diau
xic shift)、有糸分裂細胞分裂周期、胞子形成、ならびに温度および
減少ショック(reducing shock)を含む)を変動させることによ
り研究した。ヒト線維芽細胞が、血清枯渇後の血清で刺激し、そして約8,60
0の異なるヒト転写物を表現する9,800のcDNAを有するマイクロアレイ
を用いて試験された。さらに、これらの実験におけるさらなる独立した変数は、
アッセイ点を採った時間である。種々の研究における示差遺伝子発現を反映する
データが、対形成平均連鎖クラスター分析(Sokaiら、Univ.Kans
.Sci.Bull.38:1409−1438(1958))を用いて分析さ
れた。この分析は、全ての要素を一つのツリーに集合する系統樹を計算するため
に使用された。
【0005】 40の腫瘍サンプル由来の結腸線癌が、ヒトcDNA由来の配列が結合された
Affymetrix DNAチップを用いて、22の正常な結腸組織サンプル
と比較された(Alonら、Proc.Natl.Acad.Sci.USA
96:6745−6750(1999年6月))。3,200の全長ヒトcDN
Aおよび3,400のESTが、配列の中央部に1つの塩基ミスマッチを含むこ
のような配列と同様に、25bpのフラグメントのセットにおいて表現される。
腫瘍組織サンプルおよび正常結腸サンプルの両方における遺伝子発現が、ハイブ
リダイゼーションによって評価された。遺伝子間の相関の統計学的有意性は、対
形成相関係数を算出することにより評価された。発現された遺伝子のクラスター
形成は、2分木でデータを組織化する確定的アニーリング(determini
stic annealing)に基づくアルゴリズムを用いて評価された(R
oseら、Phys.Rev.Lett.65:945−948(1990);
Rose、Proc.IEEE 96:2210−2239(1998))。デ
ータは、大きな二次元カラーコード化アレイとして提示されている。遺伝子が一
方の次元に沿って表示され、そして組織サンプルが他方に沿って表示されている
;人工カラー値は、第三の次元において発現の程度を示すために各アレイ点に割
り当てられている。クラスター形成分析は、種々のランダム化手順が適用される
場合に破壊されるアレイ内のカラー分布におけるパターンを明示する。データセ
ットにおける遺伝子のクラスター形成は、その発現が組織タイプにわたって相関
される遺伝子群を明示する。このアルゴリズムは、組織を別個のクラスターに分
ける。
Affymetrix DNAチップを用いて、22の正常な結腸組織サンプル
と比較された(Alonら、Proc.Natl.Acad.Sci.USA
96:6745−6750(1999年6月))。3,200の全長ヒトcDN
Aおよび3,400のESTが、配列の中央部に1つの塩基ミスマッチを含むこ
のような配列と同様に、25bpのフラグメントのセットにおいて表現される。
腫瘍組織サンプルおよび正常結腸サンプルの両方における遺伝子発現が、ハイブ
リダイゼーションによって評価された。遺伝子間の相関の統計学的有意性は、対
形成相関係数を算出することにより評価された。発現された遺伝子のクラスター
形成は、2分木でデータを組織化する確定的アニーリング(determini
stic annealing)に基づくアルゴリズムを用いて評価された(R
oseら、Phys.Rev.Lett.65:945−948(1990);
Rose、Proc.IEEE 96:2210−2239(1998))。デ
ータは、大きな二次元カラーコード化アレイとして提示されている。遺伝子が一
方の次元に沿って表示され、そして組織サンプルが他方に沿って表示されている
;人工カラー値は、第三の次元において発現の程度を示すために各アレイ点に割
り当てられている。クラスター形成分析は、種々のランダム化手順が適用される
場合に破壊されるアレイ内のカラー分布におけるパターンを明示する。データセ
ットにおける遺伝子のクラスター形成は、その発現が組織タイプにわたって相関
される遺伝子群を明示する。このアルゴリズムは、組織を別個のクラスターに分
ける。
【0006】 癌化学療法において実際に使用される化合物または使用のためにスクリーニン
グされる化合物の薬理学的効果は、National Cancer Inst
ituteでクラスター分析によって分析された(Weinsteinら、Sc
ience 275:343−349(1997))。60,000を超える化
合物が、60のヒト癌細胞株のパネルに対してスクリーニングされた。所定の細
胞株における化合物の50%の成長阻害濃度は、全ての細胞株にわたって分析し
た場合、薬物作用および薬物耐性の機構についての詳細な情報を提供した。活性
のパターンが、COMPAREアルゴリズムによってまず分析された(Paul
lら、J.Natl.Cancer Inst.81:1088(1989);
Jayaram、Biochem.Biopjys.Res.Commun.1
86:1600(1992);Paullら、Cancer Chemothe
rapeutic Agents、Foye(編)、American Che
mical Society、Washington DC、1993、157
4−1581;Boydら、Drug Dev.Res.34:91(1993
))。開発された手順は、3つのデータベース、つまり候補化合物についての構
造情報を特徴付けるSデータベース、60の細胞株に関連したAデータベース、
および作用の分子標的に対する情報を含むTデータベースに依存する。分析の結
果の一例において、標的に対する化合物を表示する三次元アレイ(偽カラーコー
ドが、アレイにおける各位置について第三の次元で相関係数を提供する)が開発
された。
グされる化合物の薬理学的効果は、National Cancer Inst
ituteでクラスター分析によって分析された(Weinsteinら、Sc
ience 275:343−349(1997))。60,000を超える化
合物が、60のヒト癌細胞株のパネルに対してスクリーニングされた。所定の細
胞株における化合物の50%の成長阻害濃度は、全ての細胞株にわたって分析し
た場合、薬物作用および薬物耐性の機構についての詳細な情報を提供した。活性
のパターンが、COMPAREアルゴリズムによってまず分析された(Paul
lら、J.Natl.Cancer Inst.81:1088(1989);
Jayaram、Biochem.Biopjys.Res.Commun.1
86:1600(1992);Paullら、Cancer Chemothe
rapeutic Agents、Foye(編)、American Che
mical Society、Washington DC、1993、157
4−1581;Boydら、Drug Dev.Res.34:91(1993
))。開発された手順は、3つのデータベース、つまり候補化合物についての構
造情報を特徴付けるSデータベース、60の細胞株に関連したAデータベース、
および作用の分子標的に対する情報を含むTデータベースに依存する。分析の結
果の一例において、標的に対する化合物を表示する三次元アレイ(偽カラーコー
ドが、アレイにおける各位置について第三の次元で相関係数を提供する)が開発
された。
【0007】 ゲノムに由来する属性の相関およびクラスター形成のために現在使用されてい
る手順の考慮の際に、特定の問題が生じる。DNAマイクロチップの使用は、そ
のチップに結合された捕捉プローブとして使用されるDNA配列フラグメントの
サンプリングに対して、いかなる分析をも固有に制限する。捕捉プローブの1つ
とハイブリダイズしないDNAフラグメントの検出は可能ではなく、そのため、
陽性の結果が失われる可能性がある。さらに、変異生成または他の対立遺伝子多
型が、中程度または低いストリンジェンシーの条件下では捕捉プローブに結合し
ないかもしれず、そのためまた、陽性の結果に関する情報が失われるかもしれな
い。
る手順の考慮の際に、特定の問題が生じる。DNAマイクロチップの使用は、そ
のチップに結合された捕捉プローブとして使用されるDNA配列フラグメントの
サンプリングに対して、いかなる分析をも固有に制限する。捕捉プローブの1つ
とハイブリダイズしないDNAフラグメントの検出は可能ではなく、そのため、
陽性の結果が失われる可能性がある。さらに、変異生成または他の対立遺伝子多
型が、中程度または低いストリンジェンシーの条件下では捕捉プローブに結合し
ないかもしれず、そのためまた、陽性の結果に関する情報が失われるかもしれな
い。
【0008】 これらの理由のために、研究中の生物のゲノムへのより包括的な接近可能性に
基づくゲノム統計学的分析の方法の必要性がある。さらに、遺伝子の関連性のゲ
ノム分析において、および実際のまたは候補の薬剤への応答のゲノム分析におい
て得られた情報(問題のゲノムへの包括的な接近から収集された情報を含む)を
提示する様式についても、依然、必要性がある。本発明は、特定の研究において
独立した変数として出現する成分のクラスター形成分析における、多数の配列デ
ータベースから利用可能な部分ゲノム配列および全長ゲノム配列の、本発明にお
いてなされる使用のために、これらの必要性に取り組む。
基づくゲノム統計学的分析の方法の必要性がある。さらに、遺伝子の関連性のゲ
ノム分析において、および実際のまたは候補の薬剤への応答のゲノム分析におい
て得られた情報(問題のゲノムへの包括的な接近から収集された情報を含む)を
提示する様式についても、依然、必要性がある。本発明は、特定の研究において
独立した変数として出現する成分のクラスター形成分析における、多数の配列デ
ータベースから利用可能な部分ゲノム配列および全長ゲノム配列の、本発明にお
いてなされる使用のために、これらの必要性に取り組む。
【0009】 (発明の要旨) 本発明は、データセットの少なくとも2つの種類間での幾何的および階層的分
類の新規な方法を提供する。データセットは、細胞、核酸配列、ポリペプチド配
列などを表現し得る。本発明はまた、記載された種類の細胞の核酸部分に関する
インプット情報を提供するために、標準的なDNAマイクロチップアレイおよび
非DNAチップ技術の両方を利用することができる。次いで、データは、目視に
よって容易に判読可能な関連性の表現物を提供するために、種々の様式で処理さ
れる。本発明はさらに、細胞の少なくとも2つの種類間の相関であって、種類間
に存在する核酸の組成および量におけるいかなる変化も反映する相関の表現物を
生成するための新規な方法を提供する。
類の新規な方法を提供する。データセットは、細胞、核酸配列、ポリペプチド配
列などを表現し得る。本発明はまた、記載された種類の細胞の核酸部分に関する
インプット情報を提供するために、標準的なDNAマイクロチップアレイおよび
非DNAチップ技術の両方を利用することができる。次いで、データは、目視に
よって容易に判読可能な関連性の表現物を提供するために、種々の様式で処理さ
れる。本発明はさらに、細胞の少なくとも2つの種類間の相関であって、種類間
に存在する核酸の組成および量におけるいかなる変化も反映する相関の表現物を
生成するための新規な方法を提供する。
【0010】 この細胞種類は、種々の細胞集団間の差異を比較する際の使用のために、異な
る供給源由来であり得る。これらの差異としては、種差異、組織差異、疾患状態
差異、および薬物処置差異が挙げられるが、これらに限定されない。コンピュー
ターアルゴリズムは、選択された細胞種類間の差異を反映するインプットデータ
を分析し、そして意味のある様式でそれらを表現する。
る供給源由来であり得る。これらの差異としては、種差異、組織差異、疾患状態
差異、および薬物処置差異が挙げられるが、これらに限定されない。コンピュー
ターアルゴリズムは、選択された細胞種類間の差異を反映するインプットデータ
を分析し、そして意味のある様式でそれらを表現する。
【0011】 本発明より前では、インプット情報は、比較されるべき細胞種類の核酸を分析
するために、DNAチップ技術を用いることによってのみ得られた。これらの方
法についての欠点は、同定者配列が、既に知られ、そして単離されている必要が
あること、チップ技術が、チップ上に固定化される核酸の数に関連したサイズの
制限を有すること、およびこのチップは、一旦製造されると、核酸パラメーター
を拡大することが事実上不可能であることである。本発明は、インプット細胞種
類間の差異をアッセイするための、GeneCallingTM、非DNAチップ
技術の使用を提供する。予期されない結果は、GeneCallingTMが、上
記の共通点のない群の間の感度の高い比較を提供し得ることであり、それにより
、インプット核酸集団をアッセイする場合のDNAチップ技術の使用に固有の制
限を回避する。
するために、DNAチップ技術を用いることによってのみ得られた。これらの方
法についての欠点は、同定者配列が、既に知られ、そして単離されている必要が
あること、チップ技術が、チップ上に固定化される核酸の数に関連したサイズの
制限を有すること、およびこのチップは、一旦製造されると、核酸パラメーター
を拡大することが事実上不可能であることである。本発明は、インプット細胞種
類間の差異をアッセイするための、GeneCallingTM、非DNAチップ
技術の使用を提供する。予期されない結果は、GeneCallingTMが、上
記の共通点のない群の間の感度の高い比較を提供し得ることであり、それにより
、インプット核酸集団をアッセイする場合のDNAチップ技術の使用に固有の制
限を回避する。
【0012】 本発明は、差分ベクトルの振幅を反映する距離を計算することにより、種類間
のフラグメントの存在および量における類似性または差異を反映する、関連性の
程度を生成するための新規な方法を提供する。関連性の表現物を生成するための
方法の顕著な実施態様において、この関連性の程度は、任意の2つの種類間の関
連性を反映するツリー構造を生成することにより提供される。ツリー構造のブラ
ンチは、差分ベクトルを反映し、そしてノードから分岐している。
のフラグメントの存在および量における類似性または差異を反映する、関連性の
程度を生成するための新規な方法を提供する。関連性の表現物を生成するための
方法の顕著な実施態様において、この関連性の程度は、任意の2つの種類間の関
連性を反映するツリー構造を生成することにより提供される。ツリー構造のブラ
ンチは、差分ベクトルを反映し、そしてノードから分岐している。
【0013】 本発明はまた、データセットの種類間の相関の表現物を生成するための新規な
方法を提供する。相関の表現物を生成するための方法の顕著な実施態様において
、この相関は、正規直交固有ベクトルのセットに関連している。相関の表現物を
生成するための方法の別の顕著な実施態様において、この表現物は、クラスター
ダイアグラムまたは系統樹であり、そしてこの2つの種類の細胞間の差異に対す
る生化学的応答または生理的応答に関与する経路の関連性を反映するツリー構造
を含む。
方法を提供する。相関の表現物を生成するための方法の顕著な実施態様において
、この相関は、正規直交固有ベクトルのセットに関連している。相関の表現物を
生成するための方法の別の顕著な実施態様において、この表現物は、クラスター
ダイアグラムまたは系統樹であり、そしてこの2つの種類の細胞間の差異に対す
る生化学的応答または生理的応答に関与する経路の関連性を反映するツリー構造
を含む。
【0014】 本発明はさらに、データセットの種類間の差異の幾何的表現物を提供すること
に関する。幾何的表現物は、例を限定しないが、主成分分析および主要因分析、
ならびにそれらから派生した次元を下げた表現物を包含する。この幾何的表現物
は、遺伝子、核酸、またはそれらのフラグメントの存在について分析する任意の
方法(核酸マイクロチップアレイ、および発現遺伝子または核酸フラグメントの
差分表示を含む)をも使用して、細胞の種類間で決定された差異に基づく。
に関する。幾何的表現物は、例を限定しないが、主成分分析および主要因分析、
ならびにそれらから派生した次元を下げた表現物を包含する。この幾何的表現物
は、遺伝子、核酸、またはそれらのフラグメントの存在について分析する任意の
方法(核酸マイクロチップアレイ、および発現遺伝子または核酸フラグメントの
差分表示を含む)をも使用して、細胞の種類間で決定された差異に基づく。
【0015】 本発明は、表現物それ自体に加えて、データセットの種類間の関連性の程度の
表現物、相関、および差異の幾何的表現物を表示するための表示手段もまた提供
する。
表現物、相関、および差異の幾何的表現物を表示するための表示手段もまた提供
する。
【0016】 (詳細な説明) 本発明は、細胞の任意の2個以上の異なる種類の細胞間の関連性の表現物を作
製するための方法に関する。この種類は、動物および植物生物に発生する細胞を
広く包含し、この細胞はさらに正常な細胞または疾患状態の細胞(腫瘍細胞を含
む)である。それらは、推定上の薬学的薬剤で処置された細胞をさらに含む。こ
の表現物は、細胞性供給源の各々に由来する核酸フラグメントに関するサイズお
よび配列の情報を提供する実験的データを使用して得られる。このフラグメント
は、幾つかの方法のいずれかで、各種類の細胞の核酸内容物から調製され得る。
例えば、特に重要な実施態様において、それらは特定の一対の制限エンドヌクレ
アーゼによって消化に供され得る;あるいは、別の重要な実施態様において、細
胞抽出物は、特別に設計されたプライマーオリゴヌクレオチドを使用して増幅に
供され得る。本発明はまた、そのように生成された核酸フラグメント間の同時発
現に関して、関連性の表現物を作製するための方法に関する。
製するための方法に関する。この種類は、動物および植物生物に発生する細胞を
広く包含し、この細胞はさらに正常な細胞または疾患状態の細胞(腫瘍細胞を含
む)である。それらは、推定上の薬学的薬剤で処置された細胞をさらに含む。こ
の表現物は、細胞性供給源の各々に由来する核酸フラグメントに関するサイズお
よび配列の情報を提供する実験的データを使用して得られる。このフラグメント
は、幾つかの方法のいずれかで、各種類の細胞の核酸内容物から調製され得る。
例えば、特に重要な実施態様において、それらは特定の一対の制限エンドヌクレ
アーゼによって消化に供され得る;あるいは、別の重要な実施態様において、細
胞抽出物は、特別に設計されたプライマーオリゴヌクレオチドを使用して増幅に
供され得る。本発明はまた、そのように生成された核酸フラグメント間の同時発
現に関して、関連性の表現物を作製するための方法に関する。
【0017】 本発明はさらに、これらの方法によって提供される表現物、およびこのような
表現物が表示される表示手段に関する。制限エンドヌクレアーゼの使用または増
幅プライマーの適用のようなフラグメントを調製するための方法が、得られるフ
ラグメントの末端に関する配列情報を提供するために選択され、一方で、サイズ
決定がフラグメントの長さを提供する。これらのタイプの情報の特定の適用にお
いて、このサイズおよび配列の結果は、補正した長さおよび末端サブ配列を有す
る公知の完全核酸配列の1つまたはそれ以上の候補フラグメントの同一性を提供
するために、公知の核酸配列を提供するデータベースに対して必要に応じてスキ
ャンされ得る(米国特許第5,871,697号;Shimketら、1999
Nature Biotechnology 17:798−803)。この
データベースを探索する工程は、本発明の必要とされる特徴ではない。この理由
のために、本表現物および方法は、それらの現在公知のものよりも、サンプル間
のより包括的なおよび情報量の多いゲノムの変異物である。本発明の背景に記載
されるように、現在公知の手順は、与えられた手順のプローブ配列としてDNA
マイクロチップに適用されるそれらの核酸フラグメントに対するそれらの包括性
に制限される。公知のゲノム配列を有するモデル生物の狭く限定されたセットを
除いて、このようなプローブ配列の数は、配列データベースにおいて有用であり
本発明で使用される公知の核酸配列の数より相当少ない。さらに、完全に配列決
定されたゲノムの場合でさえ、遺伝子改変物は現存するDNAマイクロチップで
は、適切にプローブ化されない。この相違は、本発明の重要な利点を特徴付ける
。
表現物が表示される表示手段に関する。制限エンドヌクレアーゼの使用または増
幅プライマーの適用のようなフラグメントを調製するための方法が、得られるフ
ラグメントの末端に関する配列情報を提供するために選択され、一方で、サイズ
決定がフラグメントの長さを提供する。これらのタイプの情報の特定の適用にお
いて、このサイズおよび配列の結果は、補正した長さおよび末端サブ配列を有す
る公知の完全核酸配列の1つまたはそれ以上の候補フラグメントの同一性を提供
するために、公知の核酸配列を提供するデータベースに対して必要に応じてスキ
ャンされ得る(米国特許第5,871,697号;Shimketら、1999
Nature Biotechnology 17:798−803)。この
データベースを探索する工程は、本発明の必要とされる特徴ではない。この理由
のために、本表現物および方法は、それらの現在公知のものよりも、サンプル間
のより包括的なおよび情報量の多いゲノムの変異物である。本発明の背景に記載
されるように、現在公知の手順は、与えられた手順のプローブ配列としてDNA
マイクロチップに適用されるそれらの核酸フラグメントに対するそれらの包括性
に制限される。公知のゲノム配列を有するモデル生物の狭く限定されたセットを
除いて、このようなプローブ配列の数は、配列データベースにおいて有用であり
本発明で使用される公知の核酸配列の数より相当少ない。さらに、完全に配列決
定されたゲノムの場合でさえ、遺伝子改変物は現存するDNAマイクロチップで
は、適切にプローブ化されない。この相違は、本発明の重要な利点を特徴付ける
。
【0018】 本発明はさらに、細胞の種類間の相違の幾何的表現物を提供する工程に関する
。幾何的表現物は、非限定的例として、主成分分析および主因子分析、ならびに
それらに由来する減少した寸法の表現物を包括する。この幾何的表現物は、遺伝
子、核酸またはそれらのフラグメントの存在を分析するための任意の方法を使用
して細胞の種類間で決定される相違に基づく。この方法には、核酸マイクロチッ
プアレイおよび発現された遺伝子または核酸フラグメントの差次的表示を含む。
。幾何的表現物は、非限定的例として、主成分分析および主因子分析、ならびに
それらに由来する減少した寸法の表現物を包括する。この幾何的表現物は、遺伝
子、核酸またはそれらのフラグメントの存在を分析するための任意の方法を使用
して細胞の種類間で決定される相違に基づく。この方法には、核酸マイクロチッ
プアレイおよび発現された遺伝子または核酸フラグメントの差次的表示を含む。
【0019】 本明細書中で使用される「サンプル」は、計画が固定されたままである場合に
全ての変数が研究される特定の実験条件に関する。非限定的例として、変数が細
胞の種類である場合、「サンプル」は特定の細胞のタイプをいい;変数が計画に
おいて使用される配列対である場合、「サンプル」は特定の配列対をいい;また
は変数が1セットの推定上の薬学的薬剤である場合、「サンプル」はこのセット
からの特定の薬剤をいう。本明細書中で使用される「表現物」は、本発明の方法
に従って得られる結果の画像を提供する任意の図解的、視覚的または等価な非言
語の表示をいう。より具体的には、本発明の「表現物」は、本発明の根底をなす
実験によって集められた定量的結果を変換することによって得られる。このよう
なデータの例には、非限定的な例として、細胞の種類および/または推定上の1
セットの治療学的薬剤にわたる差次的遺伝子発現、ならびに/あるいは実験的パ
ラメータの等価なタイプが挙げられる。
全ての変数が研究される特定の実験条件に関する。非限定的例として、変数が細
胞の種類である場合、「サンプル」は特定の細胞のタイプをいい;変数が計画に
おいて使用される配列対である場合、「サンプル」は特定の配列対をいい;また
は変数が1セットの推定上の薬学的薬剤である場合、「サンプル」はこのセット
からの特定の薬剤をいう。本明細書中で使用される「表現物」は、本発明の方法
に従って得られる結果の画像を提供する任意の図解的、視覚的または等価な非言
語の表示をいう。より具体的には、本発明の「表現物」は、本発明の根底をなす
実験によって集められた定量的結果を変換することによって得られる。このよう
なデータの例には、非限定的な例として、細胞の種類および/または推定上の1
セットの治療学的薬剤にわたる差次的遺伝子発現、ならびに/あるいは実験的パ
ラメータの等価なタイプが挙げられる。
【0020】 重要な実施態様において、本発明の表現物は、コンピュータで実行されるアル
ゴニズムによって生成され、そしてコンピュータの操作において使用されるディ
スプレイスクリーンまたはモニタのような表示手段への表示に適している。この
表現物はまた、記憶モジュールへの記憶またはこのようなコンピュータのデータ
獲得に適している。それは、コンピュータから紙のような媒体または等価な物理
的媒体への印刷、および携帯記憶媒体(例えば、磁気媒体、CD ROMおよび
等価な記憶媒体が挙げられる)への記録になおさらに適している。本明細書中で
使用される「表示手段」として、この段落の上で同定された任意の物体および媒
体、ならびに視覚的検査のための計算処理の結果を表示するために適切な等価な
機器および物体が挙げられる。
ゴニズムによって生成され、そしてコンピュータの操作において使用されるディ
スプレイスクリーンまたはモニタのような表示手段への表示に適している。この
表現物はまた、記憶モジュールへの記憶またはこのようなコンピュータのデータ
獲得に適している。それは、コンピュータから紙のような媒体または等価な物理
的媒体への印刷、および携帯記憶媒体(例えば、磁気媒体、CD ROMおよび
等価な記憶媒体が挙げられる)への記録になおさらに適している。本明細書中で
使用される「表示手段」として、この段落の上で同定された任意の物体および媒
体、ならびに視覚的検査のための計算処理の結果を表示するために適切な等価な
機器および物体が挙げられる。
【0021】 本明細書中で使用される「関連性の程度」は、同じタイプの要素の2つのメン
バ間の類似度または非類似度の本発明の方法に従う特徴であり;特に重要な実施
態様において、要素のタイプは細胞の種類であり得る。
バ間の類似度または非類似度の本発明の方法に従う特徴であり;特に重要な実施
態様において、要素のタイプは細胞の種類であり得る。
【0022】 本明細書中で使用される「推定上の薬学的薬剤」は、治療学的薬剤であるため
の候補である化学的化合物、または少なくとも1つの化学的化合物を含有する組
成物に関する。任意のこのような治療学的薬剤は、疾患または症状に羅患する哺
乳動物を処置する際に使用され得る。治療学的薬剤によって哺乳動物を処置する
際に、疾患または症状の兆候および/または潜在する原因を減弱し、その兆候お
よび/または潜在する原因を改善し、その疾患または症状の治癒に寄与すること
が意図される。推定上の薬学的薬剤の非限定的な例には、化学的化合物ライブラ
リーから引き出される薬剤;天然源由来の単離物;特に推定上の薬剤として合成
された化合物;あるいは、組換えタンパク質、組換えタンパク質のフラグメント
、組換えポリペプチド、組換えポリペプチドのフラグメント、組換えペプチドま
たは核酸(例えば、アンチセンス薬剤を意図するオリゴヌクレオチドおよび遺伝
子治療学的薬剤としての投与を意図する組換え遺伝子)のような遺伝子工学およ
び組換え核酸技術の実践を使用して誘導されるかまたは得られる物質が挙げられ
る。
の候補である化学的化合物、または少なくとも1つの化学的化合物を含有する組
成物に関する。任意のこのような治療学的薬剤は、疾患または症状に羅患する哺
乳動物を処置する際に使用され得る。治療学的薬剤によって哺乳動物を処置する
際に、疾患または症状の兆候および/または潜在する原因を減弱し、その兆候お
よび/または潜在する原因を改善し、その疾患または症状の治癒に寄与すること
が意図される。推定上の薬学的薬剤の非限定的な例には、化学的化合物ライブラ
リーから引き出される薬剤;天然源由来の単離物;特に推定上の薬剤として合成
された化合物;あるいは、組換えタンパク質、組換えタンパク質のフラグメント
、組換えポリペプチド、組換えポリペプチドのフラグメント、組換えペプチドま
たは核酸(例えば、アンチセンス薬剤を意図するオリゴヌクレオチドおよび遺伝
子治療学的薬剤としての投与を意図する組換え遺伝子)のような遺伝子工学およ
び組換え核酸技術の実践を使用して誘導されるかまたは得られる物質が挙げられ
る。
【0023】 本明細書中で使用される核酸の「フラグメント」は、1種類の細胞由来の遺伝
子またはcDNA由来の核酸から発生する連続部分をいう。この連続部分は、各
末端またはその近傍に、本明細書中で開示される操作手順に従って規定される標
的サブ配列を含み、2つの標的サブ配列によって結合されるフラグメントの配列
内の全てのヌクレオチドを含む。2つの標的サブ配列間のヌクレオチドは、それ
ら自体サブ配列と一緒になって、本明細書中で使用されるフラグメントの「長さ
」を規定する。標的サブ配列は、例えば、細胞由来の核酸を特定の制限エンドヌ
クレアーゼの対、または特定のオリゴヌクレオチドプライマーの対と、等価な様
式で接触させる工程によって同定される。
子またはcDNA由来の核酸から発生する連続部分をいう。この連続部分は、各
末端またはその近傍に、本明細書中で開示される操作手順に従って規定される標
的サブ配列を含み、2つの標的サブ配列によって結合されるフラグメントの配列
内の全てのヌクレオチドを含む。2つの標的サブ配列間のヌクレオチドは、それ
ら自体サブ配列と一緒になって、本明細書中で使用されるフラグメントの「長さ
」を規定する。標的サブ配列は、例えば、細胞由来の核酸を特定の制限エンドヌ
クレアーゼの対、または特定のオリゴヌクレオチドプライマーの対と、等価な様
式で接触させる工程によって同定される。
【0024】 本発明で使用される情報は、差次的な遺伝子発現の結果を提供する実験から得
られ、ここでこの差分は、実験状態および基準状態に関する。通常、基準状態は
、正常な、あるいは混乱しないまたは非症状の種類の細胞をいう。実験状態は、
1種類の細胞に適用される特定のセットの状態に関し得、次いでその対応する基
準状態は、第2のクラスの細胞に適用される同じセットの状態に関する。実験状
態はまた、1つまたはそれ以上の推定上の治療学的薬剤の存在下の1種類の細胞
に関し、この場合、基準状態は任意の推定上の治療学的薬剤の非存在下の同じク
ラスの細胞に関する。実験状態はさらに、特定のセットの環境にある目的の1種
類の細胞から得られ得る。これには、所定の細胞のタイプの細胞、所定の組織由
来の細胞、および所定の器官由来の細胞が挙げられ、さらに、非癌性または癌性
であり得る細胞が挙げられる。本発明内に包含される細胞の種類には、非限定的
な例として、内皮細胞、中皮細胞、および上皮細胞が挙げられる。本発明内に含
まれる組織および器官には、非限定的な例として、肺、心臓、骨格筋、平滑筋、
脳、中枢神経系、末梢神経系、胃、肝臓、腎臓、生殖組織および器官、皮膚、な
らびに骨が挙げられる。癌細胞には、非限定的な例として、前立腺ガン、乳ガン
、大腸ガン、肺ガン、リンパ性または造血性ガン由来の細胞が挙げられ、これは
また、組織生検または国立がん研究所ヒト腫瘍細胞株パネルの細胞株から得られ
た細胞を含む。本発明に供される細胞はまた、植物、酵母、真菌、および他の分
類学的群から起源し得る。
られ、ここでこの差分は、実験状態および基準状態に関する。通常、基準状態は
、正常な、あるいは混乱しないまたは非症状の種類の細胞をいう。実験状態は、
1種類の細胞に適用される特定のセットの状態に関し得、次いでその対応する基
準状態は、第2のクラスの細胞に適用される同じセットの状態に関する。実験状
態はまた、1つまたはそれ以上の推定上の治療学的薬剤の存在下の1種類の細胞
に関し、この場合、基準状態は任意の推定上の治療学的薬剤の非存在下の同じク
ラスの細胞に関する。実験状態はさらに、特定のセットの環境にある目的の1種
類の細胞から得られ得る。これには、所定の細胞のタイプの細胞、所定の組織由
来の細胞、および所定の器官由来の細胞が挙げられ、さらに、非癌性または癌性
であり得る細胞が挙げられる。本発明内に包含される細胞の種類には、非限定的
な例として、内皮細胞、中皮細胞、および上皮細胞が挙げられる。本発明内に含
まれる組織および器官には、非限定的な例として、肺、心臓、骨格筋、平滑筋、
脳、中枢神経系、末梢神経系、胃、肝臓、腎臓、生殖組織および器官、皮膚、な
らびに骨が挙げられる。癌細胞には、非限定的な例として、前立腺ガン、乳ガン
、大腸ガン、肺ガン、リンパ性または造血性ガン由来の細胞が挙げられ、これは
また、組織生検または国立がん研究所ヒト腫瘍細胞株パネルの細胞株から得られ
た細胞を含む。本発明に供される細胞はまた、植物、酵母、真菌、および他の分
類学的群から起源し得る。
【0025】 細胞の種類間(例えば、第1種類の細胞と第2種類の細胞との間)の関連性の
程度を評価する方法は、その2種類の細胞間の特定の遺伝子の発現の関連性の程
度を評価する際に見出される。本発明のより好ましい実施態様において、特定の
制限エンドヌクレアーゼの対による消化に対する細胞内に存在する核酸の感受率
の類似性および差違が、本発明の方法に従って、Rothbergらの共有に係
る米国特許第5,871,697号およびShimketsら1999(Nat
ure Biotechnology17:798−803)(これらの両方と
も本明細書中において全体を通して参考として援用される)に詳細に開示される
手順によって決定された。
程度を評価する方法は、その2種類の細胞間の特定の遺伝子の発現の関連性の程
度を評価する際に見出される。本発明のより好ましい実施態様において、特定の
制限エンドヌクレアーゼの対による消化に対する細胞内に存在する核酸の感受率
の類似性および差違が、本発明の方法に従って、Rothbergらの共有に係
る米国特許第5,871,697号およびShimketsら1999(Nat
ure Biotechnology17:798−803)(これらの両方と
も本明細書中において全体を通して参考として援用される)に詳細に開示される
手順によって決定された。
【0026】 簡潔に述べると、1種類の細胞の任意の実験状態の場合、好ましくは細胞由来
の、cDNAの調製物の形態にある細胞の核酸内容物が、特定のエンドヌクレア
ーゼの対によって制限エンドヌクレアーゼ(「RE」)消化に供される。RE対
の各メンバーは、ヌクレアーゼ消化から生じる制限フラグメントが唯一のフラグ
メントである可能性を最適化するように選択される。この方法の重要な実施にお
いて、その制限ヌクレアーゼ消化は所定の実験状態にある種類の細胞から調製さ
れたcDNAについて実施される。この実施は、実験状態で発現される遺伝子の
強調をもたらし、これらの多くは所定の実験状態の特徴であり得、そしてより不
十分に発現され得るか、または異なる実験状態において有意に全く発現され得な
い。多数の特定のヌクレアーゼの対が使用され得る。あるいは、遺伝子の発現は
、特徴的様式で、所定の実験状態で抑制され得、そしてより高いレベルで(例え
ば、構成的なレベルで)異なる実験状態で発現され得る。非限定的な例として、
本発明を実施する際に使用され得る幾つかの制限ヌクレアーゼの対が米国特許第
5,871,697号に開示される。
の、cDNAの調製物の形態にある細胞の核酸内容物が、特定のエンドヌクレア
ーゼの対によって制限エンドヌクレアーゼ(「RE」)消化に供される。RE対
の各メンバーは、ヌクレアーゼ消化から生じる制限フラグメントが唯一のフラグ
メントである可能性を最適化するように選択される。この方法の重要な実施にお
いて、その制限ヌクレアーゼ消化は所定の実験状態にある種類の細胞から調製さ
れたcDNAについて実施される。この実施は、実験状態で発現される遺伝子の
強調をもたらし、これらの多くは所定の実験状態の特徴であり得、そしてより不
十分に発現され得るか、または異なる実験状態において有意に全く発現され得な
い。多数の特定のヌクレアーゼの対が使用され得る。あるいは、遺伝子の発現は
、特徴的様式で、所定の実験状態で抑制され得、そしてより高いレベルで(例え
ば、構成的なレベルで)異なる実験状態で発現され得る。非限定的な例として、
本発明を実施する際に使用され得る幾つかの制限ヌクレアーゼの対が米国特許第
5,871,697号に開示される。
【0027】 代替の実施態様において、関連性の程度は、増幅フラグメント長多型分析(「
AFLP」)によって得られ得る。簡潔に述べると、試験される種類の細胞の核
酸内容物の増幅は、プライマー依存型増幅手順に供され、ここでは、1セットの
プライマー対のいずれかが増幅を開始するために使用される。増幅手順は、例え
ば、Innisら、PCR Protocols,a Guide to Me
thods and Applications,Academic Pres
s,New York(1989),およびInnisら.,PCR Stra
tegies,Academic Press,New York(1995)
にかなり詳細に記載される。各プライマー対のプライマーは、互いに異なり、増
幅プロセスの対象である異なるサブ配列を反映する。増幅は、分子生物学の分野
において公知のポリメラーゼ鎖反応を含む任意の手順によって実施される得る。
AFLPにおいて、所定の実験状態に見出されるアンプリコンの長さは異なる実
験状態に見出される長さと異なる。これは、例えば、所定の実験状態が、増幅反
応に使用されるプライマーによって認識されるサブ配列に起こる変異から生じる
場合に、生じ得る。それはまた、その状態にある細胞の核酸の欠失またはその核
酸内への挿入から生じ得る。
AFLP」)によって得られ得る。簡潔に述べると、試験される種類の細胞の核
酸内容物の増幅は、プライマー依存型増幅手順に供され、ここでは、1セットの
プライマー対のいずれかが増幅を開始するために使用される。増幅手順は、例え
ば、Innisら、PCR Protocols,a Guide to Me
thods and Applications,Academic Pres
s,New York(1989),およびInnisら.,PCR Stra
tegies,Academic Press,New York(1995)
にかなり詳細に記載される。各プライマー対のプライマーは、互いに異なり、増
幅プロセスの対象である異なるサブ配列を反映する。増幅は、分子生物学の分野
において公知のポリメラーゼ鎖反応を含む任意の手順によって実施される得る。
AFLPにおいて、所定の実験状態に見出されるアンプリコンの長さは異なる実
験状態に見出される長さと異なる。これは、例えば、所定の実験状態が、増幅反
応に使用されるプライマーによって認識されるサブ配列に起こる変異から生じる
場合に、生じ得る。それはまた、その状態にある細胞の核酸の欠失またはその核
酸内への挿入から生じ得る。
【0028】 本発明の表現物を生成するために使用され得る実験手順および計算手順が、以
下に一般的に記載される。
下に一般的に記載される。
【0029】 (測定) まず、遺伝子発現レベルは、実験的に決定される。これは、好ましい実施態様
において、制限エンドヌクレアーゼを使用して差次的発現の遺伝子プロトコル(
米国特許第5,871,697号)に従って実施され得る。各対の制限酵素およ
び各生物学的サンプルに対して、蛍光標識されたDNAフラグメントのプールが
生成される。次いで、電気泳動が実施され、これらのフラグメントを大きさに基
づいて分離し、そしてIsrt(x)で表される強度が検出される:ここで、sは
サンプル(すなわち、細胞の種類)を示し;rは制限酵素対、すなわち遺伝子フ
ラグメントを示し;tは試行(trial)を示し、そしてxは、電気泳動によ
って決定されるフラグメントの長さである。長さxは、連続した指数(cont
inuous index)または都合の良い打切り(convenient
discretization)のいずれかであり得る。例として、電気泳動図
の解像度は、0.1ヌクレオチド(「nt」)の打切りに設定され得る。通常、
これらの独立した試行が実施される。平均シグナルIsr(x)は、次いで、nt
回の試行を平均することによって得られる。
において、制限エンドヌクレアーゼを使用して差次的発現の遺伝子プロトコル(
米国特許第5,871,697号)に従って実施され得る。各対の制限酵素およ
び各生物学的サンプルに対して、蛍光標識されたDNAフラグメントのプールが
生成される。次いで、電気泳動が実施され、これらのフラグメントを大きさに基
づいて分離し、そしてIsrt(x)で表される強度が検出される:ここで、sは
サンプル(すなわち、細胞の種類)を示し;rは制限酵素対、すなわち遺伝子フ
ラグメントを示し;tは試行(trial)を示し、そしてxは、電気泳動によ
って決定されるフラグメントの長さである。長さxは、連続した指数(cont
inuous index)または都合の良い打切り(convenient
discretization)のいずれかであり得る。例として、電気泳動図
の解像度は、0.1ヌクレオチド(「nt」)の打切りに設定され得る。通常、
これらの独立した試行が実施される。平均シグナルIsr(x)は、次いで、nt
回の試行を平均することによって得られる。
【0030】 Ist(x)=(1/nt)ΣtIsrt(x)Σj (I) 次に、各制限酵素の対rに関する長さx(ここで、サンプルのいくつかは、測
定された強度において有意な差分を有する)が同定される。このような差分は、
細胞型に関して、または推定薬剤の存在 対 非存在に関して決定される。この
ような差分dをd番目とし、値Isd=Isr(x)が次いで集合される。有意な差
分を同定するためのいくつかの方法がいずれも使用され得、それらのいくつかは
本明細書中に概説される。例えば、重要な方法は、以下の計算ステップを包含す
る: 1.平均Ir(x)=ΣsIsr(x)が評価される。
定された強度において有意な差分を有する)が同定される。このような差分は、
細胞型に関して、または推定薬剤の存在 対 非存在に関して決定される。この
ような差分dをd番目とし、値Isd=Isr(x)が次いで集合される。有意な差
分を同定するためのいくつかの方法がいずれも使用され得、それらのいくつかは
本明細書中に概説される。例えば、重要な方法は、以下の計算ステップを包含す
る: 1.平均Ir(x)=ΣsIsr(x)が評価される。
【0031】 2.全ての位置、すなわち、長さ(ここで、少なくとも1つのサンプルにつ
いて、Isr(x)−Ir(x)はある閾値よりも長い)がマークされる。
いて、Isr(x)−Ir(x)はある閾値よりも長い)がマークされる。
【0032】 3.Isr(x)−Ir(x)の最大値(サンプルの状態と制限酵素対rにつ
いての平均との間の差分として決定される)が見出され、そして長さx(差分を
示す)がマークされる。
いての平均との間の差分として決定される)が見出され、そして長さx(差分を
示す)がマークされる。
【0033】 4.ステップ3は、強度の差分の逐次的に減少する値に対して繰り返される
。このとき最も大きな差分をマークする長さxが、以前に同定された差分の長さ
から距離w内にあり、このときの差分はスキップされ、そして次に小さい差分が
考慮される。
。このとき最も大きな差分をマークする長さxが、以前に同定された差分の長さ
から距離w内にあり、このときの差分はスキップされ、そして次に小さい差分が
考慮される。
【0034】 5.ステップ4は、もはや考慮される差分が存在しなくなるまで繰り返され
る。
る。
【0035】 別の方法は、統計的基準と一致する差分を見出すステップを包含する。このよ
うな方法の特定の例は、以下の計算ステップを包含する: 1.1セットのサンプルの種類を規定し、そして各サンプルを特例の種類c
に対して割当てるステップ; 2.各制限酵素対rおよび長さxについて、測定値Isr(x)および細胞が
割当てられた種類cのセットについてのF統計を評価し、これによって、サンプ
ル種類間の任意の差分がランダム変数によって説明され得る、確率pr(x)を
提供するステップ(例えば、P.Hinton,Statistics Exp
lained,Routledge、1995を参照); 3.確率pr(x)を最も小さいのも(最も有意)から最も大きいもの(最
も有意でない)まで序列するステップ; 4.必要に応じて、pr(x)の同一閾値でのリスト仕切り、その閾値より
も大きな差分はもはや有意とはみなされない(許容値はPr(x=0.01〜0
.05である)ステップ; 5.pr(x)の最小値を見出し、そしてその長さxを制限酵素対rに対す
る差分としてマークする、ステップ; 6.ステップ4を繰り返し、そして、そのときの差分をマークする長さxが
、以前差分の距離w内にある領域に存在するか否かを決定し、この場合、このと
きの差分がスキップされ、そして次に小さい差分が考慮される、ステップ;なら
びに、 7.もはや考慮される差分が存在しなくなるまで続けるステップ。
うな方法の特定の例は、以下の計算ステップを包含する: 1.1セットのサンプルの種類を規定し、そして各サンプルを特例の種類c
に対して割当てるステップ; 2.各制限酵素対rおよび長さxについて、測定値Isr(x)および細胞が
割当てられた種類cのセットについてのF統計を評価し、これによって、サンプ
ル種類間の任意の差分がランダム変数によって説明され得る、確率pr(x)を
提供するステップ(例えば、P.Hinton,Statistics Exp
lained,Routledge、1995を参照); 3.確率pr(x)を最も小さいのも(最も有意)から最も大きいもの(最
も有意でない)まで序列するステップ; 4.必要に応じて、pr(x)の同一閾値でのリスト仕切り、その閾値より
も大きな差分はもはや有意とはみなされない(許容値はPr(x=0.01〜0
.05である)ステップ; 5.pr(x)の最小値を見出し、そしてその長さxを制限酵素対rに対す
る差分としてマークする、ステップ; 6.ステップ4を繰り返し、そして、そのときの差分をマークする長さxが
、以前差分の距離w内にある領域に存在するか否かを決定し、この場合、このと
きの差分がスキップされ、そして次に小さい差分が考慮される、ステップ;なら
びに、 7.もはや考慮される差分が存在しなくなるまで続けるステップ。
【0036】 これらの例示的な計算手順は、差分dにおけるサンプル中の細胞の種類に対す
る、強度Isdの尺度のセットを提供する。
る、強度Isdの尺度のセットを提供する。
【0037】 (距離) 階層型クラスター化について、距離Dss'は、ベクトル空間におけるサンプル
sとサンプルs’との対の間の距離として規定され得る。Dss'を計算するため
の種々の方法が利用できる。制限されないことが意図される、いくつかの例を以
下に提供する。
sとサンプルs’との対の間の距離として規定され得る。Dss'を計算するため
の種々の方法が利用できる。制限されないことが意図される、いくつかの例を以
下に提供する。
【0038】 スケールド(scaled)相関関係としてのDss': 1.μd=(1/ns)ΣsIsdおよびσd=[(1/ns)Σs(Isd−μd)2 ]0.5を計算する。データがない場合(例えば、あるサンプルsについてのIsd
の測定値が存在しない)、このサンプルは和から排除され、そしてnsは、1減
少される。。
の測定値が存在しない)、このサンプルは和から排除され、そしてnsは、1減
少される。。
【0039】 2.Jsd=(Isd−μd)/σdを計算する。Isdに関するデータがない場合
、JsdはJsd=0と規定される。
、JsdはJsd=0と規定される。
【0040】 3.μs=(1/nd)ΣdJsdおよびσs=[(1/n)Σd(Jsd−μs)2
]0.5を計算する。
]0.5を計算する。
【0041】 4.Ksd=(Jsd−μs)/σsを計算する。
【0042】 5.共分散行列Sss=(1/nd)ΣdKddKs'dを計算する。
【0043】 6.相関行列Css'=Sss'/[SssSss']0.5を計算する。
【0044】 7.Dss'=[2−2Css’]0.5を計算する。
【0045】 ユークリッド距離としてのDss':Dss'=[Σs(Isd−Is'd)2]0.5。
【0046】 ピヤソン距離としてのDss':Dss'=[Σd(Isd−Is'd)2−σd 2]0.5、
ここで、σdは、上記スケールド相関関係のステップ1に規定される。
ここで、σdは、上記スケールド相関関係のステップ1に規定される。
【0047】 対(pairwise)ピヤソン距離Dss': 1.共分散行列Sss'=(1/nd)[ΣdIsdIs'd−(ΣdIsd)(ΣdIs' d )/nd]を計算する。
【0048】 2.相関行列Css'=Sss'/[SssSss']0.5を計算する。
【0049】 3.Dss'=[2−2Css']0.5を計算する。
【0050】 マハラノビシュ距離Dss': 1.共分散行列Sdd'=(ΣdIsdIsd')−(ΣdIsd)(ΣdIs'd)/ns
を計算する。
を計算する。
【0051】 2.相関行列Cdd'=Sdd'/[SddSd'd']0.5およびその逆行列C-1 dd'を
計算する。
計算する。
【0052】 3.Dss'=[Σdd'(Isd−Is'd)C-1 dd'(Isd'−Is'd'))]0.5を計
算する。
算する。
【0053】 当該分野で公知の他の距離方法(例えば、スピアマン相関など)が本発明に使
用される得ることが意図される。当該分野で公知の他の方法が例えば、以下に見
出され得るが、これに制限する意図はない:K.V.Mardia、J.T.K
ent、およびJ.M.Biddy、MULTIVARIATE ANALYS
IS,Academic Press,New York,1979。
用される得ることが意図される。当該分野で公知の他の方法が例えば、以下に見
出され得るが、これに制限する意図はない:K.V.Mardia、J.T.K
ent、およびJ.M.Biddy、MULTIVARIATE ANALYS
IS,Academic Press,New York,1979。
【0054】 (階層型クラスター化) 距離は、サンプルの階層型クラスター化を実施するために使用され得る。クラ
スター化のための一般的なアルゴリズムを以下に記載する。
スター化のための一般的なアルゴリズムを以下に記載する。
【0055】 1.各サンプルsがそれ自体の初期クラスターcに割当てられる。
【0056】 2.クラスター対間の全ての距離を計算し、そして最小の距離を見出す。こ
れら2つのクラスターを1つのクラスターに合せ、そしてそのクラスターの数を
1減少させる。
れら2つのクラスターを1つのクラスターに合せ、そしてそのクラスターの数を
1減少させる。
【0057】 3.ステップ2を1つのクラスターのみが存在するまで繰り返す。
【0058】 このアルゴリズムを実行するために、クラスター対の間の距離を計算する方法
もまた必要である。周知の方法を使用する、このような計算のいくつかの制限さ
れない例が以下に示される。
もまた必要である。周知の方法を使用する、このような計算のいくつかの制限さ
れない例が以下に示される。
【0059】 最も近い近傍、単一リンケージ:クラスターcとc’との間の距離が最小距離
Dss'(ここで、sは、クラスターcにおけるサンプル全般にわたる範囲であり
、そしてs’は、クラスターc’における全サンプルにわたる範囲である)であ
る。
Dss'(ここで、sは、クラスターcにおけるサンプル全般にわたる範囲であり
、そしてs’は、クラスターc’における全サンプルにわたる範囲である)であ
る。
【0060】 平均リンケージとしても公知である、相加平均を使用した重みつきされていな
い対群法(unweighted pair group method us
ing arithmetic averages)(UPGMA):クラスタ
ーcとクラスターc’との間の距離は、(Σss'Dss'/(ncnc'))(ここで
、sはクラスターcにおける全サンプルにわたる範囲であり、s’は、クラスタ
ーc’における全サンプルにおける範囲であり、ncはクラスターcにおける全
サンプル数であり、そしてnc'はクラスターc’における全サンプル数である)
である。
い対群法(unweighted pair group method us
ing arithmetic averages)(UPGMA):クラスタ
ーcとクラスターc’との間の距離は、(Σss'Dss'/(ncnc'))(ここで
、sはクラスターcにおける全サンプルにわたる範囲であり、s’は、クラスタ
ーc’における全サンプルにおける範囲であり、ncはクラスターcにおける全
サンプル数であり、そしてnc'はクラスターc’における全サンプル数である)
である。
【0061】 最も離れた近傍、完全リンケージ:クラスターcとc’との間の距離が最大距
離Dss'(ここで、sは、クラスターcにおける全サンプルにわたる範囲であり
、そしてs’はクラスターc’における全サンプルにわたる範囲である)である
。
離Dss'(ここで、sは、クラスターcにおける全サンプルにわたる範囲であり
、そしてs’はクラスターc’における全サンプルにわたる範囲である)である
。
【0062】 他の距離ベース階層型クラスター化法が周知である。例えば、Wen−Hsi
ung Li,MOLECULAR EVOLUTION,Sinauer A
ssoc,1997を参照のこと。
ung Li,MOLECULAR EVOLUTION,Sinauer A
ssoc,1997を参照のこと。
【0063】 クラスター化を実施し、そして結果を表示するためのソフトウェアパッケージ
が利用可能である。例えば、クラスター化についてはPhylip,Joe F
elsenstein、http://evolution.genetics .washington.edu 、および表示については、Treeview,
Rod Page,http://taxionomy.zoology.gl a.ac.uk/rod/treeview.htlm を参照のこと。クラスタ
ー化に使用されるPhylipにおけるユニットに関するソースコードならびに
ウィンドウズ(登録商標)95およびウィンドウズNT用Treeviewのダ ウンロードされた実行可能なファイル、ならびにTreeview用マニュアル は、本願の権利者から入手可能である。
が利用可能である。例えば、クラスター化についてはPhylip,Joe F
elsenstein、http://evolution.genetics .washington.edu 、および表示については、Treeview,
Rod Page,http://taxionomy.zoology.gl a.ac.uk/rod/treeview.htlm を参照のこと。クラスタ
ー化に使用されるPhylipにおけるユニットに関するソースコードならびに
ウィンドウズ(登録商標)95およびウィンドウズNT用Treeviewのダ ウンロードされた実行可能なファイル、ならびにTreeview用マニュアル は、本願の権利者から入手可能である。
【0064】 (二次元クラスター化) サンプルをクラスター化するのではなく、距離をクラスター化することもまた
可能である。上記等式におけるサンプルおよび差分の役割を単純に交換する。さ
らに、サンプルおよび差分の両方のクラスター化を実施し、次いで、測定値Isd を表示(ここで、サンプルおよび差分がともにクラスター順に表される)するこ
とが可能である。
可能である。上記等式におけるサンプルおよび差分の役割を単純に交換する。さ
らに、サンプルおよび差分の両方のクラスター化を実施し、次いで、測定値Isd を表示(ここで、サンプルおよび差分がともにクラスター順に表される)するこ
とが可能である。
【0065】 (主成分分析および主因子分析) 主成分分析は、標準的なテキストに記載されている。例えば、Mardia、
Kent,およびBibby。主成分分析を実施するために、「距離」の節にお
いて上記のように規定された相関行列Css'を用いて開始される。(あるいは、
共分散行列Sss'が使用され得る)。以下のように規定される、固有値および固
有ベクトルが計算される:Css'gs'i=aigsi、ここで、i番目の固有値はa i であり、そしてその固有ベクトルはgsiである。これらの固有値は、最も大き
な値から最も小さな値の順にされる:a1≧a2≧...≧as。サンプルの低次
元描写を得るために、多数の所望の次元kが選択される。次いで、k次元空間に
おいて、サンプルsは、点として表現される(gs1、gs2...、gsk)。k次
元空間において近接するサンプルは、同様の発現プロフィールを有し、そして関
連があるとみなされ得る。
Kent,およびBibby。主成分分析を実施するために、「距離」の節にお
いて上記のように規定された相関行列Css'を用いて開始される。(あるいは、
共分散行列Sss'が使用され得る)。以下のように規定される、固有値および固
有ベクトルが計算される:Css'gs'i=aigsi、ここで、i番目の固有値はa i であり、そしてその固有ベクトルはgsiである。これらの固有値は、最も大き
な値から最も小さな値の順にされる:a1≧a2≧...≧as。サンプルの低次
元描写を得るために、多数の所望の次元kが選択される。次いで、k次元空間に
おいて、サンプルsは、点として表現される(gs1、gs2...、gsk)。k次
元空間において近接するサンプルは、同様の発現プロフィールを有し、そして関
連があるとみなされ得る。
【0066】 主成分分析の開始点として相関行列Css'を使用する代わりに、以下のように
規定される多次元尺度構成からの内積行列を使用して主成分を計算することが可
能である: B=HCH (2) ここで、Cは相関行列であり、Hは、1−(1/n)によって与えられる対角要
素(diagonal element)および非対角要素−(1/n)を有す
る中心化行列(centering matrix)であり、ここで、nは関連
項目数(item)である。(例えば、Mardia、Kent、およびBib
by、Multivariate Analysis,ならびにArkin,S
henおよびRoss,Science277:1275(1997)を参照の
こと)。k番目の主成分は、次いで、単位長さに正規化され、そして固有値λk
を減少させることによって序列されたbのk番目の固有ベクトルである。そして
、k番目の主因子は、λk 1/2による固有ベクトルの尺度構成によって得らる。サ
ンプルsのk番目の主因子への射影は、列sに関する因子の要素である。これら
の成分または因子は、1(最も有益な因子に対応する)からn(最も有益でない
因子に対応する)へと序列される。これらの成分または因子のいくつか(すべて
ではない)を使用することによって、これらのサンプルは、低次元の幾何空間に
おいて表され得る。さらに、表示において保持される情報量は、使用される成分
の固有値に関連し得る(Mardia、Kent、およびBibbyを参照のこ
と)。
規定される多次元尺度構成からの内積行列を使用して主成分を計算することが可
能である: B=HCH (2) ここで、Cは相関行列であり、Hは、1−(1/n)によって与えられる対角要
素(diagonal element)および非対角要素−(1/n)を有す
る中心化行列(centering matrix)であり、ここで、nは関連
項目数(item)である。(例えば、Mardia、Kent、およびBib
by、Multivariate Analysis,ならびにArkin,S
henおよびRoss,Science277:1275(1997)を参照の
こと)。k番目の主成分は、次いで、単位長さに正規化され、そして固有値λk
を減少させることによって序列されたbのk番目の固有ベクトルである。そして
、k番目の主因子は、λk 1/2による固有ベクトルの尺度構成によって得らる。サ
ンプルsのk番目の主因子への射影は、列sに関する因子の要素である。これら
の成分または因子は、1(最も有益な因子に対応する)からn(最も有益でない
因子に対応する)へと序列される。これらの成分または因子のいくつか(すべて
ではない)を使用することによって、これらのサンプルは、低次元の幾何空間に
おいて表され得る。さらに、表示において保持される情報量は、使用される成分
の固有値に関連し得る(Mardia、Kent、およびBibbyを参照のこ
と)。
【0067】 主成分または主因子分析に適した、中心化された内積行列Bはまた、以下 のような任意の距離行列Dss'から得られ得る: B=HAH (3) ここで、 Ass'=−1/2(Dss')2 (4)。
【0068】 主因子分析を実施するために、因子iをhsi=ai 0.5gsiと規定し、ここで、
上記のように、aiは、i番めの固有ベクトルgsiの固有値である。直交回転行
列G(i=kおよび0であるか、さもなくば、det(G)=+1である場合、
ΣjGijGkjは、1である)が導入され、そして因子が回転され、サンプルに対
して回転された座標を得る。従って、サンプルの位置のk次元表現を得るために
、以下の操作が実施される。
上記のように、aiは、i番めの固有ベクトルgsiの固有値である。直交回転行
列G(i=kおよび0であるか、さもなくば、det(G)=+1である場合、
ΣjGijGkjは、1である)が導入され、そして因子が回転され、サンプルに対
して回転された座標を得る。従って、サンプルの位置のk次元表現を得るために
、以下の操作が実施される。
【0069】 1.相関行列Css'または共分散行列Sss'を計算する。ここで、sおよびs
’は個々のサンプルを示す。
’は個々のサンプルを示す。
【0070】 2.行列における固有値aiおよび固有ベクトルgsiを計算する。ここで、
a1≧a2≧...≧asである。
a1≧a2≧...≧asである。
【0071】 3.非回転因子ローディング(unrotated factor loa
ding)hsi=ai 0.5gsiが規定される。
ding)hsi=ai 0.5gsiが規定される。
【0072】 4.一番目の因子ローディングおよび直交回転行列Gが選択される。回転さ
れた空間におけるサンプルsのj番目の成分は、Σj、hsj、Gj'jである。
れた空間におけるサンプルsのj番目の成分は、Σj、hsj、Gj'jである。
【0073】 回転行列Gは、標準的な基準に従って最適化され得る。例えば、Mardia
、Kent、およびBibby、Varimax 回転における、9節6、上記
を参照のこと。回転された軸は、サンプルについて観測された測定値に影響を与
える因子を表す。
、Kent、およびBibby、Varimax 回転における、9節6、上記
を参照のこと。回転された軸は、サンプルについて観測された測定値に影響を与
える因子を表す。
【0074】 本発明の方法を実行する際に、これらの操作が、引き続いて、意図される表示
(すなわち、示されることが意図される関連性の性質)に従ういくつかの様式の
いずれかで組み合わされる。
(すなわち、示されることが意図される関連性の性質)に従ういくつかの様式の
いずれかで組み合わされる。
【0075】 また、主要因子からの情報が、使用されて、相関関数からの実験的ノイズをフ
ィルタリングすることを助ける。例えば、カットオフ主要因子j<nを選択し、
次いで、j次元主要因子空間におけるそれらの表現物に基づくサンプル間の距離
および相関を計算することが可能である。
ィルタリングすることを助ける。例えば、カットオフ主要因子j<nを選択し、
次いで、j次元主要因子空間におけるそれらの表現物に基づくサンプル間の距離
および相関を計算することが可能である。
【0076】 本発明において利用され得る計算手順の非制限的例として、適応され得る手順
の概略的概要が、図1に示される。実験結果は、測定値行列で配列された、実験
において得られたサンプル依存強度および選択依存強度を表現する。図1におい
て示される実行において、種々の規定されたヌクレオチドの長さを有する差分バ
ンドが、行列の列として配列され;これらは、サブ配列対のセットの異なるメン
バーを使用して選択される種々の実験において得られる。これらのサンプルは、
細胞、すなわち推定の薬学的薬剤のセットで処理した細胞、または類似のサンプ
ルセットの種類を表現し、そして行として配列される。
の概略的概要が、図1に示される。実験結果は、測定値行列で配列された、実験
において得られたサンプル依存強度および選択依存強度を表現する。図1におい
て示される実行において、種々の規定されたヌクレオチドの長さを有する差分バ
ンドが、行列の列として配列され;これらは、サブ配列対のセットの異なるメン
バーを使用して選択される種々の実験において得られる。これらのサンプルは、
細胞、すなわち推定の薬学的薬剤のセットで処理した細胞、または類似のサンプ
ルセットの種類を表現し、そして行として配列される。
【0077】 測定値行列に配列される値は、次いで、相関分析に供され、直接的サンプル相
関または差分の相関を提供する。測定値行列はまた、サンプル間のベクトル距離
を提供する計算に供され;このようなサンプル距離はまた、サンプル相関結果か
ら得られ得る。距離ベクトルは、さらに、連鎖解析に供され、サンプルの段階的
クラスタリングを提供し得る。さらに、この相関サンプルは、主要成分分析に供
され、状態または差異に寄与する主要因子を提供し得る。
関または差分の相関を提供する。測定値行列はまた、サンプル間のベクトル距離
を提供する計算に供され;このようなサンプル距離はまた、サンプル相関結果か
ら得られ得る。距離ベクトルは、さらに、連鎖解析に供され、サンプルの段階的
クラスタリングを提供し得る。さらに、この相関サンプルは、主要成分分析に供
され、状態または差異に寄与する主要因子を提供し得る。
【0078】 主要成分分析が実施され得る様式の非制限的な例が、本明細書中で記載される
方法を使用して、図2において示される。上述の相関行列または中心(cent
ered)内積行列が、適切な操作に供され、それらの固有値および固有ベクト
ルに基づいて、主要成分および主要因子を提供する。有利に、固有状態の数にお
いて利用される次元の数の減少は、フィルタリング効果を提供し、計算されるベ
クトル距離におけるノイズを減少させ得る。
方法を使用して、図2において示される。上述の相関行列または中心(cent
ered)内積行列が、適切な操作に供され、それらの固有値および固有ベクト
ルに基づいて、主要成分および主要因子を提供する。有利に、固有状態の数にお
いて利用される次元の数の減少は、フィルタリング効果を提供し、計算されるベ
クトル距離におけるノイズを減少させ得る。
【0079】 本発明において提供される表現は、生物学分野および医学分野における遺伝学
の種々の適用における用途を見出す。関連性および相関の程度は、状態を比較さ
れた場合に区別される、酵素反応、代謝経路、および生理学的効果の迅速な概要
を提供する。病理学的状態が、例えば哺乳動物において、そして特にヒトにおい
て、通常の状態と比較される場合、区別される経路の表示は、この病理学的状態
の処置のための治療アプローチおよび/または治療薬剤の開発において有益であ
る。推定の薬学的薬剤がこの薬剤を省略する状態と比較される場合、または1つ
のこのような薬剤が別のものと比較される場合、この薬剤(単数または複数)に
よって誘導されるかまたは引き起こされる代謝反応に関連する重要な情報が提供
され、このことがこのような薬剤の最適な選択を導く。この情報はまた、新規の
薬学的薬剤の開発への導きを提供し得る。研究されるゲノムが植物ゲノム(例え
ば、重要な穀物植物の遺伝子)である場合、類似の原理が適用される。
の種々の適用における用途を見出す。関連性および相関の程度は、状態を比較さ
れた場合に区別される、酵素反応、代謝経路、および生理学的効果の迅速な概要
を提供する。病理学的状態が、例えば哺乳動物において、そして特にヒトにおい
て、通常の状態と比較される場合、区別される経路の表示は、この病理学的状態
の処置のための治療アプローチおよび/または治療薬剤の開発において有益であ
る。推定の薬学的薬剤がこの薬剤を省略する状態と比較される場合、または1つ
のこのような薬剤が別のものと比較される場合、この薬剤(単数または複数)に
よって誘導されるかまたは引き起こされる代謝反応に関連する重要な情報が提供
され、このことがこのような薬剤の最適な選択を導く。この情報はまた、新規の
薬学的薬剤の開発への導きを提供し得る。研究されるゲノムが植物ゲノム(例え
ば、重要な穀物植物の遺伝子)である場合、類似の原理が適用される。
【0080】 (核酸アッセイ) 本発明は、少なくとも2つの種類の細胞間の関連性の程度の表現物を生じさせ
るための方法を提供する。この方法において、各種類における細胞は、所定の細
胞型の細胞、所定の組織由来の細胞、および所定の器官由来の細胞の中から選択
される。選択の細胞サンプルからの核酸の産生は、GeneCallingTM方
法論に記載される通りであり得る。米国特許第5,871,697号を参照のこ
と。この方法は、以下の工程を包含する:(a)複数対のヌクレオチドサブ配列
の対を規定する工程であって、各対は、第1サブ配列および第2サブ配列からな
る、工程;(b)各種類の細胞の核酸を単離し、そして一方の末端で第1サブ配
列および他方の末端で第2サブ配列を有し、かつ第1サブ配列および第2サブ配
列によって分離された長さを有する核酸フラグメントの存在についてアッセイし
、そして各フラグメントがどの程度存在するかを定量する工程;ならびに(c)
当該分野において公知であるソフトウエアアルゴリズムプログラムを使用して、
これらの種類の中のフラグメントの存在および量における類似性および差異を反
映する関連性の程度を決定する工程。
るための方法を提供する。この方法において、各種類における細胞は、所定の細
胞型の細胞、所定の組織由来の細胞、および所定の器官由来の細胞の中から選択
される。選択の細胞サンプルからの核酸の産生は、GeneCallingTM方
法論に記載される通りであり得る。米国特許第5,871,697号を参照のこ
と。この方法は、以下の工程を包含する:(a)複数対のヌクレオチドサブ配列
の対を規定する工程であって、各対は、第1サブ配列および第2サブ配列からな
る、工程;(b)各種類の細胞の核酸を単離し、そして一方の末端で第1サブ配
列および他方の末端で第2サブ配列を有し、かつ第1サブ配列および第2サブ配
列によって分離された長さを有する核酸フラグメントの存在についてアッセイし
、そして各フラグメントがどの程度存在するかを定量する工程;ならびに(c)
当該分野において公知であるソフトウエアアルゴリズムプログラムを使用して、
これらの種類の中のフラグメントの存在および量における類似性および差異を反
映する関連性の程度を決定する工程。
【0081】 この方法の1つの重要な実施態様、すなわち、上記の工程(b)に記載される
ように、フラグメントの存在を決定し、そして存在する量を定量する工程は、以
下のような工程を包含するプロセスによって実施される。第1に、各種類の細胞
由来の核酸のサンプルを、複数の特定の対の制限エンドヌクレアーゼ(「RE」
)を用いて消化する。各サンプルを、1つのRE対で処理し、ここで、この対の
1つのREは、上記の工程(a)に記載される第1サブ配列を標的化し、そして
この対の第2PEは第2サブ配列を標的化し、各消化は、特定の制限フラグメン
トを提供する。
ように、フラグメントの存在を決定し、そして存在する量を定量する工程は、以
下のような工程を包含するプロセスによって実施される。第1に、各種類の細胞
由来の核酸のサンプルを、複数の特定の対の制限エンドヌクレアーゼ(「RE」
)を用いて消化する。各サンプルを、1つのRE対で処理し、ここで、この対の
1つのREは、上記の工程(a)に記載される第1サブ配列を標的化し、そして
この対の第2PEは第2サブ配列を標的化し、各消化は、特定の制限フラグメン
トを提供する。
【0082】 第2に、二本鎖アダプターDNA分子が、これらのフラグメントへハイブリダ
イズされる。各アダプターDNA分子は、以下を含む:(i)より短い鎖であっ
て、好ましくは5’末端リン酸を有さず、第1部分および第2部分から構成され
、この第1部分は、5’末端で、所定の対のREの1つによって生じた突出に相
補的である領域であり、そして第2部分は、このアダプターの反対のより長い鎖
にハイブリダイズ可能である、より短い鎖;ならびに(ii)より長い鎖であっ
て、好ましくは5’末端リン酸を有さず、その3’末端で、上述のより短い鎖の
第2部分へ相補的な第1部分、およびその第5’末端で、元のサンプル集団に存
在する任意の配列へハイブリダイズ可能でない独特な領域を含む任意の第2部分
からなる、より長い鎖。米国特許第5,871,697号を参照のこと。このよ
り長い鎖は、必要に応じて、蛍光色素208で標識されるが、複数の標識が同時
に識別されることが好ましくは可能となる任意のDNA標識系が、本発明におい
て使用可能である。例えば、Ausubelら、CURRENT PROTOC
OLS IN MOLECULAR BIOLOGY,John Wiley&
Sons,New York,NY,1993を参照のこと。
イズされる。各アダプターDNA分子は、以下を含む:(i)より短い鎖であっ
て、好ましくは5’末端リン酸を有さず、第1部分および第2部分から構成され
、この第1部分は、5’末端で、所定の対のREの1つによって生じた突出に相
補的である領域であり、そして第2部分は、このアダプターの反対のより長い鎖
にハイブリダイズ可能である、より短い鎖;ならびに(ii)より長い鎖であっ
て、好ましくは5’末端リン酸を有さず、その3’末端で、上述のより短い鎖の
第2部分へ相補的な第1部分、およびその第5’末端で、元のサンプル集団に存
在する任意の配列へハイブリダイズ可能でない独特な領域を含む任意の第2部分
からなる、より長い鎖。米国特許第5,871,697号を参照のこと。このよ
り長い鎖は、必要に応じて、蛍光色素208で標識されるが、複数の標識が同時
に識別されることが好ましくは可能となる任意のDNA標識系が、本発明におい
て使用可能である。例えば、Ausubelら、CURRENT PROTOC
OLS IN MOLECULAR BIOLOGY,John Wiley&
Sons,New York,NY,1993を参照のこと。
【0083】 第3に、各連結されたフラグメントからの出力シグナルが、このように処理さ
れた各サンプル集団について検出される。各連結されたフラグメントは、出力シ
グナルを生じ、これらは、(a)特定の作業(run)において使用されるRE
対に対応する所定のサブ配列の存在;(b)所定の作業において利用される2つ
のREに対応する2つのサブ配列間の長さ;ならびに(c)所定の作業において
このように生じた、各フラグメントの相対存在量の量を特徴付ける。
れた各サンプル集団について検出される。各連結されたフラグメントは、出力シ
グナルを生じ、これらは、(a)特定の作業(run)において使用されるRE
対に対応する所定のサブ配列の存在;(b)所定の作業において利用される2つ
のREに対応する2つのサブ配列間の長さ;ならびに(c)所定の作業において
このように生じた、各フラグメントの相対存在量の量を特徴付ける。
【0084】 必要に応じて、ヌクレオチド配列データベースは、各種類の細胞由来の核酸か
ら生じる1以上の出力シグナル(上述のパラメータで与えられる)を生じる、あ
るいは生じないと予想される配列について検索され得る。この分析方法は、以下
の工程を包含する:第1に、分析されるDNAサンプルの代表的なDNA配列の
データベースを選択する工程;第2に、このデータベース、およびこの実験にお
いて産生されたDNAフラグメントによって生じるシュミレーションされたシグ
ナルのデータベース中に含まれる、生成されるシュミレーションされたシグナル
パターンを誘導するための実験の記載を使用する工程;そして第3に、任意の特
定の検出されたシグナルについて、元のサンプルの配列がこのシグナルを生じさ
せると予想される模倣シグナルのパターンまたはデータベースを使用する工程。
さらに分析方法は、ユーザーインターフェースを使用し、そしてシグナルが複数
の配列から生じ得る場合にこのシグナルを実際に生じさせている配列の決定を可
能にするための容易さを提供し、そして、複数のサンプルにおける目的のシグナ
ルを迅速に決定するために統計学的相関を実施する。検索されたデータベースか
らの配列は、その配列が以下の(a)および(b)の両方を有する場合に、1以
上の出力シグナルを生じさせると予想される:(a)この1以上の出力シグナル
によって示されるような標的ヌクレオチドサブ配列の発生間の同一の長さ、およ
び(b)上記1以上の出力シグナルによって表現される同一の標的ヌクレオチド
サブ配列、またはこの1以上の出力シグナルによって表現される同一のセットの
標的ヌクレオチドサブ配列のメンバーである標的ヌクレオチドサブ配列。
ら生じる1以上の出力シグナル(上述のパラメータで与えられる)を生じる、あ
るいは生じないと予想される配列について検索され得る。この分析方法は、以下
の工程を包含する:第1に、分析されるDNAサンプルの代表的なDNA配列の
データベースを選択する工程;第2に、このデータベース、およびこの実験にお
いて産生されたDNAフラグメントによって生じるシュミレーションされたシグ
ナルのデータベース中に含まれる、生成されるシュミレーションされたシグナル
パターンを誘導するための実験の記載を使用する工程;そして第3に、任意の特
定の検出されたシグナルについて、元のサンプルの配列がこのシグナルを生じさ
せると予想される模倣シグナルのパターンまたはデータベースを使用する工程。
さらに分析方法は、ユーザーインターフェースを使用し、そしてシグナルが複数
の配列から生じ得る場合にこのシグナルを実際に生じさせている配列の決定を可
能にするための容易さを提供し、そして、複数のサンプルにおける目的のシグナ
ルを迅速に決定するために統計学的相関を実施する。検索されたデータベースか
らの配列は、その配列が以下の(a)および(b)の両方を有する場合に、1以
上の出力シグナルを生じさせると予想される:(a)この1以上の出力シグナル
によって示されるような標的ヌクレオチドサブ配列の発生間の同一の長さ、およ
び(b)上記1以上の出力シグナルによって表現される同一の標的ヌクレオチド
サブ配列、またはこの1以上の出力シグナルによって表現される同一のセットの
標的ヌクレオチドサブ配列のメンバーである標的ヌクレオチドサブ配列。
【0085】 第1分析方法は、分析されるサンプルの代表であるDNA配列のデータベース
を選択する工程である。本発明の好ましい使用において、分析されるDNA配列
は、組織サンプル、典型的には診断または研究目的のために検査されるヒトサン
プルに由来する。この使用において、データベース選択は、全ての観察されるD
NA配列を包括的に記録する1以上の公的に利用可能なデータベースから開始す
る。このようなデータベースは、National Center for B
iotechnology Information(Bethesda,Md
.)からのGenBank、European Bioinformatics
Institute(Hinxton Hall,UK)のEMBL Dat
a Libirary、およびNational Center for Ge
nome Research(Santa Fe,N.Mex.)からのデータ
ベースである。しかし、任意の由来の複数のDNA配列の任意のサンプルが、本
発明の方法によって分析され得るので、分析されるこのようなサンプルに存在す
るであろう配列についての項目を含む任意のデータベースが、このコンピュータ
方法のさらなる工程において使用可能である。
を選択する工程である。本発明の好ましい使用において、分析されるDNA配列
は、組織サンプル、典型的には診断または研究目的のために検査されるヒトサン
プルに由来する。この使用において、データベース選択は、全ての観察されるD
NA配列を包括的に記録する1以上の公的に利用可能なデータベースから開始す
る。このようなデータベースは、National Center for B
iotechnology Information(Bethesda,Md
.)からのGenBank、European Bioinformatics
Institute(Hinxton Hall,UK)のEMBL Dat
a Libirary、およびNational Center for Ge
nome Research(Santa Fe,N.Mex.)からのデータ
ベースである。しかし、任意の由来の複数のDNA配列の任意のサンプルが、本
発明の方法によって分析され得るので、分析されるこのようなサンプルに存在す
るであろう配列についての項目を含む任意のデータベースが、このコンピュータ
方法のさらなる工程において使用可能である。
【0086】 第2分析方法は、サンプル中に存在するであろう配列の以前に選択されたデー
タベース、ならびにこの実験において産生されたDNAフラグメントによって生
じるシグナルのパターンを誘導するための意図される実験の記載を使用する。こ
のパターンは、任意の簡便な様式で、コンピュータ実行に保存され得る。以下に
おいて、制限はされずに、それが情報のテーブルとして保存される場合に記載さ
れる。このテーブルは、個々の記録として、または任意の従来利用可能な関連の
データベースのようなデータベースシステムを使用することによって保存され得
る。あるいは、このパターンは、パターンを表現するメモリ内(in−memo
ry)構造の画像として単に保存され得る。
タベース、ならびにこの実験において産生されたDNAフラグメントによって生
じるシグナルのパターンを誘導するための意図される実験の記載を使用する。こ
のパターンは、任意の簡便な様式で、コンピュータ実行に保存され得る。以下に
おいて、制限はされずに、それが情報のテーブルとして保存される場合に記載さ
れる。このテーブルは、個々の記録として、または任意の従来利用可能な関連の
データベースのようなデータベースシステムを使用することによって保存され得
る。あるいは、このパターンは、パターンを表現するメモリ内(in−memo
ry)構造の画像として単に保存され得る。
【0087】 この方法の第2の重要な実施態様(すなわち、上記工程(b)に記載されるよ
うな、フラグメントの存在およびそれらの量を決定すること)は、以下のような
工程を包含するプロセスによって実施される。第1に、選択されるヌクレオチド
サブ配列の各対について、オリゴヌクレオチドプライマーの対が提供され、この
対は、第1プライマーおよび第2プライマーからなり、ここで、第1プライマー
は、第1サブ配列に相補的であり、そして第2プライマーは第2サブ配列に相補
的である。第2に、第1サブ配列と第2サブ配列との間のヌクレオチド配列は、
この増幅をプライムするこのオリゴヌクレオチドプライマーを使用して増幅され
、それによって、このサブ配列対、各対において利用される上記2つのプライマ
ーに対応する2つのサブ配列間の長さ、および各アンプリコンが存在する程度の
量によって特徴付けられるアンプリコンを提供する。第3に、出力シグナルが、
各アンプリコンについて上記のように生成され、各出力シグナルは、(a)プラ
イマーの対のサブ配列、(b)長さ、および(c)量を特徴付ける。必要に応じ
て、ヌクレオチド配列データベースは、各種類の細胞からの核酸によって生じら
れる、1以上の出力シグナル(上述のパラメータによって与えら得る)を生じる
か、あるいは生じないと予想される配列について検索され得る。分析方法は上記
の通りである。
うな、フラグメントの存在およびそれらの量を決定すること)は、以下のような
工程を包含するプロセスによって実施される。第1に、選択されるヌクレオチド
サブ配列の各対について、オリゴヌクレオチドプライマーの対が提供され、この
対は、第1プライマーおよび第2プライマーからなり、ここで、第1プライマー
は、第1サブ配列に相補的であり、そして第2プライマーは第2サブ配列に相補
的である。第2に、第1サブ配列と第2サブ配列との間のヌクレオチド配列は、
この増幅をプライムするこのオリゴヌクレオチドプライマーを使用して増幅され
、それによって、このサブ配列対、各対において利用される上記2つのプライマ
ーに対応する2つのサブ配列間の長さ、および各アンプリコンが存在する程度の
量によって特徴付けられるアンプリコンを提供する。第3に、出力シグナルが、
各アンプリコンについて上記のように生成され、各出力シグナルは、(a)プラ
イマーの対のサブ配列、(b)長さ、および(c)量を特徴付ける。必要に応じ
て、ヌクレオチド配列データベースは、各種類の細胞からの核酸によって生じら
れる、1以上の出力シグナル(上述のパラメータによって与えら得る)を生じる
か、あるいは生じないと予想される配列について検索され得る。分析方法は上記
の通りである。
【0088】 本発明は、例えば、制限ではなく、インビトロ細胞集団または細胞株に、疾患
または他のプロセスのインビボ動物モデルに、ヒトサンプルに、実際の野生型出
現からおそらく引き出された精製された細胞集団に、そして混合された細胞集団
を含む組織サンプルに適用され得る。この細胞または組織供給源は、有利に、植
物、単細胞動物、多細胞動物、細菌、ウイルス、真菌、または酵母などであり得
る。この動物は、有利に、特定のゲノムまたは疾患状態または傾向を有するよう
に遺伝子操作されるかまたは育てられるマウスのような、研究において使用され
る実験室動物であり得る。
または他のプロセスのインビボ動物モデルに、ヒトサンプルに、実際の野生型出
現からおそらく引き出された精製された細胞集団に、そして混合された細胞集団
を含む組織サンプルに適用され得る。この細胞または組織供給源は、有利に、植
物、単細胞動物、多細胞動物、細菌、ウイルス、真菌、または酵母などであり得
る。この動物は、有利に、特定のゲノムまたは疾患状態または傾向を有するよう
に遺伝子操作されるかまたは育てられるマウスのような、研究において使用され
る実験室動物であり得る。
【0089】 本発明において使用される細胞は、疾患状態を有するか有すると疑われる、哺
乳動物、好ましくはヒトから得られ得る。1実施態様において、疾患状態は、悪
性疾患である。インビトロ細胞集団または細胞株は、種々の外来因子に暴露され
、このような因子の遺伝子発現における効果を決定し得る。好ましい実施態様に
おいて、外来因子は、推定の薬学的薬剤である。推定の薬学的薬剤とそのように
接触される細胞を、これらをアッセイする前に、これらの細胞の状態における変
化に影響を与えるに十分な薬剤の量で、または用量濃度の予め設定した上限以下
の薬剤の量で処理する。関連性の測定値および相関の程度は、推定の薬学的薬剤
とのそのように接触される細胞と、例えばそのように接触されない細胞との間で
実施され得る。
乳動物、好ましくはヒトから得られ得る。1実施態様において、疾患状態は、悪
性疾患である。インビトロ細胞集団または細胞株は、種々の外来因子に暴露され
、このような因子の遺伝子発現における効果を決定し得る。好ましい実施態様に
おいて、外来因子は、推定の薬学的薬剤である。推定の薬学的薬剤とそのように
接触される細胞を、これらをアッセイする前に、これらの細胞の状態における変
化に影響を与えるに十分な薬剤の量で、または用量濃度の予め設定した上限以下
の薬剤の量で処理する。関連性の測定値および相関の程度は、推定の薬学的薬剤
とのそのように接触される細胞と、例えばそのように接触されない細胞との間で
実施され得る。
【0090】 (関連性方法論の程度) 本発明は、第1の種類の細胞と、第2の種類の細胞との間の関連性の程度の表
現物を提供する。各種類中の細胞は、上記のように、所定の細胞型の細胞、所定
の組織からの細胞、および所定の器官からの細胞の中から選択される。関連性の
程度は、ヌクレオチドサブ配列の対であって、各対が、第1のサブ配列および第
2のサブ配列からなる複数の対の存在下で、この対の第1のサブ配列および第2
のサブ配列を分離するヌクレオチド長さ、および所定の長さを有する各対が細胞
の種類内にある程度の定量化に関して、類似性または差分を反映する。分析され
るべきフラグメントの入力情報は、上記のNUCLEIC ACID ASSA
YSのセクションに記載のような核酸分析および定量化の方法により得られる。
現物を提供する。各種類中の細胞は、上記のように、所定の細胞型の細胞、所定
の組織からの細胞、および所定の器官からの細胞の中から選択される。関連性の
程度は、ヌクレオチドサブ配列の対であって、各対が、第1のサブ配列および第
2のサブ配列からなる複数の対の存在下で、この対の第1のサブ配列および第2
のサブ配列を分離するヌクレオチド長さ、および所定の長さを有する各対が細胞
の種類内にある程度の定量化に関して、類似性または差分を反映する。分析され
るべきフラグメントの入力情報は、上記のNUCLEIC ACID ASSA
YSのセクションに記載のような核酸分析および定量化の方法により得られる。
【0091】 関連性の測定値は、差分ベクトルの振幅を反映する距離を算出することにより
提供される。差分ベクトルは、第1のベクトルと第2のベクトルとの間の差異と
して規定される。ここで、第1のベクトルは、第1の種類の細胞について得られ
た各サブ配列対に対する定量化に由来する情報を反映し、そしてそれに対応して
、第2のベクトルは、第2の種類に由来する類似の情報を反映する。各ベクトル
の異なる要素は、異なるサブ配列対を用いて得たデータに関連する。
提供される。差分ベクトルは、第1のベクトルと第2のベクトルとの間の差異と
して規定される。ここで、第1のベクトルは、第1の種類の細胞について得られ
た各サブ配列対に対する定量化に由来する情報を反映し、そしてそれに対応して
、第2のベクトルは、第2の種類に由来する類似の情報を反映する。各ベクトル
の異なる要素は、異なるサブ配列対を用いて得たデータに関連する。
【0092】 表現物の実施態様では、関連性の程度は距離に関連する。この距離は、第1の
種類について得られた各サブ配列対に対する定量化に由来する情報を反映する第
1のベクトルと、第2の種類について得られた対応する情報を反映する第2のベ
クトルとの差異である、差分ベクトルの振幅を反映する。各ベクトルの差分要素
は、異なるサブ配列対を用いて得たデータに関連する。
種類について得られた各サブ配列対に対する定量化に由来する情報を反映する第
1のベクトルと、第2の種類について得られた対応する情報を反映する第2のベ
クトルとの差異である、差分ベクトルの振幅を反映する。各ベクトルの差分要素
は、異なるサブ配列対を用いて得たデータに関連する。
【0093】 さらに顕著な実施態様では、表現物は、関連性の程度を反映するツリー構造を
含み、任意の2つの種類の間の関連性を反映するツリー構造を生成することによ
り提供される。ツリー構造のブランチは、差分ベクトルを反映し、そしてノード
から枝分かれする。
含み、任意の2つの種類の間の関連性を反映するツリー構造を生成することによ
り提供される。ツリー構造のブランチは、差分ベクトルを反映し、そしてノード
から枝分かれする。
【0094】 関連性の程度の表現物の重要な実施態様では、表現物は、上記直前の段落に要
約された方法を含む本発明の方法を採用して得た。
約された方法を含む本発明の方法を採用して得た。
【0095】 関連性の表現物のさらに顕著な実施態様では、少なくとも1つの種類にある細
胞は、上記のセクションNUCLEIC ACIDS ANALYSISに記載
のように得られる。
胞は、上記のセクションNUCLEIC ACIDS ANALYSISに記載
のように得られる。
【0096】 (相関分析方法論) 本発明はまた、第1の種類の細胞と、第2の種類の細胞との間の相関の表現物
を生成する方法を提供する。この相関は、種類内の核酸の性質および量における
変動を反映する。この方法では、各種類における細胞は、所定の細胞型の細胞、
所定の組織からの細胞、および所定の器官からの細胞の中から選択される。核酸
分析および定量化の方法は、上記のNUCLEIC ACID ASSAYSに
記載の通りである。
を生成する方法を提供する。この相関は、種類内の核酸の性質および量における
変動を反映する。この方法では、各種類における細胞は、所定の細胞型の細胞、
所定の組織からの細胞、および所定の器官からの細胞の中から選択される。核酸
分析および定量化の方法は、上記のNUCLEIC ACID ASSAYSに
記載の通りである。
【0097】 シグナル出力の生成に際し、第1の種類の細胞と第2の種類の細胞との間で相
関し、そしてこの相関の表現物が調製される。本発明におけるフラグメントの定
量化は、所定の操作(run)で用いられるRE対に対応し、そして各フラグメ
ントの長さはそのように生成され;それによって、各種類の細胞中に存在する核
酸が、特定のサブ配列対および対間のヌクレオチド長さを有するフラグメントを
含む程度の定量化測定値を提供する。
関し、そしてこの相関の表現物が調製される。本発明におけるフラグメントの定
量化は、所定の操作(run)で用いられるRE対に対応し、そして各フラグメ
ントの長さはそのように生成され;それによって、各種類の細胞中に存在する核
酸が、特定のサブ配列対および対間のヌクレオチド長さを有するフラグメントを
含む程度の定量化測定値を提供する。
【0098】 この相関を有する表現物を生成するための方法の顕著な実施態様では、上記の
DISTANCESのセクションに記載のように、この相関は直交固有ベクトル
のセットに関連する。この固有ベクトルが構築される基底セットの要素は、2つ
の種類の細胞間で相関する特定の生化学的経路または生理学的経路を反映する。
これらの固有ベクトルの各々は、生化学的または生理学的差分に対応する経路の
寄与を反映するゼロより大きい整数である固有値と関連する。使用された固有値
の上限を規定した後、この上限より小さいかまたはこれに等しい固有値の各固有
ベクトルにおける基底セット要素の係数は、第1の種類の細胞と第2の種類の細
胞との間で相関した。
DISTANCESのセクションに記載のように、この相関は直交固有ベクトル
のセットに関連する。この固有ベクトルが構築される基底セットの要素は、2つ
の種類の細胞間で相関する特定の生化学的経路または生理学的経路を反映する。
これらの固有ベクトルの各々は、生化学的または生理学的差分に対応する経路の
寄与を反映するゼロより大きい整数である固有値と関連する。使用された固有値
の上限を規定した後、この上限より小さいかまたはこれに等しい固有値の各固有
ベクトルにおける基底セット要素の係数は、第1の種類の細胞と第2の種類の細
胞との間で相関した。
【0099】 この相関の表現物を生成するための方法の別の顕著な実施態様では、この表現
物は、クラスター図または系統樹であり、そして2つの種類の細胞間の差分に対
する生化学的応答または生理学的応答に関与する経路の関連性を反映するツリー
構造を含む。この表現物を得ることにおいて、距離が差分ベクトルの振幅を反映
する距離決定を提供する、相関行列が算出される。このベクトルは、種類間の差
分に対する2つの種類の1つの応答について得られた情報を各々が反映する、2
つのベクトル間の差分であり、そしてここでツリー構造のブランチが差分ベクト
ルを反映し、そしてこのブランチがノードから枝分かれする。
物は、クラスター図または系統樹であり、そして2つの種類の細胞間の差分に対
する生化学的応答または生理学的応答に関与する経路の関連性を反映するツリー
構造を含む。この表現物を得ることにおいて、距離が差分ベクトルの振幅を反映
する距離決定を提供する、相関行列が算出される。このベクトルは、種類間の差
分に対する2つの種類の1つの応答について得られた情報を各々が反映する、2
つのベクトル間の差分であり、そしてここでツリー構造のブランチが差分ベクト
ルを反映し、そしてこのブランチがノードから枝分かれする。
【0100】 相関の程度の表現物のさらなる顕著な実施態様では、少なくとも1つの種類内
の細胞は、上記のNUCLEIC ACIDS ANALYSISのセクション
に記載のように得た。
の細胞は、上記のNUCLEIC ACIDS ANALYSISのセクション
に記載のように得た。
【0101】 (表示手段) 本発明はまた、第1の種類の細胞と第2の種類の細胞との間の関連性の程度の
表現物を表示する表示手段を提供する。各種類内の細胞は、上記のように、所定
の細胞型、所定の組織からの細胞、および所定の器官からの細胞の中から選択さ
れる。関連性の程度は、ヌクレオチドサブ配列の対であって、各対が、第1のサ
ブ配列および第2のサブ配列からなる複数の対の存在下で、この対の第1のサブ
配列および第2のサブ配列を分離するヌクレオチド長さ、および所定の長さを有
する各対が細胞の種類内にある程度の定量化に関して、類似性または差分を反映
する。
表現物を表示する表示手段を提供する。各種類内の細胞は、上記のように、所定
の細胞型、所定の組織からの細胞、および所定の器官からの細胞の中から選択さ
れる。関連性の程度は、ヌクレオチドサブ配列の対であって、各対が、第1のサ
ブ配列および第2のサブ配列からなる複数の対の存在下で、この対の第1のサブ
配列および第2のサブ配列を分離するヌクレオチド長さ、および所定の長さを有
する各対が細胞の種類内にある程度の定量化に関して、類似性または差分を反映
する。
【0102】 この表示手段の顕著な実施態様では、関連性の程度は距離に関連する。この距
離は、第1の種類について得られた各サブ配列対に対する定量化に由来する情報
を反映する第1のベクトルと、第2の種類について得られた対応する情報を反映
する第2のベクトルとの間の差分である差分ベクトルの振幅を反映する。各ベク
トルの差分要素は、異なるサブ配列対を用いて得られたデータに関連する。
離は、第1の種類について得られた各サブ配列対に対する定量化に由来する情報
を反映する第1のベクトルと、第2の種類について得られた対応する情報を反映
する第2のベクトルとの間の差分である差分ベクトルの振幅を反映する。各ベク
トルの差分要素は、異なるサブ配列対を用いて得られたデータに関連する。
【0103】 表示手段のさらなる顕著な実施態様では、表現物は、任意の2つの種類の間の
関連性を反映するツリー構造を含み、ここで、ツリー構造のブランチは、差分ベ
クトルを反映し、そしてこのブランチはノードから枝分かれする。
関連性を反映するツリー構造を含み、ここで、ツリー構造のブランチは、差分ベ
クトルを反映し、そしてこのブランチはノードから枝分かれする。
【0104】 関連性の程度の表現物を表示する表示手段の表現物の重要な実施態様では、こ
の表現物は、上記直前の段落に要約された方法を含む本発明の方法を採用して得
られる。
の表現物は、上記直前の段落に要約された方法を含む本発明の方法を採用して得
られる。
【0105】 関連性の程度の表現物を表示する表示手段のさらなる顕著な実施態様では、少
なくとも1つの種類の細胞は、上記のセクションNUCLEIC ACIDS
ANALYSISに記載のように得た。
なくとも1つの種類の細胞は、上記のセクションNUCLEIC ACIDS
ANALYSISに記載のように得た。
【0106】 本発明は、第1の種類の細胞と第2の種類の細胞との間の相関の表現物を表示
する表示手段をさらに提供する。各種類内の細胞は、上記のように、所定の細胞
型、所定の組織からの細胞、および所定の器官からの細胞の中から選択される。
関連性の程度は、ヌクレオチドサブ配列の対であって、各対が、第1のサブ配列
および第2のサブ配列からなり、ヌクレオチド長さがこの対の第1のサブ配列お
よび第2のサブ配列を分離するヌクレオチド配列の存在下で、所定の長さを有す
る各対が細胞に存在する程度の定量化に関して、第1の種類と、第2の種類との
間の差分を反映する。
する表示手段をさらに提供する。各種類内の細胞は、上記のように、所定の細胞
型、所定の組織からの細胞、および所定の器官からの細胞の中から選択される。
関連性の程度は、ヌクレオチドサブ配列の対であって、各対が、第1のサブ配列
および第2のサブ配列からなり、ヌクレオチド長さがこの対の第1のサブ配列お
よび第2のサブ配列を分離するヌクレオチド配列の存在下で、所定の長さを有す
る各対が細胞に存在する程度の定量化に関して、第1の種類と、第2の種類との
間の差分を反映する。
【0107】 この表示手段の有益な実施態様では、相関は、直交固有ベクトルのセットに関
連する。この固有ベクトルが構築される基底セットの要素は、2つの種類の細胞
間で相関する特定の生化学的経路または生理学的経路を反映する。これらの固有
ベクトルの各々は、ゼロより大きい整数である固有値と関連する。用いられるべ
き固有値の上限を規定した後、この上限より小さいかまたはこれに等しい固有値
の各固有ベクトルにおける基底セット要素の係数は、第1の種類の細胞と第2の
種類の細胞との間で相関した生化学的または生理学的差分に対応する経路の寄与
を反映する。
連する。この固有ベクトルが構築される基底セットの要素は、2つの種類の細胞
間で相関する特定の生化学的経路または生理学的経路を反映する。これらの固有
ベクトルの各々は、ゼロより大きい整数である固有値と関連する。用いられるべ
き固有値の上限を規定した後、この上限より小さいかまたはこれに等しい固有値
の各固有ベクトルにおける基底セット要素の係数は、第1の種類の細胞と第2の
種類の細胞との間で相関した生化学的または生理学的差分に対応する経路の寄与
を反映する。
【0108】 この相関の表現物を表示する表示手段のさらなる有益な実施態様では、この表
現物は、クラスター図または系統樹であり、そして2つの種類の細胞間の差分に
対する生化学的応答または生理学的応答に関与する経路の関連性を反映するツリ
ー構造を含む。この表現物を得ることにおいて、距離が差分ベクトルの振幅を反
映する距離決定値を提供する、相関行列が算出される。このベクトルは、種類間
の差分に対する2つの種類の1つの応答について得られた情報を各々が反映する
、2つのベクトル間の差分である。このツリー構造のブランチが差分ベクトルを
反映し、そしてこのブランチがノードから枝分かれする。
現物は、クラスター図または系統樹であり、そして2つの種類の細胞間の差分に
対する生化学的応答または生理学的応答に関与する経路の関連性を反映するツリ
ー構造を含む。この表現物を得ることにおいて、距離が差分ベクトルの振幅を反
映する距離決定値を提供する、相関行列が算出される。このベクトルは、種類間
の差分に対する2つの種類の1つの応答について得られた情報を各々が反映する
、2つのベクトル間の差分である。このツリー構造のブランチが差分ベクトルを
反映し、そしてこのブランチがノードから枝分かれする。
【0109】 相関の表現物を表示する表示手段の重要な実施態様では、表現物は、上記直前
の段落で要約された方法を含む本発明の方法を採用して得られる。
の段落で要約された方法を含む本発明の方法を採用して得られる。
【0110】 相関の表現物の重要な実施態様では、表現物は、上記直前の段落で要約された
方法を含む本発明の方法を採用して得られる。
方法を含む本発明の方法を採用して得られる。
【0111】 相関の表現物を表示する表示手段のさらなる顕著な実施態様では、少なくとも
1つの種類の細胞は、上記のセクションNUCLEIC ACID ANALY
SISに記載のように得た。
1つの種類の細胞は、上記のセクションNUCLEIC ACID ANALY
SISに記載のように得た。
【0112】 (その他の局面) 細胞の表現物を提供することに加えて、本明細書に記載の技法はまた、核酸フ
ラグメントまたは遺伝子の表現物を提供するために有用である。この分析の出発
点は、先に記載された行列Isdであり、ここで、sはサンプル(またはサンプル
の群または別の型の細胞)を示し、そしてdはこの種類内の特定遺伝子の発現レ
ベルの特定の測定値を示す。Iの列を基底にする表現物を生成するよりもむしろ
、各々は異なるサンプルまたはサンプルの群を示し、Iの行を基底にする表現物
であって、各々が異なる核酸を示す表現物を生成することが可能である。一連の
細胞に亘る核酸の相対アバンダンスに基づく、核酸の階層的表現物および幾何的
表現物を用いて、同時発現され、そして関連する生物学的機能を有するらしい遺
伝子を推断し得る。
ラグメントまたは遺伝子の表現物を提供するために有用である。この分析の出発
点は、先に記載された行列Isdであり、ここで、sはサンプル(またはサンプル
の群または別の型の細胞)を示し、そしてdはこの種類内の特定遺伝子の発現レ
ベルの特定の測定値を示す。Iの列を基底にする表現物を生成するよりもむしろ
、各々は異なるサンプルまたはサンプルの群を示し、Iの行を基底にする表現物
であって、各々が異なる核酸を示す表現物を生成することが可能である。一連の
細胞に亘る核酸の相対アバンダンスに基づく、核酸の階層的表現物および幾何的
表現物を用いて、同時発現され、そして関連する生物学的機能を有するらしい遺
伝子を推断し得る。
【0113】 (その他の実施態様) 強度Iのデータ行列は、各列が特定の生物学的サンプルまたはサンプルの群に
対応し、そして各カラムが特定の核酸分子またはその量が生物学的状態の各々で
測定される分子の種類に対応する表現物としてより一般的に記載され得る。
対応し、そして各カラムが特定の核酸分子またはその量が生物学的状態の各々で
測定される分子の種類に対応する表現物としてより一般的に記載され得る。
【0114】 核酸量の測定値を提供するための記載された差分表示方法に加えて、細胞内に
存在する核酸の測定値を得るためのその他の方法が利用可能である。これらは、
制限フラグメント長多形性、増幅フラグメント長多形性、EST配列決定、遺伝
子発現の連続分析、オリゴヌクレオチドプローブに対するハイブリダイゼーショ
ン、および当該分野で公知の他の方法を含む。TaqManまたはNorthe
rnブロットによる定量化のような、その他の方法もまた用いられる。これらの
方法のすべては、本明細書で記載の方法に従って分析され得るデータセットを生
成する。各生物学的状態および核酸に対する測定値Isdは、絶対濃度、標準に対
する濃度(比または数の差分)、またはその他の便利な尺度に対応し得る。
存在する核酸の測定値を得るためのその他の方法が利用可能である。これらは、
制限フラグメント長多形性、増幅フラグメント長多形性、EST配列決定、遺伝
子発現の連続分析、オリゴヌクレオチドプローブに対するハイブリダイゼーショ
ン、および当該分野で公知の他の方法を含む。TaqManまたはNorthe
rnブロットによる定量化のような、その他の方法もまた用いられる。これらの
方法のすべては、本明細書で記載の方法に従って分析され得るデータセットを生
成する。各生物学的状態および核酸に対する測定値Isdは、絶対濃度、標準に対
する濃度(比または数の差分)、またはその他の便利な尺度に対応し得る。
【0115】 本発明の方法は、5、10、25、50、100、1000、10,000、
100,000またはそれ以上のメンバーの範囲の集団の分析を含む。
100,000またはそれ以上のメンバーの範囲の集団の分析を含む。
【0116】 (実施例) 10〜14週齢の雄性SD(Sprague−Dawley)ラット(Har
lan Sprague Dawley、Inc.、Indianapolis
、Indiana)を、胃管による強制栄養を行い、以下のレベルで滅菌水に溶
解した以下の薬物を用いて、3日間、1日1回投薬した: フェノバルビトール(phenobarbitol) 3.81mg/kg/
日 ガバペンチン 34.29mg/kg/日 ビガバトリン 150mg/kg/日 パラアルデヒド 77.08mg/kg/日 これらの用量は、ラットとヒトとの間の代謝速度の差分について調整されたE
D100(ヒトの有効用量の上限)に対応する。3匹のラットを、各薬物処理の
ために使用し、そして各薬物に対応するさらなる3匹のラットを、滅菌水で処理
して、コントロールとした。
lan Sprague Dawley、Inc.、Indianapolis
、Indiana)を、胃管による強制栄養を行い、以下のレベルで滅菌水に溶
解した以下の薬物を用いて、3日間、1日1回投薬した: フェノバルビトール(phenobarbitol) 3.81mg/kg/
日 ガバペンチン 34.29mg/kg/日 ビガバトリン 150mg/kg/日 パラアルデヒド 77.08mg/kg/日 これらの用量は、ラットとヒトとの間の代謝速度の差分について調整されたE
D100(ヒトの有効用量の上限)に対応する。3匹のラットを、各薬物処理の
ために使用し、そして各薬物に対応するさらなる3匹のラットを、滅菌水で処理
して、コントロールとした。
【0117】 ラットを最終用量の24時間後に屠殺し、そしてその脳を収集した。mRNA
の収集、cDNAの合成、および差分表示手順を、米国特許第5,871,69
7号およびShimketsら1999(Nature Biotechnol
ogy 17:798〜803)に記載される方法に従って、行った。
の収集、cDNAの合成、および差分表示手順を、米国特許第5,871,69
7号およびShimketsら1999(Nature Biotechnol
ogy 17:798〜803)に記載される方法に従って、行った。
【0118】 以下の工程を続け、差分表示パターンを分析した: 1.同一の薬物で処理した3匹の動物の各々について強度Isr(x)を、1つ
の平均Iar(x)に合わせた(下付き文字aは、薬物を示す)。標準偏差sar(
x)もまた、薬物で処理した各動物からの測定値について計算した。
の平均Iar(x)に合わせた(下付き文字aは、薬物を示す)。標準偏差sar(
x)もまた、薬物で処理した各動物からの測定値について計算した。
【0119】 2.各薬物についての平均Iar(x)および標準偏差sar(x)を、滅菌水コ
ントロール処理についての平均Icr(x)および標準偏差scr(x)と比較した
。長さxでの差分が、以下の場合に印をつけられた: ABS(ln[Iar(x)/Icr(x)]≧ln(1.5) (5) ならびに以下を用いる両側t検定について、有意性(significanc
e)が、0.15未満の場合 t=[Iar(x)−Icr(x)]/[{sar(x)2+scr(x)2}/2]1/ 2 (6) および無限大の自由度。次に、この手順に従って印をつけられる差分の強度を目
視によって検査し得、そして可視的に有意な差分が、保持され得る。
ントロール処理についての平均Icr(x)および標準偏差scr(x)と比較した
。長さxでの差分が、以下の場合に印をつけられた: ABS(ln[Iar(x)/Icr(x)]≧ln(1.5) (5) ならびに以下を用いる両側t検定について、有意性(significanc
e)が、0.15未満の場合 t=[Iar(x)−Icr(x)]/[{sar(x)2+scr(x)2}/2]1/ 2 (6) および無限大の自由度。次に、この手順に従って印をつけられる差分の強度を目
視によって検査し得、そして可視的に有意な差分が、保持され得る。
【0120】 3.制限酵素対rおよび位置xによって規定された各々の差分dについて、強
度Iar(x)=Iadを、各薬物処理について特定の処理がコントロールと比較し
て差分を有するか否か決定した。
度Iar(x)=Iadを、各薬物処理について特定の処理がコントロールと比較し
て差分を有するか否か決定した。
【0121】 この実施例において、最終的なデータ行列Iadは、8つの列を有する:4つの
薬物の各々についての1つの列、および水コントロールデータの4つの反復実験
の各々について1つの列。行列は、差分表示パターンにおいて検出された差分の
数と同数の列を有する。
薬物の各々についての1つの列、および水コントロールデータの4つの反復実験
の各々について1つの列。行列は、差分表示パターンにおいて検出された差分の
数と同数の列を有する。
【0122】 サンプルの8つの種(4つの薬物、4つの水コントロール)のピヤソン相関係
数Cabを、発明の詳細な説明に提供される方法を使用して決定した。特定の差分
についてのデータ要素が、特定の処理について欠けている場合、その差分は、相
関係数に寄与しなかった。この係数を、対角の要素として示される薬物との標準
偏差とともに、以下の表1に示す。
数Cabを、発明の詳細な説明に提供される方法を使用して決定した。特定の差分
についてのデータ要素が、特定の処理について欠けている場合、その差分は、相
関係数に寄与しなかった。この係数を、対角の要素として示される薬物との標準
偏差とともに、以下の表1に示す。
【0123】
【表1】 次に、対をなすピヤソン距離を、以前に記載されるように計算した。距離行列
を、以下の表2に示す。
を、以下の表2に示す。
【0124】
【表2】 次にこの距離を最隣接クラスター化アルゴリズムへの入力として使用した。滅
菌H2Oを外集団として使用して、生じるクラスターを図3に示した。図1Aに
おける水平距離は、クラスター間の対をなすピヤソン距離と比例した。
菌H2Oを外集団として使用して、生じるクラスターを図3に示した。図1Aに
おける水平距離は、クラスター間の対をなすピヤソン距離と比例した。
【0125】 相関行列Cabもまた、主因子(principle factor)分析のた
めの開始点として用いた。第1に、主な成分を、多次元尺度構成からの内積行列
を使用して計算した B=HCH (2) ここで、Cは、相関行列であり、そしてHは、中心化(centering)
行列である。次に、kth主成分は、単位長さに対して標準化されたBのkth固有
ベクトルであり、減少する固有値λkによって並べられ、そしてkth主因子を、
固有ベクトルをλk 1/2によって尺度構成することによって得られた。処置および
コントロールの、主因子に対する射影を、以下の表3に示す。
めの開始点として用いた。第1に、主な成分を、多次元尺度構成からの内積行列
を使用して計算した B=HCH (2) ここで、Cは、相関行列であり、そしてHは、中心化(centering)
行列である。次に、kth主成分は、単位長さに対して標準化されたBのkth固有
ベクトルであり、減少する固有値λkによって並べられ、そしてkth主因子を、
固有ベクトルをλk 1/2によって尺度構成することによって得られた。処置および
コントロールの、主因子に対する射影を、以下の表3に示す。
【0126】
【表3】 成分を、1(最も有益)から8(最も有益でない)までに、並べる。負の固有
値が、欠けているデータを説明するために使用した方法から生じる。欠けている
データが、代替的な様式において扱われた場合(例えば、欠けている要素が、平
均値に設定した場合、または分析を、データが欠けていない差分に限定した場合
)、固有値は全て、負ではない。
値が、欠けているデータを説明するために使用した方法から生じる。欠けている
データが、代替的な様式において扱われた場合(例えば、欠けている要素が、平
均値に設定した場合、または分析を、データが欠けていない差分に限定した場合
)、固有値は全て、負ではない。
【0127】 図4において、主因子に対する射影によって、処理を表示する。因子1は、薬
物(負の値を有する)とコントロール(正の値を有する)を区別する。因子2は
、薬物の処置の間を区別する。
物(負の値を有する)とコントロール(正の値を有する)を区別する。因子2は
、薬物の処置の間を区別する。
【0128】 (等価物) 上記の、本発明の特定の実施態様の詳細な説明から、細胞、細胞株、組織、器
官、または遺伝子発現のゲノム分析に基づいて発現された配列間の関連性の程度
を表現するための独特の方法が記載されたことが、明らかである。特定の実施態
様が本明細書において詳細に開示されたが、この開示は、説明目的の例示のみの
ためであり、上記の添付の特許請求の範囲について限定することを意図しない。
特に、種々の置換、変更、および改変が、特許請求の範囲によって規定される本
発明の趣旨および範囲から逸脱することなく、本発明に対してなされ得ることが
本発明者によって意図される。例えば、材料の供給源、その後の使用、または使
用されるソフトウェアアルゴリズムの選択は、本明細書において記載される実施
態様の知識を用いて、当業者にとって慣用的な事項であると考えられる。
官、または遺伝子発現のゲノム分析に基づいて発現された配列間の関連性の程度
を表現するための独特の方法が記載されたことが、明らかである。特定の実施態
様が本明細書において詳細に開示されたが、この開示は、説明目的の例示のみの
ためであり、上記の添付の特許請求の範囲について限定することを意図しない。
特に、種々の置換、変更、および改変が、特許請求の範囲によって規定される本
発明の趣旨および範囲から逸脱することなく、本発明に対してなされ得ることが
本発明者によって意図される。例えば、材料の供給源、その後の使用、または使
用されるソフトウェアアルゴリズムの選択は、本明細書において記載される実施
態様の知識を用いて、当業者にとって慣用的な事項であると考えられる。
【図1】 図1は、サンプルについて見出される1セットのサブ配列が選択したフラグメ
ントから開始する本発明の種々の表現物を発生する工程に包含される主工程を例
示する概略的なフロー図である。
ントから開始する本発明の種々の表現物を発生する工程に包含される主工程を例
示する概略的なフロー図である。
【図2】 図2は、主な成分分析を実施する工程に包含される主工程を例示する概略的な
フロー図である。
フロー図である。
【図3】 図3は、アウトグループとしての滅菌水による4つの薬物の階層的クラスター
化を例示する。
化を例示する。
【図4】 図4は、主因子に対する薬物処置および制御のグラフである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MD ,MG,MK,MN,MW,MX,NO,NZ,PL, PT,RO,RU,SD,SE,SG,SI,SK,S L,TJ,TM,TR,TT,TZ,UA,UG,US ,UZ,VN,YU,ZA,ZW Fターム(参考) 2G045 AA24 AA35 CB01 DA12 DA13 DA14 FB01 FB02 JA01 4B024 AA01 AA12 CA04 CA09 CA12 HA08 HA14 4B063 QA11 QQ43 QQ58 QR14 QR32 QR36 QR62 QS25 5B056 BB21 BB42 HH00
Claims (112)
- 【請求項1】 少なくとも2つの種類の細胞の間の関連性の程度の表現物を
生成するための方法であって、各種類における該細胞は、所定の細胞型の細胞、
所定の組織由来の細胞および所定の器官に由来する細胞からなる群より選択され
、該方法は以下の工程: a)複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる群より選択される、工程; b)細胞の各種類の核酸において、一方の末端に該第一のサブ配列を、および
他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二の
配列によって分離された長さを有するフラグメントの存在、ならびに該フラグメ
ントの各々が存在する程度の量を決定する工程;ならびに c)該種類のなかで該フラグメントの該存在および量における類似性または差
分を反映する関連性の程度を決定する工程、 を包含する、方法。 - 【請求項2】 請求項1に記載の方法であって、前記工程b)において記載
される前記フラグメントの前記存在および量を決定する工程が、以下の工程: i)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程、 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、(a)5’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
5’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および(b)該より短い鎖の該第二
の部分に相補的な3’末端を有する、より長い鎖を含む、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; ii)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(
a)該制限エンドヌクレアーゼの対の該サブ配列、(b)該ヌクレアーゼの各対
において使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の
間の長さ、ならびに(c)該対および該長さに対応する該フラグメントの量を特
徴付ける、工程;ならびに (iii)各種類の該細胞から該核酸によって生成される、1以上の該出力シ
グナルを生成すると予測される配列、または1以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(
a)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出
力シグナルを生成すると予測されているか、または該1以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類(stet)のメンバーで
ある標的ヌクレオチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 方法。 - 【請求項3】 請求項1に記載の方法であって、前記工程b)に記載される
前記フラグメントの存在および該フラグメントの量の決定が、以下の工程: i)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程; ii)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該2つのプライマーに対応する該2つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程;および iii)各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、(a)各プライマーの対の該サブ配列、(b)該長さ、
および(c)該量、を特徴付ける、工程;ならびに iv)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(a)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程、 を包含するプロセスによって実施される、 方法。 - 【請求項4】 請求項1に記載の方法であって、前記工程c)における関連
性の前記程度が、距離を計算することによって提供され、ここで、該距離は、前
記第一の種類について得られる各サブ配列ついについての前記量に由来する情報
を反映する第一ベクトルと、前記第二の種類について得られる各サブ配列対につ
いての前記量に由来する情報を反映する第二ベクトルとの間の差分である差分ベ
クトルの振幅を反映し、そして各ベクトルの異なる要素が異なる対を用いて得ら
れたデータに関連する、方法。 - 【請求項5】 請求項1に記載の方法であって、前記工程c)における関連
性の前記程度が、任意の2つの種類の間の関連性を反映するツリー構造を生成す
ることによって得られ、ここで、該ツリー構造のブランチが前記差分ベクトルを
反映し、そして該ブランチがノードから分岐する、方法。 - 【請求項6】 少なくとも1つの種類の前記細胞が癌細胞である、請求項1
に記載の方法。 - 【請求項7】 少なくとも1つの種類の前記細胞が推定薬学的薬剤と接触さ
れている、請求項1に記載の方法。 - 【請求項8】 複数の種類の細胞の間の相関の表現物を生成するための方法
であって、該各種類における該細胞は、所定の細胞型の細胞、所定の組織由来の
細胞および所定の器官由来の細胞からなる群より選択され、該相関は、該種類に
存在する核酸の性質および量の変化を反映し、該方法は以下の工程: a)ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程; b)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該種類の間の差分を規定する、工程
; c)該種類の該細胞の間の相関を評価する工程;ならびに d)該相関の表現物を作成する工程、 を包含する、方法。 - 【請求項9】 請求項8に記載の方法であって、前記工程b)において記載
される前記フラグメントの存在および量を決定する工程が、以下の工程: i)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、(a)5’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
5’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および(b)該より短い鎖の該第二
の部分に相補的な3’末端を有する、より長い鎖を含む、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; ii)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(
a)該制限エンドヌクレアーゼの対の該サブ配列、(b)該ヌクレアーゼの各対
において使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の
間の長さ、ならびに(c)該対および該長さに対応する該フラグメントの量を特
徴付ける、工程;ならびに (iii)各種類の該細胞から該核酸によって生成される、1以上の該出力シ
グナルを生成すると予測される配列、または1以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(
a)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出
力シグナルを生成すると予測されているか、または該1以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含する、プロセスによって実施される、 方法。 - 【請求項10】 請求項8に記載の方法であって、前記工程b)に記載され
る、前記フラグメントの前記存在および前記フラグメントの量の決定が、以下: i)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程; ii)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、増
幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配列
対、各対において使用される該2つのプライマーに対応する該2つのサブ配列の
間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる該
アンプリコンを提供する、工程;および iii)各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、(a)各プライマーの対の該サブ配列、(b)該長さ、
および(c)該量、を特徴付ける、工程;ならびに iv)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(a)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 方法。 - 【請求項11】 請求項8に記載の方法であって、前記工程d)における相
関が1セットの正規直交固有ベクトルに関連し、該固有ベクトルが構築される基
底セットの要素が、前記2種類の細胞の間で相関付けられた特定の生化学的経路
もしくは生理的経路を反映し、各固有ベクトルは、0を超える整数である固有値
を有し、その固有値が、使用される該固有値の上限である特定の整数以下である
該基底セット要素の係数が前記第一の種類の細胞と前記第二の種類の細胞との間
で相関付けられた生化学的差分または生理学的差分に対応する経路の寄与を反映
する、方法。 - 【請求項12】 請求項8に記載の方法であって、前記表現物がクラスター
図または系統樹であり、前記2種類の細胞の間の差分に対する生化学的応答もし
くは生理的応答に関与する経路の関連性を反映するツリー構造を包含し、ここで
、相関行列が距離の決定を提供し、該距離は、該差分に対する該2種類の一方の
応答について得られる情報を各々反映する2つのベクターの間の差分である差分
ベクトルの振幅を反映し、そして該ツリー構造のブランチが該差分ベクトルを反
映し、そして該ブランチがノードから分岐する、方法。 - 【請求項13】 前記少なくとも1つの種類における前記細胞が癌細胞であ
る、請求項8に記載の方法。 - 【請求項14】 請求項8に記載の方法であって、前記少なくとも1つの種
類における前記細胞が推定薬学的薬剤に接触されており、そして、該方法は以下
の工程: a)少なくとも1つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程; b)ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程; c)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該薬剤の効果を規定する、工程; d)該第一の種類の細胞に対する該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の相関を評価する工程;ならびに e)該相関の表現物を作成する工程、 を包含する、方法。 - 【請求項15】 少なくとも2種類の細胞の間の関連性の程度の表現物を表
示するための表示手段であって、各種類の該細胞が、所定の細胞型の細胞、所定
の組織由来の細胞および所定の器官由来の細胞からなる群より選択され、該関連
性の程度は、該細胞の種類の核酸において、ヌクレオチドサブ配列の対の存在に
おける類似性もしくは差分を反映し、該対は、第一のサブ配列、第二のサブ配列
、該対の該第一のサブ配列と該第二のサブ配列とを分離するヌクレオチド長さお
よび所定の長さを有する各対が該種類の細胞である程度の量からなる、表示手段
。 - 【請求項16】 請求項15に記載の表示手段であって、前記関連の程度が
距離に関連し、該距離は、前記第一の種類について得られる各サブ配列について
の前記量に由来する情報を反映する第一ベクトルと、前記第二の種類について得
られる各サブ配列対についての前記量に由来する情報を反映する第二ベクトルと
の間の差分である差分ベクトルの振幅を反映し、そして各ベクトルの異なる要素
が異なる対を用いて得られたデータに関連する、表示手段。 - 【請求項17】 請求項15に記載の手段であって、前記表現物が、任意の
2つの種類の間の関連性を反映するツリー構造を含み、ここで、該ツリー構造の
ブランチが前記差分ベクトルを反映し、そして該ブランチがノードから分岐する
、表示手段。 - 【請求項18】 請求項15に記載の手段であって、前記関連性の程度が、
以下の工程: a)ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程; b)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定する、工程;ならびに c)該種類の間の該フラグメントの存在および量における類似性もしくは差分
を反映する関連性の程度を決定する工程、 を包含するプロセスによって得られる、表示手段。 - 【請求項19】 請求項18に記載の表示手段であって、前記工程b)にお
いて記載される前記フラグメントの前記存在および量を決定する工程が、以下の
工程: i)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、(a)5’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
5’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および(b)該より短い鎖の該第二
の部分に相補的な3’末端を有する、より長い鎖を含む、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; ii)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(
a)該制限エンドヌクレアーゼの対の該サブ配列、(b)該ヌクレアーゼの各対
において使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の
間の長さ、ならびに(c)該対および該長さに対応する該フラグメントの量を特
徴付ける、工程;ならびに (iii)各種類の該細胞から該核酸によって生成される、1以上の該出力シ
グナルを生成すると予測される配列、または1以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(
a)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出
力シグナルを生成すると予測されているか、または該1以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 手段。 - 【請求項20】 請求項18に記載の手段であって、前記工程b)に記載さ
れる前記フラグメントの存在および該フラグメントの量の決定が、以下の工程: i)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程; ii)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、増
幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配列
対、各対において使用される該2つのプライマーに対応する該2つのサブ配列の
間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる該
アンプリコンを提供する、工程;および iii)各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、(a)各プライマーの対の該サブ配列、(b)該長さ、
ならびに(c)該量、を特徴付ける、工程;ならびに iv)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(a)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 手段。 - 【請求項21】 少なくとも1つの種類の前記細胞が癌細胞である、請求項
15に記載の手段。 - 【請求項22】 少なくとも1つの種類の前記細胞が推定薬学的薬剤と接触
されている、請求項15に記載の手段。 - 【請求項23】 複数の種類の細胞の間の相関の表現物の表示するための表
示手段であって、該各種類における該細胞は、所定の細胞型の細胞、所定の組織
由来の細胞および所定の器官由来の細胞からなる群より選択され、該相関は、該
種類の細胞の核酸における一対のヌクレオチドサブ配列の存在下の差分を反映し
、各対は、第一のサブ配列、第二のサブ配列、該対の該第一のサブ配列と該第二
のサブ配列とを分離するヌクレオチド長さおよび所定の長さを有する各対が該種
類の細胞中にある程度の量からなる、表示手段。 - 【請求項24】 請求項23に記載の表示手段であって、前記相関が、1セ
ットの正規直交固有ベクトルに関連し、該固有ベクトルが構築される基底セット
の要素が、前記2種類の細胞の間で相関付けられた特定の生化学的経路もしくは
生理的経路を反映し、各固有ベクトルは、0を超える整数である固有値を有し、
その固有値が、選択される該固有値の上限である特定の整数以下である該基底セ
ット要素の係数が前記第一の種類の細胞と前記第二の種類の細胞との間で相関付
けられた生化学的差分または生理学的差分に対応する経路の寄与を反映する、表
示手段。 - 【請求項25】 請求項23に記載の手段であって、前記表現物がクラスタ
ー図または系統樹であり、前記2種類の細胞の間の生化学的差分もしくは生理的
差分に関与する経路の関連性を反映するツリー構造を包含し、ここで、相関行列
が距離の決定を提供し、該距離は、各々が該種類間の該差分について得られる情
報を各々反映する2つのベクターの間の差分である差分ベクトルの振幅を反映し
、そして該ツリー構造のブランチが該差分ベクトルを反映し、そして該ブランチ
がノードから分岐する、表示手段。 - 【請求項26】 請求項23に記載の表示手段であって、前記相関が、以下
の工程: a)ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程; b)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該種類の間の差分を規定す
る、工程; c)該種類の差分を基に第一の種類の細胞と第二の種類との間の該相関を評価
する工程;ならびに d)該相関の表現物を作成する工程、 を包含する方法によって得られる、表示手段。 - 【請求項27】 請求項23に記載の手段であって、前記工程b)において
記載される前記フラグメントの前記存在および量を決定する工程が、以下の工程
: i)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、各消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、(a)5’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
5’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および(b)該より短い鎖の該第二
の部分に相補的な3’末端を有する、より長い鎖を含む、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; ii)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(
a)該制限エンドヌクレアーゼの対の該サブ配列、(b)該ヌクレアーゼの各対
において使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の
間の長さ、ならびに(c)該対および該長さに対応する該フラグメントの量を特
徴付ける、工程;ならびに (iii)各種類の該細胞から該核酸によって生成される、1以上の該出力シ
グナルを生成すると予測される配列、または1以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(
a)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出
力シグナルを生成すると予測されているか、または該1以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 手段。 - 【請求項28】 請求項23に記載の手段であって、前記工程b)に記載さ
れる前記フラグメントの存在および該フラグメントの量の決定が、以下の工程: i)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程; ii)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該2つのプライマーに対応する該2つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程;および iii)各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、(a)該プライマーの対の該サブ配列、(b)該長さ、
ならびに(c)該量、を特徴付ける、工程;ならびに iv)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(a)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 表示手段。 - 【請求項29】 少なくとも1つの種類の前記細胞が癌細胞である、請求項
23に記載の表示手段。 - 【請求項30】 請求項23に記載の表示手段であって、少なくとも1種類
の前記細胞が、推定薬学的薬剤と接触されており、そして前記相関は以下の工程
: a)少なくとも1つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量と接触させる工程
; b)ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程; c)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程; d)該薬剤と接触させた少なくとも1つの種類の細胞における該薬剤の効果と
、別の種類の細胞に対する該薬剤の効果との間の相関を評価する工程;ならびに e)該相関の表現物を作成する工程、 を包含する方法によって得られる、 表示手段 - 【請求項31】 少なくとも2種類の細胞の間の関連性の程度の表現物であ
って、各種類の該細胞が、所定の細胞型の細胞、所定の組織由来の細胞および所
定の器官由来の細胞からなる群より選択され、該関連性の程度は、該細胞の種類
の核酸において、ヌクレオチドサブ配列の対の存在における類似性もしくは差分
を反映し、該対は、第一のサブ配列、第二のサブ配列、該対の該第一のサブ配列
と該第二のサブ配列とを分離するヌクレオチド長さおよび所定の長さを有する各
対が該種類の細胞である程度の量からなる、表現物。 - 【請求項32】 請求項31に記載の表現物であって、前記関連の程度が距
離に関連し、該距離は、前記第一の種類について得られる各サブ配列ついについ
ての前記量に由来する情報を反映する第一ベクトルと、前記第二の種類について
得られる各サブ配列対についての前記量に由来する情報を反映する第二ベクトル
との間の差分である差分ベクトルの振幅を反映し、そして各ベクトルの異なる要
素が異なる対を用いて得られたデータに関連する、表現物。 - 【請求項33】 請求項31に記載の表現物であって、該表現物が、任意の
2つの種類の間の関連性を反映するツリー構造を含み、ここで、該ツリー構造の
ブランチが前記差分ベクトルを反映し、そして該ブランチがノードから分岐する
、表現物。 - 【請求項34】 請求項31に記載の表現物であって、前記関連性の程度が
、以下の工程: a)ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程; b)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定する、工程;ならびに c)該種類のなかの該フラグメントの存在および量における類似性もしくは差
分を反映する関連性の程度を決定する工程、 を包含するプロセスによって得られる、表現物。 - 【請求項35】 請求項34に記載の表現物であって、前記工程b)におい
て記載される前記フラグメントの前記存在および量を決定する工程が、以下の工
程: i)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、各消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、5’末端ホスフェートを有さず、かつ(a
)より短い鎖は、第一部分および第二部分からなり、該第一の部分は、5’末端
に存在し、かつ該対の制限エンドヌクレアーゼの対の一方によって生成されるオ
ーバーハングに対して相補的であり、そして(b)より長い鎖は、該より短い鎖
の該第二の部分に相補的な3’末端を有する、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; ii)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(
a)該制限エンドヌクレアーゼの対の該サブ配列、(b)該ヌクレアーゼの各対
において使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の
間の長さ、ならびに(c)該対および該長さに対応する該フラグメントの量を特
徴付ける、工程;ならびに (iii)各種類の該細胞から該核酸によって生成される、1以上の該出力シ
グナルを生成すると予測される配列、または1以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(
a)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出
力シグナルを生成すると予測されているか、または該1以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 表現物。 - 【請求項36】 請求項34に記載の表現物であって、前記工程b)に記載
される前記フラグメントの存在および該フラグメントの量の決定が、以下の工程
: i)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程; ii)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該2つのプライマーに対応する該2つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程 iii)各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、(a)各プライマーの対の該サブ配列、(b)該長さ、
ならびに(c)該量、を特徴付ける、工程;ならびに iv)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(a)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 表現物。 - 【請求項37】 少なくとも1つの種類の前記細胞が癌細胞である、請求項
31に記載の表現物。 - 【請求項38】 種類の前記細胞が推定薬学的薬剤と接触されている、請求
項31に記載の表現物。 【請求項38】 複数の種類の細胞の間の相関の表現物であって、該各種類
における該細胞は、所定の細胞型の細胞、所定の組織由来の細胞および所定の器
官由来の細胞からなる群より選択され、該相関は、該細胞の種類の核酸において
、ヌクレオチドサブ配列の対の存在における差分を反映し、該対は、第一のサブ
配列、第二のサブ配列、該対の該第一のサブ配列の対と該第二のサブ配列の対と
を分離するヌクレオチド長さおよび所定の長さを有する各対が該種類の間の細胞
に存在する程度の量からなる、表現物。 - 【請求項39】 請求項38に記載の表現物であって、前記相関が、1セッ
トの正規直交固有ベクトルに関連し、該固有ベクトルが構築される基底セットの
要素が、前記2種類の細胞の間で相関付けられた特定の生化学的経路もしくは生
理的経路を反映し、各固有ベクトルは、0を超える整数である固有値を有し、そ
の固有値が、選択される該固有値の上限である特定の整数以下である各固有ベク
トルにおける該基底セット要素の係数が前記第一の種類の細胞と前記第二の種類
の細胞との間で相関付けられた生化学的差分または生理学的差分に対応する経路
の寄与を反映する、表現物。 - 【請求項40】 請求項38に記載の表現物であって、該表現物がクラスタ
ー図または系統樹であり、前記2種類の細胞の間の生化学的差分もしくは生理的
差分に関与する経路の関連性を反映するツリー構造を包含し、ここで、相関行列
が距離の決定を提供し、該距離は、一方の種類から得られる情報を各々反映する
2つのベクターの間の差分である差分ベクトルの振幅を反映し、そして該ツリー
構造のブランチが該差分ベクトルを反映し、そして該ブランチがノードから分岐
する、表現物。 - 【請求項41】 請求項38に記載の表現物であって、前記相関が、以下の
工程: a)ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程; b)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該種類の間の差分を規定する、工程
; c)該種類の差分に基づき該一方の種類の該細胞と該第二の種類の細胞との間
の相関を評価する工程;ならびに d)該相関の表現物を作成する工程、 を包含する方法によって得られる、表現物。 - 【請求項42】 請求項41に記載の表現物であって、前記工程b)におい
て記載される前記フラグメントの前記存在および量を決定する工程が、以下の工
程: i)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、(a)5’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
5’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および(b)該より短い鎖の該第二
の部分に相補的な3’末端を有する、より長い鎖を含む、工程、、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; ii)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(
a)該制限エンドヌクレアーゼの対の該サブ配列、(b)該ヌクレアーゼの各対
において使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の
間の長さ、ならびに(c)該対および該長さに対応する該フラグメントの量を特
徴付ける、工程;ならびに (iii)各種類の該細胞から該核酸によって生成される、1以上の該出力シ
グナルを生成すると予測される配列、または1以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(
a)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出
力シグナルを生成すると予測されているか、または該1以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 表現物。 - 【請求項43】 請求項41に記載の表現物であって、前記工程b)に記載
される前記フラグメントの存在および該フラグメントの量の決定が、以下の工程
: i)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程; ii)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該2つのプライマーに対応する該2つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程 iii)各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、(a)各プライマーの対の該サブ配列、(b)該長さ、
および(c)該量、を特徴付ける、工程;ならびに iv)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(a)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(b)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 表現物。 - 【請求項44】 少なくとも1つの種類の前記細胞が癌細胞である、請求項
38に記載の表現物。 - 【請求項45】 請求項38に記載の表現物であって、少なくとも1種類の
前記細胞が、推定薬学的薬剤と接触されており、そして前記相関は以下の工程: a)少なくとも1つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量をと接触させる工
程; b)ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程; c)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程; d)該薬剤と接触させた少なくとも1つの種類の細胞における該薬剤の効果と
、別の種類の細胞に対する該薬剤の効果との間の相関を評価する工程;ならびに e)該相関の表現物を作成する工程、 を包含する方法によって得られる、 表現物。 - 【請求項46】 複数の種類の細胞の間の幾何的表現物を作成するための方
法であって、各種類の該細胞が、所定の細胞型の細胞、所定の組織に由来する細
胞および所定の器官に由来する細胞からなる群より選択され、該表現物が、該種
類に存在する核酸の性質および量の変化を反映し、該方法は以下の工程: a)各種類の細胞の核酸において、核酸フラグメントの存在および量を評価し
、それによって該種類の間の差分を規定する工程; b)該種類の該細胞の間の差分に基づいて幾何的分析を行う工程;ならびに c)該分析の結果の表現物を作成する工程、 を包含する、 方法。 - 【請求項47】 前記幾何的表現物が、主成分分析もしくは主因数分析によ
って得られた結果である、請求項46に記載の方法。 - 【請求項48】 請求項46に記載の方法であって、前記工程a)において
記載される核酸フラグメントの存在および量を評価する工程が、以下の工程: i)該フラグメントについて特異的なオリゴヌクレオチドプローブのセットを
用いて該種類の該核酸をプローブする工程;および ii)各プローブが該核酸を結合する程度を決定し、それによって、該種類に
おける該核酸フラグメントの存在および量の評価が提供される、工程、 を包含するプロセスによって実施される、 方法。 - 【請求項49】 請求項46に記載の方法であって、前記工程a)において
記載される核酸の存在および量を評価する工程が、以下の工程: i)複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる群より選択される、工程;および ii)細胞の各種類の該核酸において、一方の末端に該第一のサブ配列を、お
よび他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第
二の配列によって分離された長さを有するフラグメントの存在、ならびに該フラ
グメントの各々が存在する程度の量を決定し、それによって、該種類の間の差分
を規定する工程 を包含するプロセスによって実施される、 方法。 - 【請求項50】 請求項49に記載の方法であって、前記工程ii)におい
て記載される前記フラグメントの前記存在および量を評価する工程が、以下の工
程: a)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、(a)5’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
5’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および(b)該より短い鎖の該第二
の部分に相補的な3’末端を有する、より長い鎖を含む、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; b)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの各
々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(1
)該制限エンドヌクレアーゼの対の該サブ配列、(2)該ヌクレアーゼの各対に
おいて使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の間
の長さ、および(3)該対および該長さに対応する該フラグメントの量を特徴付
ける、工程;ならびに (c)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(1)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(2)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 方法。 - 【請求項51】 請求項49に記載の方法であって、前記工程ii)に記載
される前記フラグメントの存在および該フラグメントの量の決定が、以下の工程
: (a)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第
二のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であっ
て、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第
二のプライマーが該第二のサブ配列に対して相補的である、工程; (b)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該2つのプライマーに対応する該2つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程;および (c)各アンプリコンについての出力シグナルを生成する工程であって、該出
力シグナルの各々は、(1)各プライマーの対の該サブ配列、(2)該長さ、お
よび(3)該量、を特徴付ける、工程;ならびに d)各種類の該細胞から該核酸によって生成される、1以上の該出力シグナル
を生成すると予測される配列、または1以上の該出力シグナルを生成すると推測
される任意の配列の非存在を決定するためにヌクレオチド配列データベースを任
意に検索する工程であって、該データベースは、各種類の細胞において存在し得
る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(1)該
1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の発
生の間の同じ長さ、および(2)該1以上の出力シグナルによって表現されると
きに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シグ
ナルを生成すると予測されているか、または該1以上の出力シグナルによって表
現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオチ
ドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 方法。 - 【請求項52】 前記幾何的分析の結果が、固有値、固有ベクトルおよび主
因数からなる群より選択される、請求項46に記載の方法。 - 【請求項53】 請求項46に記載の方法であって、前記工程c)における
分析結果がが1セットの正規直交固有ベクトルに関連し、該固有ベクトルが構築
される基底セットの要素が、前記2種類の細胞の間で相関付けられた特定の生化
学的成分、生理的成分もしくは薬理学的成分を反映し、各固有ベクトルは、固有
値を有し、その固有値が、固有ベクトルにおける該基底セット要素の係数が前記
第一の種類の細胞と前記第二の種類の細胞との間の差分に対応する生化学的成分
、生理学的成分もしくは薬理学的成分の寄与を反映する、方法。 - 【請求項54】 前記少なくとも1つの種類における前記細胞が癌細胞であ
る、請求項46に記載の方法。 - 【請求項55】 請求項46に記載の方法であって、前記少なくとも1つの
種類における前記細胞が推定薬学的薬剤に接触されており、そして、該方法は以
下の工程: a)少なくとも1つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程; b)ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程; c)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程; d)該第一の種類の細胞における該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の主成分分析を行う工程;ならびに e)該分析の結果の表現物を作成する工程、 を包含する、方法。 - 【請求項56】 複数種類の細胞の間の幾何的表現物を表示するための表示
手段であって、各種類の該細胞が、所定の細胞型の細胞、所定の組織由来の細胞
および所定の器官由来の細胞からなる群より選択され、主成分の分析は、該種類
に存在する核酸の性質および存在の変化を反映し、該表現物は、以下の工程: a)各種類の細胞の核酸において、核酸フラグメントの存在および量を評価し
、それによって該種類の間の差分を規定する工程; b)第一の種類の細胞と第二の種類の細胞との間の差分に基づいて主成分分析
を行う工程;ならびに c)該分析の結果の表現物を作成する工程、 を包含する方法によって得られる、 表示手段。 - 【請求項57】 前記幾何的表現物が、主成分分析または主因数分析によっ
て得られた結果である、請求項56に記載の表示手段。 - 【請求項58】 請求項56に記載の表示手段であって、前記工程a)にお
いて記載される核酸フラグメントの存在および量を評価する工程が、以下の工程
: i)該フラグメントについて特異的なオリゴヌクレオチドプローブのセットを
用いて該種類の該核酸をプローブする工程;および ii)各プローブが該核酸を結合する程度を決定し、それによって、該種類に
おける該核酸フラグメントの存在および量の評価が提供される、工程、 を包含する、 表示手段。 - 【請求項59】 請求項56に記載の表示手段であって、前記工程a)にお
いて記載される核酸フラグメントの存在および量を評価する工程が、以下の工程
: i)複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる群より選択される、工程;および ii)細胞の各種類の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
の配列によって分離された長さを有するフラグメントの存在、ならびに該フラグ
メントの各々が存在する程度の量を決定し、それによって、該種類の間の差分を
規定する工程 を包含する、プロセスによって実施される、 表示手段。 - 【請求項60】 請求項59に記載の表示手段であって、前記工程ii)に
おいて記載される前記核酸フラグメントの前記存在および量を決定する工程が、
以下の工程: a)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、5’末端ホスフェートを有さず、かつ(1
)より短い鎖は、第一部分および第二部分からなり、該第一の部分は、5’末端
に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成されるオーバ
ーハングに対して相補的であり、そして(2)より長い鎖は、該より短い鎖の該
第二の部分に相補的な3’末端を有する、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; b)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの各
々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(1
)該制限エンドヌクレアーゼの対の該サブ配列、(2)該ヌクレアーゼの各対に
おいて使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の間
の長さ、および(3)該対および該長さに対応する該フラグメントの量を特徴付
ける、工程;ならびに (c)各種類の該細胞由来の該核酸によって生成される、1以上の該出力シグ
ナルを生成すると予測される配列、または1以上の該出力シグナルを生成すると
推測される任意の配列の非存在を決定するためにヌクレオチド配列データベース
を任意に検索する工程であって、該データベースは、各種類の細胞において存在
し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(1
)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列
の発生の間の同じ長さ、および(2)該1以上の出力シグナルによって表現され
るときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力
シグナルを生成すると予測されている配列、または該1以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 表示手段。 - 【請求項61】 請求項59に記載の表示手段であって、前記工程ii)に
記載される前記核酸フラグメントの存在および量を評価する工程が、以下の工程
: (a)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第
二のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であっ
て、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第
二のプライマーが該第二のサブ配列に対して相補的である、工程; (b)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該2つのプライマーに対応する該2つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程 (c)各アンプリコンについての出力シグナルを生成する工程であって、該出
力シグナルの各々は、(1)各プライマーの対の該サブ配列、(2)該長さ、お
よび(3)該量、を特徴付ける、工程;ならびに d)各種類の該細胞由来の該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(1)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(2)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されている配列、または該1以上の出力シグナルによっ
て表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレ
オチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 表示手段。 - 【請求項62】 前記表示手段の結果が、固有値、固有ベクトルおよび主因
数からなる群より選択される、請求項56に記載の表示手段。 - 【請求項63】 請求項56に記載の表示手段であって、前記工程c)にお
ける分析結果がが1セットの正規直交固有ベクトルに関連し、該固有ベクトルが
構築される基底セットの要素が、前記2種類の細胞の間で相関付けられた特定の
生化学的経路、生理的経路もしくは薬理学的経路を反映し、各固有ベクトルは、
固有値を有し、その固有値が、各固有ベクトルにおける該基底セット要素の係数
が前記第一の種類の細胞と前記第二の種類の細胞との間で相関付けられた生化学
的差分、生理学的差分または薬理学的差分に対応する経路の寄与を反映する、表
示手段。 - 【請求項64】 前記少なくとも1つの種類における前記細胞が癌細胞であ
る、請求項56に記載の表示手段。 - 【請求項65】 請求項56に記載の表示手段であって、前記少なくとも1
つの種類における前記細胞が推定薬学的薬剤に接触されており、そして、該表現
物は、以下の工程: a)少なくとも1つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程; b)ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程; c)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程; d)該第一の種類の細胞における該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の主成分分析を行う工程;ならびに e)該分析の結果の表現物を作成する工程、 を包含する、方法によって得られる、 表示手段。 - 【請求項66】 少なくとも2種類の細胞の間の幾何的表現物であって、各
種類の該細胞が、所定の細胞型の細胞、所定の組織由来の細胞および所定の器官
由来の細胞からなる群より選択され、主成分の分析は、該種類に存在する核酸の
性質および量の変化を反映し、該表現物は、以下の工程: a)各種類の細胞の核酸において、核酸フラグメントの存在および量を評価し
、それによって該種類の間の差分を規定する工程; b)第一の種類の細胞と第二の種類の細胞との間の差分に基づいて主成分分析
を行う工程;ならびに c)該分析の結果の表現物を作成する工程、 を包含する方法によって得られる、 幾何的表現物。 - 【請求項67】 前記幾何的表現物が、主成分分析または主因数分析によっ
て得られた結果である、請求項66に記載の幾何的表現物。 - 【請求項68】 請求項66に記載の幾何的表現物であって、前記工程a)
において記載される核酸フラグメントの存在および量を評価する工程が、以下の
工程: i)該フラグメントについて特異的なオリゴヌクレオチドプローブのセットを
用いて該各種類の該核酸をプローブする工程;および ii)各プローブが該核酸を結合する程度を決定し、それによって、該種類に
おける該核酸フラグメントの存在および量の評価が提供される、工程、 を包含する、 表現物。 - 【請求項69】 請求項66に記載の表現物であって、前記工程a)におい
て記載される核酸フラグメントの存在および量を評価する工程が、以下の工程: i)複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列を含む、工程;および ii)細胞の各種類の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
の配列によって分離された長さを有するフラグメントの存在、ならびに該フラグ
メントの各々が存在する程度の量を決定し、それによって、該種類の間の差分を
規定する工程 を包含する、プロセスによって実施される、 表現物。 - 【請求項70】 請求項69に記載の表現物であって、前記工程ii)にお
いて記載される前記核酸フラグメントの前記存在および量を決定する工程が、以
下の工程: a)複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、1対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、各消化は、特定の制
限フラグメントを提供する、工程 二本鎖アダプターDNA分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターDNA分子は、(a)5’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
5’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および(b)該より短い鎖の該第二
の部分に相補的な3’末端を有する、より長い鎖を含む、工程、および 該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程; b)該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの各
々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、(1
)該制限エンドヌクレアーゼの対の該サブ配列、(2)該ヌクレアーゼの各対に
おいて使用される2つの制限エンドヌクレアーゼに対応する2つのサブ配列の間
の長さ、および(3)該対および該長さに対応する該フラグメントの量を特徴付
ける、工程;ならびに (c)各種類の該細胞由来の該核酸によって生成される、1以上の該出力シグ
ナルを生成すると予測される配列、または1以上の該出力シグナルを生成すると
推測される任意の配列の非存在を決定するためにヌクレオチド配列データベース
を任意に検索する工程であって、該データベースは、各種類の細胞において存在
し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(1
)該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列
の発生の間の同じ長さ、および(2)該1以上の出力シグナルによって表現され
るときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力
シグナルを生成すると予測されているか、または該1以上の出力シグナルによっ
て表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレ
オチドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、 を包含するプロセスによって実施される、 表現物。 - 【請求項71】 請求項69に記載の表現物であって、前記工程ii)に記
載される前記核酸フラグメントの存在および量を評価する工程が、以下の工程: (a)前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第
二のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であっ
て、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第
二のプライマーが該第二のサブ配列に対して相補的である、工程; (b)該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該2つのプライマーに対応する該2つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程 (c)各アンプリコンについての出力シグナルを生成する工程であって、該出
力シグナルの各々は、(1)各プライマーの対の該サブ配列、(2)該長さ、お
よび(3)該量、を特徴付ける、工程;ならびに d)各種類の該細胞由来の該核酸によって生成される、1以上の該出力シグナ
ルを生成すると予測される配列、または1以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が(1)
該1以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および(2)該1以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該1つ以上の出力シ
グナルを生成すると予測されているか、または該1以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、 それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程 を包含するプロセスによって実施される、 幾何的表現物。 - 【請求項72】 前記幾何的分析の結果が、固有値、固有ベクトルおよび主
因数からなる群より選択される、請求項66に記載の表現物。 - 【請求項73】 請求項66に記載の表現物であって、前記工程c)におけ
る分析結果が1セットの正規直交固有ベクトルに関連し、該固有ベクトルが構築
される基底セットの要素が、前記2種類の細胞の間で相関付けられた特定の生化
学的経路、生理学的経路もしくは薬理学的経路を反映し、各固有ベクトルは、固
有値を有し、その固有値が、各固有ベクトルにおける該基底セット要素の係数が
前記第一の種類の細胞と前記第二の種類の細胞との間で相関付けられた生化学的
差分、生理学的差分もしくは薬理学的差分に対応する経路の寄与を反映する、表
現物。 - 【請求項74】 前記少なくとも1つの種類における前記細胞が癌細胞であ
る、請求項66に記載の表現物。 - 【請求項75】 請求項66に記載の表現物であって、前記少なくとも1つ
の種類における前記細胞が推定薬学的薬剤に接触されており、そして、該表現物
は、以下の工程: a)少なくとも1つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程; b)ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程; c)該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該薬剤の効果を規定する、工程; d)該第一の種類の細胞における該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の主成分分析を行う工程;ならびに e)該分析の結果の表現物を作成する工程、 を包含する、方法によって得られる、 表現物。 - 【請求項76】 複数の種類の細胞またはその成分を階層的に分類するため
の方法であって、該方法は、以下の工程: a)各種類の細胞に存在する核酸の量における相対的な差分を測定して、示差
的核酸表示の測定値を提供する工程; b)該測定値を、ベクトル空間において、該種類の細胞の間の距離へと変換す
る工程;および c)該ベクトル距離に基づいて、該種類の間の階層的分類を生成する工程、 を包含する、方法。 - 【請求項77】 前記分類が、細胞の種類について実施され、1つの種類に
おける該細胞は、所定の細胞型の細胞、所定の組織由来の細胞および所定の器官
由来の細胞、特定の病的状態を示す細胞、または推定薬学的薬剤と接触された細
胞であり得る、請求項76に記載の方法。 - 【請求項78】 前記分類が、前記種類における前記細胞の成分に対して実
施され、該成分は、遺伝子、核酸、またはそのフラグメントを包含する、請求項
76に記載の方法。 - 【請求項79】 前記測定する工程が、核酸フラグメントの示差的表示、オ
リゴヌクレオチドプローブ、発現配列タグ(EST)から得られた配列を用いる
核酸の存在についてのプロービング、制限フラグメント長多型性の評価、および
増幅フラグメント長多型性の評価からなる群より選択される手順によって実施さ
れる、請求項76に記載の方法。 - 【請求項80】 前記階層的分類の生成が、相関行列の主成分分析、相関行
列の主因数分析、中心(centered)内積行列の主成分分析、および中内
積行列の主因数分析からなる群より選択される、手順によって実施される、請求
項76に記載の方法。 - 【請求項81】 さらに、次元を減じた幾何的表現物から前記種類の間の距
離計量を得る工程を包含する、請求項80に記載の方法。 - 【請求項82】 請求項76〜81のいずれか1項に記載される方法によっ
て得られる分類の結果を表示する、表示手段。 - 【請求項83】 複数の種類の細胞またはその成分を幾何的に表現するため
の方法であって、該方法は以下の工程: a)各種類の細胞に存在する核酸の量における相対的な差分を測定して、示差
的核酸表示の測定値を提供する工程;および b)該示差的表示測定値に基づく種類のなかでの、幾何的表示物を生成する工
程、 を包含する、方法。 - 【請求項84】 請求項83に記載の方法であって、前記分類が細胞の種類
について行われ、1つの種類における該細胞は、所定の細胞型の細胞、所定の組
織由来の細胞および所定の器官由来の細胞、特定の病的状態を示す細胞、または
推定薬学的薬剤と接触された細胞であり得る、方法。 - 【請求項85】 前記分類が、前記種類における前記細胞の成分に対して実
施され、該成分は、遺伝子、核酸、またはそのフラグメントを包含する、請求項
83に記載の方法。 - 【請求項86】 前記測定する工程が、核酸フラグメントの示差的表示、オ
リゴヌクレオチドプローブ、発現配列タグ(EST)から得られた配列を用いる
核酸の存在についてのプロービング、制限フラグメント長多型性の評価、および
増幅フラグメント長多型性の評価からなる群より選択される手順によって実施さ
れる、請求項83に記載の方法。 - 【請求項87】 前記階層的分類の生成が、相関行列の主成分分析、相関行
列の主因数分析、中心内積行列の主成分分析、および中内積行列の主因数分析か
らなる群より選択される、手順により実施される、請求項83に記載の方法。 - 【請求項88】 さらに、次元を減じた幾何的表現物から前記種類の間の距
離計量を得る工程を包含する、請求項87に記載の方法。 - 【請求項89】 請求項83〜88のいずれか1項に記載される方法によっ
て得られる幾何学的表現物の結果を表示する、表示手段。 - 【請求項90】 集団の2以上のメンバーの階層的関連性を提示する方法で
あって、該方法は以下の工程: 該集団における各メンバーのデータセットを提供する工程; 該データセットの階層的分類を生成する工程;および 該分類を表示し、それによって該集団のメンバーの階層的関連性を提示する工
程、 を包含する、方法。 - 【請求項91】 前記集団が細胞集団である,請求項90に記載の方法。
- 【請求項92】 前記集団が核酸配列の集団である、請求項90に記載の方
法。 - 【請求項93】 前記集団がポリペプチド配列の集団である、請求項90に
記載の方法。 - 【請求項94】 前記集団の任意の2以上のメンバーの前記階層的分類が、
アルゴリズムと組み合わせた距離方法を用いて計算される、請求項90に記載の
方法。 - 【請求項95】 前記距離方法が、ピアソン相関距離、ユークリッド距離、
マンハッタン距離、マハロノビシュ(Mahalanobis)距離、対(pa
irwise)ピアソン距離、またはスペアマン(Spearman)距離であ
る、請求項94に記載の方法。 - 【請求項96】 前記アルゴリズムが、単一連鎖(single link
age)、平均連鎖、または完全連鎖である、請求項95に記載の方法。 - 【請求項97】 前記データセットが、示差的表示、遺伝子発現の連続分析
、発現タグ配列分析、制限フラグメント長多型性、および増幅フラグメント長多
型性、またはノーザンブロットハイブリダイゼーション分析である、請求項90
に記載の方法。 - 【請求項98】 集団の2以上のメンバーの幾何的関連性を提示する方法で
あって、該方法は以下の工程: 該集団における各メンバーのデータセットを提供する工程; 該データセットの幾何的分類を生成する工程;および 該分類を表示し、それによって該集団のメンバーの幾何的関連性を提示する工
程、 を包含する、方法。 - 【請求項99】 前記集団が細胞集団である,請求項98に記載の方法。
- 【請求項100】 前記集団が核酸配列の集団である、請求項98に記載の
方法。 - 【請求項101】 前記集団がポリペプチド配列の集団である、請求項98
に記載の方法。 - 【請求項102】 前記幾何的分類が、アルゴリズムを用いて行列を分析す
ることによって生成される、請求項98に記載の方法。 - 【請求項103】 前記行列が相関行列を含む、請求項102に記載の方法
。 - 【請求項104】 前記相関行列が、ピアソン相関行列、スペアマン相関行
列、または対ピアソン相関行列である、請求項103に記載の方法。 - 【請求項105】 前記行列が中心内積距離行列を含む、請求項102に記
載の方法。 - 【請求項106】 前記内積距離行列が階層的分類分析によって計算された
距離を用いて決定される、請求項105に記載の方法。 - 【請求項107】 前記アルゴリズムが主成分分析を含む、請求項102に
記載の方法。 - 【請求項108】 前記アルゴリズムが主因数分析を含む、請求項102に
記載の方法。 - 【請求項109】 前記アルゴリズムが主因数分析を含む、請求項107に
記載の方法。 - 【請求項110】 前記幾何的分類がさらに、階層的分類を用いて分析され
る、請求項102に記載の方法。 - 【請求項111】 前記集団が、5、10、25、50、100、1000
、10,000、100,000または100,000を超えるメンバーを含む
、請求項90に記載の方法。 - 【請求項112】 前記集団が、5、10、25、50、100、1000
、10,000、100,000または100,000を超えるメンバーを含む
、請求項98に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10100998P | 1998-09-17 | 1998-09-17 | |
US60/101,009 | 1998-09-17 | ||
US39840499A | 1999-09-16 | 1999-09-16 | |
US09/398,404 | 1999-09-16 | ||
PCT/US1999/021525 WO2000015851A1 (en) | 1998-09-17 | 1999-09-17 | Geometrical and hierarchical classification based on gene expression |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002525079A true JP2002525079A (ja) | 2002-08-13 |
Family
ID=26797803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000570378A Pending JP2002525079A (ja) | 1998-09-17 | 1999-09-17 | 遺伝子発現に基づく幾何的および階層的分類 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1114187A1 (ja) |
JP (1) | JP2002525079A (ja) |
AU (1) | AU6047299A (ja) |
CA (1) | CA2343076A1 (ja) |
WO (1) | WO2000015851A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020090612A1 (en) * | 1999-01-08 | 2002-07-11 | Jonathan M. Rothberg | Method of identifying nucleic acids |
US7016788B2 (en) * | 2000-07-07 | 2006-03-21 | Curagen Corporation | Methods for classifying nucleic acids and polypeptides |
US7332272B1 (en) | 2000-12-06 | 2008-02-19 | Erik Gunther | Method for screening and identifying pharmaceutical agents |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2036946C (en) * | 1990-04-06 | 2001-10-16 | Kenneth V. Deugau | Indexing linkers |
WO1997013877A1 (en) * | 1995-10-12 | 1997-04-17 | Lynx Therapeutics, Inc. | Measurement of gene expression profiles in toxicity determination |
US5972693A (en) * | 1995-10-24 | 1999-10-26 | Curagen Corporation | Apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing |
US6156502A (en) * | 1995-12-21 | 2000-12-05 | Beattie; Kenneth Loren | Arbitrary sequence oligonucleotide fingerprinting |
WO1997029211A1 (en) * | 1996-02-09 | 1997-08-14 | The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services | RESTRICTION DISPLAY (RD-PCR) OF DIFFERENTIALLY EXPRESSED mRNAs |
-
1999
- 1999-09-17 CA CA002343076A patent/CA2343076A1/en not_active Abandoned
- 1999-09-17 AU AU60472/99A patent/AU6047299A/en not_active Abandoned
- 1999-09-17 JP JP2000570378A patent/JP2002525079A/ja active Pending
- 1999-09-17 WO PCT/US1999/021525 patent/WO2000015851A1/en not_active Application Discontinuation
- 1999-09-17 EP EP99969123A patent/EP1114187A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP1114187A1 (en) | 2001-07-11 |
AU6047299A (en) | 2000-04-03 |
CA2343076A1 (en) | 2000-03-23 |
WO2000015851A1 (en) | 2000-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200347444A1 (en) | Gene-expression profiling with reduced numbers of transcript measurements | |
Amaratunga et al. | Exploration and analysis of DNA microarray and protein array data | |
Quackenbush | Microarray analysis and tumor classification | |
US6303297B1 (en) | Database for storage and analysis of full-length sequences | |
JP2024016039A (ja) | 相同組換え欠損を推定するための統合された機械学習フレームワーク | |
EP2556185B1 (en) | Gene-expression profiling with reduced numbers of transcript measurements | |
US20050282227A1 (en) | Treatment discovery based on CGH analysis | |
Amaratunga et al. | Exploration and analysis of DNA microarray and other high-dimensional data | |
Larsson et al. | Comparative microarray analysis | |
Macgregor | Gene expression in cancer: the application of microarrays | |
US20020064792A1 (en) | Database for storage and analysis of full-length sequences | |
Kuo et al. | A primer on gene expression and microarrays for machine learning researchers | |
Carpentier et al. | The operons, a criterion to compare the reliability of transcriptome analysis tools: ICA is more reliable than ANOVA, PLS and PCA | |
Warner et al. | Current applications of microarrays in head and neck cancer research | |
Melov et al. | Microarrays as a tool to investigate the biology of aging: a retrospective and a look to the future | |
JP2002525079A (ja) | 遺伝子発現に基づく幾何的および階層的分類 | |
WO2001020998A1 (en) | Drug discovery using gene expression profiling | |
Kuo et al. | Gene expression profiling by DNA microarrays and its application to dental research | |
Saviozzi et al. | Microarray data analysis and mining | |
Nagarajan et al. | Database challenges in the integration of biomedical data sets | |
Weeraratna et al. | Microarray data analysis: an overview of design, methodology, and analysis | |
Kelmansky | Where statistics and molecular microarray experiments biology meet | |
Quackenbush | DNA Microarray Technology and Applications—An Overview | |
Ganeshbabu et al. | Gene Expression Profiling of DNA Microarray Data using various Data Mining Methodologies | |
Sperling | Array analysis applied to malformed hearts: Molecular dissection of tetralogy of Fallot |