CN103782301A - 用于基于网络的生物活性评估的系统与方法 - Google Patents
用于基于网络的生物活性评估的系统与方法 Download PDFInfo
- Publication number
- CN103782301A CN103782301A CN201280043499.3A CN201280043499A CN103782301A CN 103782301 A CN103782301 A CN 103782301A CN 201280043499 A CN201280043499 A CN 201280043499A CN 103782301 A CN103782301 A CN 103782301A
- Authority
- CN
- China
- Prior art keywords
- group
- node
- treatment
- biological entities
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 184
- 230000004071 biological effect Effects 0.000 title description 2
- 230000000694 effects Effects 0.000 claims abstract description 292
- 238000011282 treatment Methods 0.000 claims abstract description 146
- 230000004044 response Effects 0.000 claims abstract description 75
- 238000005259 measurement Methods 0.000 claims description 94
- 239000013598 vector Substances 0.000 claims description 87
- 230000001364 causal effect Effects 0.000 claims description 76
- 238000002360 preparation method Methods 0.000 claims description 75
- 238000012360 testing method Methods 0.000 claims description 62
- 230000008859 change Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000012887 quadratic function Methods 0.000 claims description 7
- 238000010219 correlation analysis Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 abstract description 20
- 230000008569 process Effects 0.000 description 68
- 210000004027 cell Anatomy 0.000 description 58
- 108090000623 proteins and genes Proteins 0.000 description 52
- 238000002474 experimental method Methods 0.000 description 48
- 230000007246 mechanism Effects 0.000 description 47
- 230000014509 gene expression Effects 0.000 description 33
- 238000005516 engineering process Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 21
- 201000010099 disease Diseases 0.000 description 21
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 21
- 239000011159 matrix material Substances 0.000 description 21
- 102000004169 proteins and genes Human genes 0.000 description 20
- 210000001519 tissue Anatomy 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 239000002609 medium Substances 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 241001465754 Metazoa Species 0.000 description 11
- 241000208125 Nicotiana Species 0.000 description 11
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 11
- 230000015654 memory Effects 0.000 description 11
- 230000004663 cell proliferation Effects 0.000 description 10
- 238000012512 characterization method Methods 0.000 description 9
- 210000000056 organ Anatomy 0.000 description 9
- 229940124297 CDK 4/6 inhibitor Drugs 0.000 description 8
- 239000002585 base Substances 0.000 description 8
- 230000004637 cellular stress Effects 0.000 description 8
- 239000000779 smoke Substances 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 239000000443 aerosol Substances 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000013500 data storage Methods 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 230000035882 stress Effects 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 206010061218 Inflammation Diseases 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 230000001276 controlling effect Effects 0.000 description 6
- 238000013480 data collection Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 230000003862 health status Effects 0.000 description 6
- 230000004054 inflammatory process Effects 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 229940050561 matrix product Drugs 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 150000007523 nucleic acids Chemical class 0.000 description 6
- 241000700159 Rattus Species 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000000429 assembly Methods 0.000 description 5
- 230000000712 assembly Effects 0.000 description 5
- 230000022131 cell cycle Effects 0.000 description 5
- 230000003915 cell function Effects 0.000 description 5
- 235000019504 cigarettes Nutrition 0.000 description 5
- 230000002526 effect on cardiovascular system Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- ZJOFAFWTOKDIFH-UHFFFAOYSA-N 3-(1-nitroso-3,6-dihydro-2h-pyridin-2-yl)pyridine Chemical compound O=NN1CC=CCC1C1=CC=CN=C1 ZJOFAFWTOKDIFH-UHFFFAOYSA-N 0.000 description 4
- BXYPVKMROLGXJI-JTQLQIEISA-N 3-[(2s)-1-nitrosopiperidin-2-yl]pyridine Chemical compound O=NN1CCCC[C@H]1C1=CC=CN=C1 BXYPVKMROLGXJI-JTQLQIEISA-N 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- -1 anesthetic Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- XKABJYQDMJTNGQ-VIFPVBQESA-N n-nitrosonornicotine Chemical compound O=NN1CCC[C@H]1C1=CC=CN=C1 XKABJYQDMJTNGQ-VIFPVBQESA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 230000018199 S phase Effects 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 239000002249 anxiolytic agent Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008512 biological response Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 231100000025 genetic toxicology Toxicity 0.000 description 3
- 230000001738 genotoxic effect Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 229930014626 natural product Natural products 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- 230000004962 physiological condition Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 230000007306 turnover Effects 0.000 description 3
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 description 2
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 2
- 230000008265 DNA repair mechanism Effects 0.000 description 2
- 108010036466 E2F2 Transcription Factor Proteins 0.000 description 2
- 101000904150 Homo sapiens Transcription factor E2F3 Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 239000002262 Schiff base Substances 0.000 description 2
- 150000004753 Schiff bases Chemical class 0.000 description 2
- 108090001097 Transcription Factor DP1 Proteins 0.000 description 2
- 102000004853 Transcription Factor DP1 Human genes 0.000 description 2
- 102100024024 Transcription factor E2F2 Human genes 0.000 description 2
- 102100024027 Transcription factor E2F3 Human genes 0.000 description 2
- 229930013930 alkaloid Natural products 0.000 description 2
- 150000003797 alkaloid derivatives Chemical class 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 229910052793 cadmium Inorganic materials 0.000 description 2
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 210000003850 cellular structure Anatomy 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 229910052804 chromium Inorganic materials 0.000 description 2
- 239000011651 chromium Substances 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000009266 disease activity Effects 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 210000002889 endothelial cell Anatomy 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 230000007407 health benefit Effects 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- MYMOFIZGZYHOMD-UHFFFAOYSA-O hydridodioxygen(1+) Chemical compound [OH+]=O MYMOFIZGZYHOMD-UHFFFAOYSA-O 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000013016 learning Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 2
- 229910052753 mercury Inorganic materials 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N n-Butanol Substances CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- 239000002858 neurotransmitter agent Substances 0.000 description 2
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 description 2
- 229960002715 nicotine Drugs 0.000 description 2
- 238000002670 nicotine replacement therapy Methods 0.000 description 2
- XKLJHFLUAHKGGU-UHFFFAOYSA-N nitrous amide Chemical compound ON=N XKLJHFLUAHKGGU-UHFFFAOYSA-N 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 231100000614 poison Toxicity 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 239000003104 tissue culture media Substances 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 201000008827 tuberculosis Diseases 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 150000003722 vitamin derivatives Chemical class 0.000 description 2
- 206010003445 Ascites Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010007269 Carcinogenicity Diseases 0.000 description 1
- 102100025191 Cyclin-A2 Human genes 0.000 description 1
- 108010016788 Cyclin-Dependent Kinase Inhibitor p21 Proteins 0.000 description 1
- 102100032857 Cyclin-dependent kinase 1 Human genes 0.000 description 1
- 102100033270 Cyclin-dependent kinase inhibitor 1 Human genes 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000004707 G1/S transition Effects 0.000 description 1
- 102100037858 G1/S-specific cyclin-E1 Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 101000934320 Homo sapiens Cyclin-A2 Proteins 0.000 description 1
- 101000868333 Homo sapiens Cyclin-dependent kinase 1 Proteins 0.000 description 1
- 101000909198 Homo sapiens DNA polymerase delta catalytic subunit Proteins 0.000 description 1
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 description 1
- 101000890301 Homo sapiens THAP domain-containing protein 1 Proteins 0.000 description 1
- 101000904152 Homo sapiens Transcription factor E2F1 Proteins 0.000 description 1
- 206010062717 Increased upper airway secretion Diseases 0.000 description 1
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 206010029350 Neurotoxicity Diseases 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 206010070834 Sensitisation Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 210000000662 T-lymphocyte subset Anatomy 0.000 description 1
- 102100040045 THAP domain-containing protein 1 Human genes 0.000 description 1
- 206010044221 Toxic encephalopathy Diseases 0.000 description 1
- 102100024026 Transcription factor E2F1 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 231100000899 acute systemic toxicity Toxicity 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 210000002821 alveolar epithelial cell Anatomy 0.000 description 1
- 230000003444 anaesthetic effect Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000008267 autocrine signaling Effects 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 238000003705 background correction Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 210000003443 bladder cell Anatomy 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 210000000424 bronchial epithelial cell Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 230000007670 carcinogenicity Effects 0.000 description 1
- 231100000260 carcinogenicity Toxicity 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 210000000748 cardiovascular system Anatomy 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 229960003067 cystine Drugs 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000006334 disulfide bridging Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000036267 drug metabolism Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 231100000584 environmental toxicity Toxicity 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 230000006126 farnesylation Effects 0.000 description 1
- 229920002457 flexible plastic Polymers 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 230000023611 glucuronidation Effects 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000007688 immunotoxicity Effects 0.000 description 1
- 231100000386 immunotoxicity Toxicity 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 208000033065 inborn errors of immunity Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000008376 long-term health Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000027291 mitotic cell cycle Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 210000003360 nephrocyte Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 231100000228 neurotoxicity Toxicity 0.000 description 1
- 230000007135 neurotoxicity Effects 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000008723 osmotic stress Effects 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 208000026435 phlegm Diseases 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 230000007096 poisonous effect Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 208000028529 primary immunodeficiency disease Diseases 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 210000004994 reproductive system Anatomy 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008313 sensitization Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 231100000155 toxicity by organ Toxicity 0.000 description 1
- 230000007675 toxicity by organ Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000002676 xenobiotic agent Substances 0.000 description 1
- 230000002034 xenobiotic effect Effects 0.000 description 1
- 230000022814 xenobiotic metabolic process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Physiology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开涉及用于基于网络的生物活性评估的系统与方法。本文公开了基于从生物系统中的实体子集测出的活性数据来量化生物系统对一个或多个扰动的响应的系统与方法。基于该活性数据和描述测量和未测量的实体之间关系的生物系统的网络模型,推断未测量的实体的活性。推断出的活性用于导出量化生物系统对扰动的响应,诸如对治疗条件的响应,的得分。该得分可以代表网络对扰动的响应的量级和拓扑分布。
Description
背景技术
人体由于暴露给可能有害的制剂(agent)而不断地被扰动,就长期而言,这些制剂会造成严重的健康风险。暴露给这些制剂会危及人体内部的生物机制的正常机能。为了理解并量化这些扰动对人体的影响,研究人员研究了生物系统对暴露给制剂作出响应的机制。有些组大量利用活体动物测试方法。但是,因为关于其可靠性和相关性还存在疑问,所以动物测试方法不总是充分的。不同动物的生理系统中存在许多差异。因此,不同的物种会对暴露给一种制剂有不同的响应。因此,关于从动物测试获得的响应是否可以外推到人类生物学还存在疑问。其它方法包括通过人类志愿者的临床研究评估风险。但是这些风险评估是后验执行的而且,因为疾病可能要花几十年才表现出来,所以这些评估可能不足以说明把有害物质关联到疾病的机制。还有其它方法包括试管(in vitro)实验。虽然,作为其基于动物的对等体的完全或部分代替方法,基于试管细胞与组织的方法已经获得普遍认同,但是这些方法具有有限的价值。因为试管方法集中在细胞和组织机制特定方面;所以它们不总是考虑到发生在整个生物系统中的复杂相互作用。
在过去的十年中,核酸、蛋白质与代谢物水平的高吞吐量测量结合传统的依赖剂量的疗效与毒性检测已经作为一种用于说明许多生物过程作用机制的手段出现。研究人员已经尝试结合来自这些全异测量的信息与来自科学文献的关于生化过程的知识来组成有意义的生物模型。为此,研究人员已经开始使用可以挖掘大量数据的数学与计算技术,诸如群集与统计方法,来识别可能的生物作用机制。
之前的工作还探究了揭开基因表达变化的特征签名的重要性,这种基因表达变化是由于对生物过程的一个或多个扰动导致的,以及还探究了对那种签名在附加数据集中的存在进行后续打分,作为那个过程的具体活性量值(activity amplitude)的测量。这方面的大部分工作涉及识别与疾病表型(phenotype)关联的签名并给其打分。这些得自表型的签名提供了显著的分类能力,但是缺乏单个具体扰动与该签名之间的机制或因果关系。因此,这些签名可能代表多个截然不同的未知扰动,这些扰动通过常常未知的机制导致相同的疾病表型或者得自于相同的疾病表型。
一个挑战在于理解生物系统中各个个别生物实体的活性如何使得能够激活或抑制不同的生物机制。因为个别实体,诸如基因,会在多个生物过程(例如,发炎和细胞增殖)中涉及到,所以基因的活性测量不足以识别触发该活性的底层生物过程。
发明内容
这里描述了基于从生物系统中的实体子集测出的活性数据来量化生物系统对一个或多个扰动的响应的系统与方法。当前技术既不适于识别可以在微观级导致生物实体的活性的底层机制,也不提供对不同生物机制的激活的量化评估,其中这些实体响应于可能有害的制剂和实验条件而起作用。因此,需要改进的系统和方法来鉴于生物机制而分析全系统的生物数据,并且在生物系统对制剂或者环境中的变化作出响应时量化生物系统中的变化。描述了基于测出的活性数据以及描述测量和未测量的实体之间关系的生物系统的网络模型来推断未测量的实体的活性的系统与方法。
一方面,在此所述的系统与方法针对用于量化生物系统扰动(例如,响应于诸如制剂暴露的治疗条件(treatment condition),或者响应于多种治疗条件)的计算机化方法和一个或多个计算机处理器。计算机化方法可以包括在第一处理器接收与第一组生物实体对第一治疗的响应对应的第一组治疗数据。第一生物系统包括第一组生物实体和第二组生物实体。第一生物系统中的每个生物实体与第一生物系统中的至少一个其它生物实体相互作用。计算机化方法还可以包括在第二处理器接收与第一组生物实体对与第一治疗不同的第二治疗的响应对应的第二组治疗数据。在有些实现中,第一组治疗数据代表向制剂的暴露,而第二组治疗数据是控制数据。计算机化方法还可以包括在第三处理器提供第一计算因果网络模型,所述第一计算因果网络模型代表第一生物系统。所述第一计算因果网络模型包括:代表第一组生物实体的第一组节点,代表第二组生物实体的第二组节点,连接节点并且代表生物实体之间的关系的边,及用于节点或边的方向值,代表第一控制数据与第一治疗数据之间预期的变化方向。在有些实现中,边和方向值代表节点之间的因果激活关系。
计算机化方法还可以包括利用第四处理器为第一组节点中的对应节点计算代表第一治疗数据与第二治疗数据之间的差异的第一组活性测量。
计算机化方法还可以包括基于第一计算因果网络模型和第一组活性测量,利用第五处理器为第二组节点中的对应节点生成第二组活性值。在有些实现中,生成第二组活性值包括为第二组节点中的每个特定节点选择最小化差异声明(difference statement)的活性值,所述差异声明表示特定节点的活性值与该特定节点利用第一计算因果网络模型中的边连接到的节点的活性值或活性测量之间的差异,其中差异声明依赖于第二组节点中每个节点的活性值。该差异声明可以进一步依赖于第二组节点中每个节点的方向值。在有些实现中,第二组活性值中的每个活性值是第一组活性测量中的活性测量的线性组合。特别地,该线性组合可以依赖于第一计算因果网络模型中第一组节点中的节点与第二组节点中的节点之间的边,而且还依赖于第一计算因果网络模型中第二组节点中的节点之间的边,并且可以不依赖于第一计算因果网络模型中第一组节点中的节点之间的边。
最后,计算机化方法可以包括基于第一计算因果网络模型和第二组活性值,利用第六处理器为第一计算模型生成代表由第一制剂造成的第一生物系统的扰动的得分。在有些实现中,该得分对第二组活性值具有二次依赖性(quadratic dependence)。该计算机化方法还可以包括,通过为第一组活性测量的每个活性测量形成变差估计(variation estimate)的线性组合,为第二组活性值的每个活性值提供变差估计。例如,用于第二组活性值的每个活性值的变差估计可以是用于第一组活性测量的每个活性测量的变差估计的线性组合。用于得分的变差估计可以对第二组活性值具有二次依赖性。
在有些实现中,第二组活性值被表示为第一活性值向量而且该第一活性值向量被分解成第一起作用向量和第一不起作用向量,使得第一起作用和不起作用向量之和是第一活性值向量。所述得分可以不依赖于第一不起作用向量,而且可以作为第二组活性值的二次函数来计算。在这种实现中,第一不起作用向量可以是该二次函数的内核。在有些实现中,基于与计算因果网络模型(诸如第一计算因果网络模型)关联的带符号拉普拉斯算子(signed Laplacian),第一不起作用向量是二次函数的内核。
上述活性测量(activity measure)和活性值(activity value)可以用于提供反映应用到同一生物系统的不同制剂与治疗条件之间一致或不一致的可比性信息。为此,计算机化方法还可以包括:在第一处理器接收与第一组生物实体对第三治疗的响应对应的第三组治疗数据;在第二处理器接收与第一组生物实体对第四治疗的响应对应的第四组治疗数据;利用第四处理器计算对应于第一组节点的第三组活性测量,第三组活性测量中的每个活性测量代表用于第一组节点中的对应节点的第三组治疗数据与第四组治疗数据之间的差异。计算机化方法还可以包括:基于该计算因果网络模型和第三组活性测量,利用第五处理器生成第四组活性值,第四组活性值中的每个活性值代表用于第二组节点中的对应节点的活性值;以及把第四组活性值表示为第二活性值向量。
计算机化方法还可以包括:把第二活性值向量分解成第二起作用向量和第二不起作用向量,使得第二起作用和不起作用向量之和是第二活性值向量;及比较第一和第二起作用向量。在有些实现中,比较第一和第二起作用向量包括计算第一和第二起作用向量之间的相关性,以指示第一和第二组治疗数据的可比性(comparability)。在有些实施例中,比较第一和第二起作用向量包括把第一和第二起作用向量投影到计算网络模型的带符号拉普拉斯算子的图像空间上。在有些实现中,第二组治疗数据包含与第四组治疗数据相同的信息。
上述活性测量和活性值可以用于提供反映两个不同生物系统对由相同制剂或治疗条件造成的扰动相似地响应到什么程度的可译性信息(translatability information)。为此,计算机化方法还可以包括:在第一处理器接收与第三组生物实体对与第一治疗不同的第三治疗的响应对应的第三组治疗数据,其中第二生物系统包括多个生物实体,所述生物实体包括第三组生物实体和第四组生物实体,第二生物系统中的每个生物实体都与第二生物系统中的至少一个其它生物实体相互作用。计算机化方法还可以包括:在第二处理器接收与第三组生物实体对与第三治疗不同的第四治疗的响应对应的第四组治疗数据。此外,计算机化方法还可以包括:在第三处理器提供第二计算因果网络模型,所述第二计算因果网络模型代表第二生物系统。所述第二计算因果网络模型包括:代表第三组生物实体的第三组节点,代表第四组生物实体的第四组节点,连接节点并且代表生物实体之间的关系的边,及用于节点的方向值,代表第二控制数据与第二治疗数据之间预期的变化方向。
计算机化方法还可以包括:利用第四处理器计算对应于第三组节点的第三组活性测量,第三组活性测量中的每个活性测量代表用于第三组节点中的对应节点的第三组治疗数据与第四组治疗数据之间的差异;以及基于第二计算因果网络模型和第三组活性测量,利用第五处理器生成第四组活性值,该第四组活性值中的每个活性值用于第四组节点中的对应节点。最后,计算机化方法还可以包括:比较第四组活性值与第二组活性值。在有些实现中,比较第四组活性值与第二组活性值包括:应用基于与第一计算因果网络模型关联的带符号拉普拉斯算子和与第二计算因果网络模型关联的带符号拉普拉斯算子的内核规范相关性分析(kernel canonical correlation analysis)。
在某些实现中,第一至第六处理器中的每一个都包括在单个处理器或者单个计算设备中。在其它实现中,第一至第六处理器中的一个或多个跨多个处理器或计算设备分布。
在某些实现中,计算因果网络模型包括存在于代表可能原因的节点和代表测量量的节点之间的一组因果关系。在这种实现中,活性测量可以包括倍数变化(fold-change)。倍数变化可以是描述一个节点测量在控制数据与治疗数据之间,或者在代表不同治疗条件的两组数据之间,从初始值到最终值变化了多少的数字。倍数变化数字可以代表两种条件之间生物实体活性的倍数变化的对数。对于由对应节点代表的生物实体,用于每个节点的活性测量可以包括治疗数据与控制数据之间差异的对数。在某些实现中,计算机化方法包括利用处理器为每个生成的得分生成置信间隔(confidence interval)。
在某些实现中,生物系统的子集包括,但不限于,细胞增殖机制、细胞应激机制、细胞发炎机制和DNA修复机制中的至少一个。制剂可以包括,但不限于,异类物质,包括生物系统中不存在或者不能从其得出的分子或实体。制剂还可以包括,但不限于,毒素、治疗用化合物、兴奋剂、弛缓剂、天然产物、制造产物和食品物质。制剂可以包括,但不限于,由加热烟草生成的浮质(aerosol)、由燃烧烟草生成的浮质、烟草烟雾和香烟烟雾中至少一种。制剂可以包括,但不限于,镉、汞、铬、尼古丁、特定于烟草的亚硝胺及其代谢物(4-(甲基亚硝氨基)-(3-吡啶)-1-丁酮(NNK)、N’-亚硝基降烟碱(NNN)、N-亚硝基新烟草碱(NAT)、N-亚硝基假木贼碱(NAB)及4-(甲基亚硝氨基)-1-(3-吡啶)-1-丁醇(NNAL))。在某些实现中,制剂包括用于尼古丁替代疗法的产品。
在此所述的计算机化方法可以在具有一个或多个计算设备的计算机化系统中实现,每个计算设备都包括一个或多个处理器。一般而言,在此所述的计算机化系统可以包括一个或多个引擎,所述引擎包括一个或多个处理设备,诸如计算机、微处理器、逻辑设备或者配置成具有执行在此所述计算机化方法中一个或多个的硬件、固件和软件的其它设备或处理器。在某些实现中,计算机化系统包括系统响应剖面引擎、网络建模引擎和网络评分引擎。引擎可以不时地互连,并且进一步不时地连接到一个或多个数据库,包括扰动数据库(perturbations database)、可测量值数据库(measurables database)、实验数据数据库和文献数据库。在此所述的计算机化系统可以包括具有通过网络接口通信的一个或多个处理器和引擎的分布式计算机化系统。这种实现对于经多个通信系统的分布式计算可能是合适的。
附图说明
在结合附图考虑以下具体描述之后,本公开内容的更多特征、其本质及各种优点将变得显然,贯穿所有附图相同的标号都指相同的部分,其中:
图1是用于量化生物网络对扰动的响应的说明性计算机化系统的框图。
图2是用于通过计算网络扰动量值(NPA)得分来量化生物网络对扰动的响应的说明性过程的流程图。
图3是作为系统响应剖面(systems response profile)基础的数据的图形表示,包括两个制剂、两个参数和N个生物实体的数据。
图4是具有若干生物实体及其关系的生物网络的计算模型的说明。
图5是用于量化生物系统的扰动的说明性过程的流程图。
图6是用于为一组节点生成活性值的说明性过程的流程图。
图7是用于提供可比性信息的说明性过程的流程图。
图8是用于提供可译性信息的说明性过程的流程图。
图9是用于为活性值和NPA得分计算置信间隔的说明性过程的流程图。
图10说明了具有骨干节点和支持节点的因果生物网络模型。
图11-12是用于确定NPA得分的统计显著性的说明性过程的流程图。
图13是用于识别前导骨干与基因节点的说明性过程的流程图。
图14是用于量化生物扰动的影响的示例性分布式计算机化系统的框图。
图15是可以用于实现在此所述的任何计算机化系统中任何组件的示例性计算设备的框图。
图16说明了来自利用相似(顶部)和不相似生物(底部)的两个实验的示例结果。
图17-18说明了来自用于量化生物系统的扰动的细胞培养实验的示例结果。
具体实施方式
在此所述的是当生物系统被制剂扰动时量化地评估生物系统内变化的量级的计算机化系统与方法。某些实现包括用于计算表示生物系统的一部分当中变化量级的数值的方法。该计算把从一组受控实验获得的一组数据用作输入,在这组受控实验当中,生物系统被制剂扰动。然后,数据被应用到生物系统的特征的网络模型。该网络模型用作模拟和分析的基础,并且代表启用生物系统中感兴趣的特征的生物机制和过程。该特征或者其一些机制和过程会导致疾病的病状和生物系统的不利影响。数据库中所表示的对生物系统的先前知识用于构建网络模型,该网络模型是由关于各种条件下,包括正常条件下和被制剂扰动条件下,各种生物实体的状态的数据填充的。所使用的网络模型是动态的,因为它代表各种生物实体响应于扰动的状态变化,并且可以产生制剂对生物系统的影响的量化和客观评估。还提供了用于操作这些计算机化方法的计算机系统。
除其它的之外,由本公开内容的计算机化方法生成的数值可以用于确定由制造产物(为了安全性评估或比较)、包括营养补充的治疗用化合物(为了疗效或健康益处的确定)及环境活性物质(为了对长期暴露的风险及与不利效果和疾病发作的关系的预测)造成的期望或不利生物效果的量级。
一方面,在此所述的系统与方法基于被扰动生物机制的网络模型提供了代表被扰动生物系统中变化量级的计算数值。在此被称为网络扰动量值(NPA)得分的数值可以用于概要地表示既定生物机制中各种实体的状态变化。为不同制剂或不同类型扰动获得的数值可以用于相对地比较不同制剂或扰动对生物机制的影响,作为生物系统的特征,该生物机制启用或显现它自己。因而,NPA得分可以用于测量生物机制对不同扰动的响应。术语“得分”在这里一般用于指提供生物系统中变化量级的量化测量的一个值或一组值。这种得分是通过使用本领域中已知的各种数学与计算算法中任意一种并且根据在此所公开的方法,采用从样本或主体获得的一个或多个数据集计算的。
NPA得分可以帮助研究人员和临床医生改进诊断、实验设计、治疗决定及风险评估。例如,NPA得分可以用于在毒性分析中筛查一组候选的生物机制,以识别最有可能被暴露给潜在有害的制剂所影响到那些生物机制。通过提供对扰动的网络响应的测量,这些NPA得分可以允许分子事件(如通过实验数据测出的)与在细胞、组织、器官或有机体级发生的表型或生物结果的相关。临床医生可以使用NPA值来比较受制剂影响的生物机制与患者的生理条件,以确定在暴露给该制剂时,患者最有可能经历的健康风险或益处(例如,免疫力低下的患者尤其易受造成强免疫抑制响应的制剂影响)。
在这里还描述了用于量化实验数据和生物机制的网络模型的系统与方法,以便启用对相同生物网络的不同实验之间的比较,在此被称为“可比性”。在有些实现中,可比性是通过跨实验数据集比较NPA或其它扰动量化的统计度量来量化的。可比性度量可以帮助识别,例如,两种刺激(诸如TNF和IL1a)对特定生物网络(诸如NFKB)的激活的效果是否被相同的底层生物支持。图16说明了利用相似(顶部)和不相似生物(底部)的两个实验的示例结果。跨所有的测量节点,在顶部的结果中,实验1导致实验系统大约2倍于实验2的响应,这指示实验2诱发与实验1相同的底层生物,尽管程度比较小。在底部的结果中,实验1和实验2之间的每个测量的实验系统响应之间没有相关性,这意味着(除两个实验都得出相同的平均实验响应的事实之外)被两个实验诱发的生物不可比。当比较不同的暴露或者跨不同剂量的相同暴露时,在此所述的可比性测量可以用于识别网络中相似或不相似的生物。这种测量可以把生物学家指引到网络中为了正确理解实验结果或生物响应的其它量化,诸如NPA得分,而需要更深入分析的区域。
在此还描述了用于量化实验数据和生物机制的网络模型的系统与方法,以便使得可以在物种、系统或机制之间相似的生物网络之间进行比较,在此被称为“可译性”。可译性测量提供这种物种、系统或机制之间实验扰动数据与得分(诸如NPA得分)的适用性的指示。例如,在此所述的可译性测量可以用于比较活体实验与试管实验、小鼠实验与人体试验、大鼠实验与人体实验,小鼠实验与大鼠实验、、非人灵长类实验与人体实验以及暴露给不同治疗(诸如暴露给制剂)的其它可比物种、系统或机制。
图1是用于量化网络模型对扰动的响应的计算机化系统100的框图。具体地,系统100包括系统响应剖面引擎110、网络建模引擎112和网络评分引擎114。引擎110、112和114不时地互连,并且进一步不时地连接到一个或多个数据库,包括扰动数据库102、可测量值数据库104、实验数据数据库106和文献数据库108。如在此所使用的,引擎包括一个或多个处理设备,诸如计算机、微处理器、逻辑设备或者如关于图14所描述的、配置成具有执行一个或多个计算机化操作的硬件、固件和软件的一个或多个其它设备。
图2是根据一种实现、用于通过计算网络扰动量值(NPA)得分来量化生物网络对扰动的响应的过程200的流程图。过程200的步骤将描述为由图1的系统100的各种组件来执行,但是这些步骤中任意步骤都可以由任何合适的硬件或软件组件、本地或远程执行,并且可以任何适当的次序安排或者并行执行。在步骤210,系统响应剖面(SRP)引擎110从多个不同的源接收生物数据,而且数据本身可以是多种不同类型。数据包括来自其中生物系统被扰动的实验的数据,以及控制数据。在步骤212,SRP引擎110生成系统响应剖面(SRP),SRP是生物系统中一个或多个实体响应于制剂对生物系统的提供而变化的程度的表示。在步骤214,网络建模引擎112提供包含多个网络模型的一个或多个数据库,其中一个模型被选择为与感兴趣的制剂或特征相关。选择可以基于对作为该系统的生物功能基础的机制的现有知识来进行。在某些实现中,网络建模引擎112可以利用系统响应剖面、数据库中的网络和先前在文献中描述过的网络来提取系统中实体之间的因果关系,由此生成、精细化或扩展网络模型。在步骤216,网络评分引擎114利用在步骤214中被网络建模引擎112识别出的网络和在步骤212由SRP引擎110生成的SRP为每个扰动生成NPA得分。在(由网络表示的)生物实体之间的底层关系的背景下,NPA得分量化对扰动或治疗的生物响应(由SRP表示)。为了公开内容的清晰但不是作为限制,以下描述被分成子部分。
本公开内容背景下的生物系统是有机体或者有机体的一部分,包括功能部分,有机体在这里被称为主体。主体通常是哺乳动物,包括人。主体可以是人类总体当中个别的人。如在此所使用的,术语“哺乳动物”包括但不限于人、非人的灵长类动物、小鼠、大鼠、狗、猫、牛、羊、马和猪。除人以外的哺乳动物可以有利地用作可以用于提供人类疾病模型的主体。非人主体可以是未修改的,或者是基因修改的动物(例如,转基因动物,或者携带一个或多个基因突变或者沉默基因的动物)。主体可以是雄性或雌性。依赖于操作的目标,主体可以是已经暴露给感兴趣的制剂的主体。主体可以是已经在延长的时间段上暴露给一种制剂,可选地包括研究之前的时间,的主体。主体可以是暴露给一种制剂一段时间但不再与该制剂接触的主体。主体可以是已经被诊断或识别出有一种疾病的主体。主体可以是已经接受过或者正在接受疾病或不利健康状况治疗的主体。主体还可以是呈现具体健康状况或疾病的一个或多个症状或风险因素的主体。主体可以是易感染一种疾病的主体,而且可以是有征兆的或者无征兆的。在某些实现中,所讨论的疾病或健康状况与在延长的时间段上暴露给一种制剂或者使用一种制剂有关。根据有些实现,系统100(图1)包含或生成与感兴趣的一种类型的扰动或结果相关的一个或多个生物系统及其功能机制(统称为“生物网络”或“网络模型”)的计算机化模型。
依赖于操作的背景,生物系统可以在不同层次定义,这是它涉及群体中个别有机体,一般是一个有机体,器官、组织、细胞类型、细胞器官、细胞成分或者具体个体细胞的功能。每个生物系统都包括一个或多个生物机制或过程,其操作表现为系统的功能特征。再现人类健康状况的既定特征并且适于暴露给感兴趣的制剂的动物系统是优选的生物系统。反映疾病病因学或病理学中所涉及的细胞类型和组织的细胞和器官系统也是优选的生物系统。对于概括尽可能多活体人类生物的主要细胞或器官培养可以给予优先级。匹配试管人类细胞培养与得自活体动物模型的最等效培养也是重要的。这确保利用匹配的试管系统作为参考系统来产生从动物模型到人类生物的翻译连续(translational continuum)。因此,预期供在此所述的系统与方法使用的生物系统可以通过但不限于由功能特征(生物功能、生理功能或者细胞功能)、细胞器官、细胞类型、组织类型、器官、发育阶段或者以上所述的组合来定义。生物系统的例子包括,但不限于,肺、外皮、骨骼、肌肉、神经(中枢和外围)、内分泌、心血管、免疫、循环、呼吸、泌尿、肾脏、肠胃、结肠直肠、肝脏和生殖系统。生物系统的其它例子包括,但不限于,上皮细胞、神经细胞、血细胞、结缔组织细胞、平滑肌细胞、骨骼肌肉细胞、脂肪细胞、卵细胞、精子细胞、干细胞、肺细胞、脑细胞、心肌细胞、喉细胞、咽细胞、食道细胞、胃细胞、肾细胞、肝细胞、乳腺细胞、前列腺细胞、胰腺细胞、岛细胞、睾丸细胞、膀胱细胞、宫颈细胞、子宫细胞、结肠细胞及直肠细胞中的各种细胞功能。有些细胞可以是在适当的培养条件下在试管中培养或者无限地在试管中维持的细胞系的细胞。细胞功能的例子包括,但不限于,细胞增殖(例如,细胞分裂)、退化、再生、老化、由细胞核对细胞活性的控制、细胞到细胞的信令、细胞分化、细胞去分化、分泌、迁移、吞噬作用、修复、细胞凋亡及发育规划(developmental programming)。可以被当作生物系统的细胞成分的例子包括,但不限于,细胞质、细胞骨架、隔膜、核糖体、线粒体、核子、内质网(ER)、高尔基体、溶酶体、DNA、RNA、蛋白质、肽及抗体。
生物系统中的扰动会由于一个或多个制剂在一段时间上通过暴露或者与生物系统的一个或多个部分接触而造成。制剂可以是单一的物质或者是物质的混合,包括其中不是所有组成成分都被识别或特征化的混合物。制剂或者其组成成分的化学与物理属性可能没有被完全特征化。制剂可以通过其结构、其组成成分或者在某种条件下产生该制剂的源来定义。制剂的一个例子是异类物质,即,生物系统中不存在或者不能从其得到的分子或实体,以及在接触生物系统之后从其产生的任何中间物或代谢物。制剂可以是碳水化合物、蛋白质、脂质、核酸、生物碱、维生素、金属、重金属、矿物质、氧、离子、酶、激素、神经传递素、无机化学化合物、有机化学化合物、环境制剂、微生物、颗粒、环境条件、环境力或者物理力。制剂的非限制性例子包括,但不限于,养分、代谢废物、毒药、麻醉剂、毒素、治疗用化合物、兴奋剂、弛缓剂、天然产物、制造产物、食品物质、病原体(朊病毒、病毒、细菌、真菌、原生动物)、其尺寸处于微米范围或者更小的颗粒或实体,以上所述的副产品及以上所述的混合物。物理制剂的非限制性例子包括辐射、电磁波(包括太阳光)、温度的增加或降低、剪切力、流体压力、放电或者一系列放电,或者外伤。
有些制剂不会扰动生物系统,除非它以阈值浓度存在或者它与生物系统接触一段时间,或者这二者的组合。可以根据剂量来量化导致扰动的制剂的暴露或接触。因而,扰动会由于长期暴露给制剂而产生。暴露周期可以通过时间单位、通过暴露频率或者通过主体实际或估计的生命周期内的时间百分比来表示。扰动还会由于停止制剂(如上所述)给生物系统的一个或多个部分的供给或者限制制剂对其的供给而造成。例如,扰动会由于养分、水、碳水化合物、蛋白质、脂质、生物碱、维生素、矿物质、氧气、离子、酶、激素、神经传递素、抗体、细胞因子、光的减少供给或缺乏或者由于约束有机体某些部分的运动或者由于强迫或要求锻炼而造成。
依赖于生物系统的哪个(哪些)部分被暴露以及暴露状况,制剂会造成不同的扰动。制剂的非限制性例子可以包括由于加热烟草生成的浮质、燃烧烟草生成的浮质、烟草烟雾和香烟烟雾及其任何气体成分或颗粒成分中的任一种。制剂的更多非限制例子包括镉、汞、铬、尼古丁、特定于烟草的亚硝胺及其代谢物(4-(甲基亚硝氨基)-(3-吡啶)-1-丁酮(NNK)、N’-亚硝基降烟碱(NNN)、N-亚硝基新烟草碱(NAT)、N-亚硝基假木贼碱(NAB)及4-(甲基亚硝氨基)-1-(3-吡啶)-1-丁醇(NNAL)),以及用于尼古丁替代疗法的任何产品。制剂或复杂刺激的暴露方式应当反映日常设置中暴露的范围和条件。一组标准的暴露方式可以设计成系统地应用到同等地良好定义的实验系统。每个试验可以设计成收集依赖时间与剂量的数据,以便捕捉早期和晚期事件并且确保代表性的剂量范围被覆盖。但是,本领域普通技术人员将理解,在此所述的系统与方法可以被适配和修改以便适用于所针对的应用,而且在此设计的系统与方法可以在其它合适的应用中采用,而且此类其它的添加与修改将不背离本发明的范围。
在各种实现中,在包括对应控制的各种条件下,为基因表达、蛋白质表达或周转(turnover)、微RNA表达或周转、翻译后修改、蛋白质修改、迁移、抗体产生代谢剖面或者以上所述两个或更多个的组合生成高吞吐量的全系统测量。功能结果测量在这里所述的方法中是期望的,因为它们可以总体上用作评估的依靠并且代表疾病病因学中的清晰步骤。
如在此所使用的,“样本”指与主体或实验系统隔离的任何生物样本(例如,细胞、组织、器官或者整个动物)。样本可以包括,但不限于,单个细胞或多个细胞、细胞片段、组织活检、被切除的组织、组织提取物、组织、组织培养提取物、组织培养基、呼出的气体、全血、血小板、血清、血浆、红血球、白血球、淋巴细胞、嗜中性白细胞、巨噬细胞、B细胞或者其子集、T细胞或者其子集、造血细胞的子集、内皮细胞、滑液、淋巴液、腹水、间质液、骨髓、脑脊髓液、胸腔积液、肿瘤浸润、唾液、黏液、痰、精液、汗、尿或者任何其它体液。样本可以通过包括,但不限于,静脉穿刺、排泄、活组织检查、针穿刺、灌洗、刮削、手术切除的手段或者本领域中已知的其它手段从主体获得。
在操作过程中,对于给定的生物机制、结果、扰动或者以上所述的组合,系统100可以生成网络扰动量值(NPA)值,这是网络中生物实体响应于治疗条件的状态变化的量化测量。
系统100(图1)包括一个或多个计算机化网络模型,这些网络模型与感兴趣的健康状况、疾病或者生物结果相关。这些网络模型中的一个或多个是基于现有的生物知识并且可以从外部源上载并且在系统100中产生。模型还可以基于测量在系统100中重新生成。通过现有知识的使用,可测量的元素有原因地集成到生物网络模型中。以下所述的是代表感兴趣生物系统中的变化或代表对扰动的响应的数据类型,其中所述变化可以用于生成或精细化网络模型。
参考图2,在步骤210,系统响应剖面(SRP)引擎110接收生物数据。SRP引擎110可以从许多不同的源接收这种数据,而且数据本身可以是多种不同的类型。SRP引擎110所使用的生物数据可以从文献、数据库(包括来自药品或医疗设备在临床前、临床和临床后试验的数据)、基因组数据库(基因组序列和表达数据,例如,由国家生物技术信息中心进行的基因表达综合(Gene ExpressionOmnibus)或者由欧洲生物信息研究所进行的阵列实验(ArrayExpress)(Parkinson等人,2010,Nucl.Acids Res.,doi:10.1093/nar/gkq1040.Pubmed ID21071405))、商业可用的数据库(例如,基因逻辑(Gene Logic),Gaithersburg,MD,USA)或者实验工作取得。数据可以包括来自一个或多个不同源的原始数据,诸如利用为研究特定治疗条件或暴露给特定制剂的效果而具体设计的一个或多个物种的试管、体外、体内实验。试管实验系统可以包括代表人类疾病的关键方面的组织培养或器官培养(三维培养)。在这种实现中,用于这些实验的制剂剂量与暴露方式可以基本上反映在日常使用或活性条件下或者在特殊使用或活性条件下可以对人预期的暴露范围与条件。实验参数与测试条件可以根据期望来选择,以反映制剂的本性与暴露条件、所讨论的生物系统的分子与过程、所涉及的细胞类型与组织、感兴趣的结果以及疾病病因学的各方面。特定的从动物模型导出的分子、细胞或组织可以与特定的人类分子、细胞或组织培养匹配,以改进基于动物的发现的可译性。
除其它的之外,由SRP引擎110接收的数据包括,但不限于,某些条件下,涉及核酸(例如,具体DNA或RNA种属的绝对或相对量,DNA序列、RNA序列的变化,三级结构的变化,或者如通过序列化、杂交-尤其是对于微阵列上的核酸、量化的聚合酶链反应,或者本领域中已知的其它技术确定的甲基化模式)、蛋白质/缩氨酸(例如,蛋白质的绝对或相对量,蛋白质、缩氨酸的具体片段,二级或三级结构的变化,或者如由本领域中已知的方法确定的转译后的修改)及功能活性(例如,酶活性、蛋白水解活性、转录调节活性、运输活性、到某些绑定合作伙伴的绑定亲和力)的数据,这些数据中许多都是由高吞吐量实验技术生成的。包括蛋白质或缩氨酸的转译后修改的修改可以包括,但不限于,甲基化、乙酰化、法尼基化、生物素化、硬脂化、甲酰化、豆蔻酰化、棕榈酰化、香叶酰化、聚乙二醇化、磷酸化、硫酸化、糖基化、糖修改、脂化、脂质修改、泛素化、蛋白质修饰化、二硫化物键合、胱氨酸化、氧化、谷胱甘肽化、羧化、葡萄糖醛酸化及脱氨基。此外,蛋白质可以在转译后通过一系列反应被修改,诸如阿马道里(Amadori)反应、希夫碱(Schiffbase)反应及导致糖化的蛋白质产物的美拉德(Maillard)反应。
数据还可以包括测出的功能结果,诸如,但不限于,在细胞级包括细胞增殖、发育命运及细胞死亡的那些功能结果,在生理级包括肺容量、血压、锻炼能力的那些功能结果。数据还可以包括疾病活性或严重性的测量,诸如但不限于在疾病某个阶段的肿瘤转移、肿瘤缓解、功能丧失以及生命期望值。疾病活性可以通过临床评估来测量,其结果是一个值或者一组值,这些值可以从既定条件下对来自一个或多个主体的样本(或者样本总体)的评价来获得。临床评估还可以基于由主体对采访或问卷调查提供的响应。
这种数据可能已经明确地生成,用于确定系统响应剖面,或者可能已经在先前的实验中产生或者在文献中发表。一般来说,数据包括关于分子、生物结构、生理条件、遗传性状或表型的信息。在有些实现中,数据包括分子、生物结构、生理条件、遗传性状或表型的条件、位置、数量、活性或子结构的描述。如随后将描述的,在临床设置中,数据可以包括从对样本执行的试验或者关于人类主体的观察获得的原始或处理过的数据,其中样本是从暴露给制剂的人类主体获得的。
在步骤212,系统响应剖面(SRP)引擎110基于在步骤212接收到的生物数据生成系统响应剖面(SRP)。这个步骤可以包括本底校正、正规化、倍数变化计算、显著性确定及差异响应(例如,差异表达的基因)识别中的一个或多个。SRP是表达生物系统内一个或多个被测实体(例如,分子、核酸、缩氨酸、蛋白质、细胞等)响应于施加到该生物系统的扰动(例如,暴露给制剂)而个别变化的程度的表示。在一个例子中,为了生成SRP,SRP引擎110收集用于应到给定实验系统(例如,“系统-治疗”对)的一组给定参数(例如,治疗或扰动条件)的一组测量。图3说明了两个SRP:包括用于利用变化的参数(例如,暴露给第一治疗制剂的剂量和时间)接受第一治疗306的N个不同生物实体的生物活性数据的SRP302,和包括用于接受第二治疗308的这N个不同生物实体的生物活性数据的类似的SRP304。SRP中所包括的数据可以是原始实验数据、处理过的实验数据(例如,被过滤以除去离群值、利用置信估计做标记、对多次试验求平均)、通过计算生物模型生成的数据,或者取自科学文献的数据。SRP可以用任意数量的途径表示数据,诸如绝对值、绝对变化、倍数变化、对数变化、函数和表。SRP引擎110把SRP传递到网络建模引擎112。
虽然在前面步骤中得出的SRP代表将从其确定网络扰动量级的实验数据,但生物网络模型才是用于计算和分析的基础。这种分析需要开发与生物系统特征相关的机制与过程的具体网络模型。这种框架提供了超出已经在更经典基因表达分析中所使用的基因列表检查的一层机制理解。生物系统的网络模型是代表动态生物系统并且通过组装关于生物系统的各种基本属性的量化信息来建立的数学结构。
这种网络的构造是一个迭代过程。网络边界的勾勒是通过与感兴趣的过程(例如,肺中的细胞增殖)相关的机制与过程的文献调查指导的。描述这些过程的因果关系从先前的知识提取,以便使网络成核。基于文献的网络可以利用包含相关表型端点的高吞吐量数据集来验证。SRP引擎110可以用于分析数据集,其结果可以用于确认、精细化或生成网络模型。
参考图2,在步骤214,利用基于作为感兴趣生物系统特征基础的机制或过程的网络模型,网络建模引擎112使用来自SRP引擎110的系统响应剖面。在某些方面,网络建模引擎112用于识别已经基于SRP生成的网络。网络建模引擎112可以包括用于接收对模型的更新和变化的组件。网络建模引擎112还可以通过结合新的数据并且生成附加的或者精细化的网络模型,迭代网络生成过程。网络建模引擎112还可以方便一个或多个数据集的融合或者一个或多个网络的融合。取自数据库的网络集合可以通过附加的节点、边或者全新的网络手动补充(例如,通过挖掘文献文字以获得对直接被特定生物实体调节的附加基因的描述)。这些网络包含可以启用过程打分的特征。网络拓扑结构被维持;因果关系的网络可以从网络中任何点被跟踪到可测量的实体。另外,模型是动态的而且用于建立它们的假设可以被修改或重新声明并且启用区分组织上下文与物种的适应性。这在新知识变得可用时允许迭代测量和改进。网络建模引擎112可以除去具有低可信度或者是科学文献中冲突的实验结果的主体的节点或边。网络建模引擎112还可以包括可以利用被监督或不被监督的学习方法(例如,度量学习、矩阵完成(matrix completion)、模式识别)推断的附加节点或边。
在某些方面,生物系统被建模为包含顶点(或节点)和连接节点的边的数学图。例如,图4说明了具有9个节点(包括节点402和404)和边(406和408)的简单网络400。节点可以代表生物系统中的生物实体,诸如但不限于化合物、DNA、RNA、蛋白质、缩氨酸、抗体、细胞、组织和器官。边可以代表节点之间的关系。图中的边可以代表节点之间的各种关系。例如,边可以代表“绑定到”关系、“在…中表达”关系、“基于表达成型(expression profiling)共同调节的”关系、“抑制”关系、“在手稿中共存”关系或者“共享结构性元素”关系。一般而言,这些类型的关系描述了一对节点之间的关系。图中的节点还可以代表节点之间的关系。因而,有可能表示关系之间的关系,或者一个关系和图中所表示的另一种类型的生物实体之间的关系。例如,代表化学物的两个节点之间的关系可以代表反应。这种反应可以是该反应与抑制该反应的化学物之间的关系中的一个节点。
图可以是无向的,意味着在与每条边关联的两个顶点之间没有区别。作为替代,图的边可以从一个顶点指向另一个顶点。例如,在生物背景下,转译调节网络和代谢网络可以建模为有向图。在转译调节网络的图模型中,节点将代表基因,边表示它们之间的转译关系。作为另一个例子,蛋白质-蛋白质相互作用网络描述了有机体蛋白质组中蛋白质之间的直接物理相互作用并且在这种网络中常常没有与相互作用关联的方向。因而,这些网络可以建模为无向图。某些网络可以既有有向的边又有无向的边。构成图的实体和关系(即,节点和边)可以作为相互关连的节点的网存储在系统100中的数据库中。
数据库中所代表的知识可以是取自各种不同源的各种不同类型。例如,某些数据可以代表基因组数据库,包括关于基因的信息以及它们之间的关系。在这种例子中,一个节点可以代表致癌基因,而连接到该致癌基因节点的另一个节点可以代表抑制该致癌基因的基因。数据可以代表蛋白质以及它们之间的关系、疾病和它们的相互关连,以及各种疾病状态。有许多不同类型的数据可以在图形化的表示中组合。计算模型可以代表节点之间的关系网,其中节点代表例如DNA数据集、RNA数据集、蛋白质数据集、抗体数据集、细胞数据集、组织数据集、器官数据集、医疗数据集、流行病数据集、化学物数据集、毒物数据集、患者数据集和人口数据集中的知识。如在此所使用的,数据集是在既定条件下从对一个样本(或一组样本)进行评价所得到的数值的集合。数据集可以通过例如实验测量样本的可量化实体来获得;或者作为替代,或者从诸如实验室的服务提供者、临床研究机构或者从公共或私人数据库获得。数据集可以包含数据和由节点表示的生物实体,而且每个数据集中的节点可以关连到同一数据集中或者其它数据集中的其它节点。而且,网络建模引擎112可以生成代表从例如DNA、RNA、蛋白质或抗体数据集中的基因信息到医疗数据集中的医疗信息再到患者数据集中关于个别患者的信息再到流行病数据集中关于整个人口的信息的计算模型。除了以上所述的各种数据集,还可以有许多其它数据集或者在生成计算模型时可以包括的生物信息类型。例如,数据库可以进一步包括医疗记录数据、结构/活性关系数据、关于感染性病变的信息、关于临床试验的信息、暴露模式数据、关于一种产品的使用历史的数据,以及任何其它类型的生命科学相关的信息。
网络建模引擎112可以生成代表例如基因之间调节相互作用、蛋白质之间相互作用或者细胞或组织内部复杂的生化相互作用的一个或多个网络模型。由网络建模引擎112生成的网络可以包括静态与动态模型。网络建模引擎112可以采用任何适用的数学方案来表示系统,诸如超图和加权二分图(bipartite graph),其中两种类型的节点用于表示反应和化合物。网络建模引擎112还可以使用其它推理技术来生成网络模型,诸如基于对差异表达基因中功能相关的基因的过表示的分析,贝叶斯网络分析、图形高斯模型技术或者基因相关性网络技术,来基于一组实验数据(例如,基因表达、代谢浓度、细胞反应等)识别相关的生物网络。
如上所述,网络模型是基于作为生物系统功能特征的基础的机制与过程。网络建模引擎112可以生成或包含代表关于与制剂的长期健康风险或健康益处的研究相关的生物系统特征的结果的模型。因此,网络建模引擎112可以生成或包含用于细胞功能的各种机制的网络模型,尤其是关于生物系统中感兴趣的特征或者对其起作用的那些细胞功能,包括但不限于细胞增殖、细胞应激、细胞再生、细胞凋亡、DNA损坏/修复或者炎症反应。在其它实施例中,网络建模引擎112可以包含或生成与急性全身毒性、致癌性、皮肤渗透、心血管疾病、肺病、生态毒性、眼睛冲洗/腐蚀、基因毒性、免疫毒性、神经毒性、药代动力学、药物代谢、器官毒性、生殖与发育毒性、皮肤刺激/腐蚀或者皮肤致敏相关的计算机化模型。一般而言,网络建模引擎112可以包含或生成用于核酸(DNA、RNA、SNP、siRNA、miRNA、RNAi)、蛋白质、缩氨酸、抗体、细胞、组织、器官以及任何其它生物实体的状态,及其对应相互作用的计算机化模型。在一个例子中,计算网络模型可以用于表示免疫系统的状态及免疫响应或炎症反应过程中各种类型白血细胞的机能。在其它例子中,计算网络模型可以用于表示心血管系统的性能及内皮细胞的机能与代谢。
在本公开内容的有些实现中,网络取自因果关系生物知识的数据库。这种数据库可以通过对不同生物机制执行实验研究以提取机制之间的关系(例如,激活或抑制关系)来生成,其中一些关系可以是因果关系,而且可以与商业可用的数据库,诸如由位于美国麻省剑桥市的Selventa公司产生的Genstruct技术平台或者Selventa知识库,组合。利用因果生物知识数据库,网络建模引擎112可以识别链接扰动102和可测量值104的网络。在某些实现中,网络建模引擎112利用来自SRP引擎110的系统响应剖面和之前在文献中生成的网络提取生物实体之间的因果关系。除其它的处理步骤之外,数据库可以被进一步处理,以除去逻辑不一致性并通过在不同的生物实体集合之间应用同源推理(homologous reasoning)来生成新生物知识。
在某些实现中,从数据库提取出的网络模型是基于反向因果推理(RCR),一种自动化的推理技术,这种技术处理因果关系网络来用公式表达机制假说,然后对照差异测量数据集评价那些机制假说。每个机制假说都把一个生物实体链接到它可以影响的可测量量。例如,除其它的之外,可测量量可以包括浓度的增加或减小、生物实体的个数或相对充裕度(abundance)、生物实体的激活或抑制,或者生物实体结构、功能或逻辑的变化。RCR使用生物实体之间有向的实验观察因果相互作用网络作为计算的基础。有向网络可以用生物表达语言(Biological Expression LanguageTM)(BELTM)表达,这是用于记录生物实体之间相互关系的一种语法。RCR计算规定用于网络模型生成的某些约束,诸如但不限于路径长度(连接上游节点和下游节点的边的最大条数),以及把上游节点连接到下游节点的可能因果路径。RCR的输出是代表实验测量中差异的上游控制器的一组机制假说,通过评价相关性与准确性的统计数据给这组假说分级。机制假说输出可以组装成因果链并且越大的网络以越高的互连机制与过程级解释数据集。
一种类型的机制假说包括在代表可能原因的节点(上游节点或控制器)与代表测量量的节点(下游节点)之间的一组因果关系。这种类型的机制假说可以用于进行预测,诸如,如果上游节点表示的实体的充裕度增加,则推断出由因果增加关系链接的下游节点将增加,而且推断出由因果减少关系链接的下游节点将减少。
机制假说表示一组测量数据,例如基因表达数据,与作为那些基因的已知控制器的生物实体之间的关系。此外,这些关系包括上游实体之间的影响的符号(正或负)及下游实体(例如,下游基因)的差异表达。机制假说的下游实体可以取自文献产生的因果生物知识的数据库。在某些实现中,以可计算的因果网络模型的形式,把上游实体链接到下游实体的机制假说的因果关系是由NPA打分方法用于计算网络变化的基础。
在某些实现中,通过收集模型中表示生物系统中各种特征的个别机制假说并且把所有下游实体(例如,下游基因)的连接重新分组到单个上游实体或过程,生物实体的复杂因果网络模型可以变换成单个因果网络模型,由此来表示整个复杂因果网络模型;这本质上是底层图结构的扁平化。因而,如在网络模型中所表示的生物系统的特征与实体的变化可以通过组合个别的机制假说来评估。在有些实现中,因果网络模型中的一个节点子集(在这里被称为“骨干节点”)代表对应于不测量或者不能常规或经济地测量的实体的第一组生物实体,例如,生物系统中关键角色的生物机制或活性;还有另一个节点子集(在这里被称为“支持节点”)代表生物系统中可以被测量并且其值是实验确定并且在数据集中给出以便计算例如生物系统中多个基因的表达级别的第二组生物实体。图10绘出了一个示例性网络,该网络包括四个骨干节点1002、1004、1006和1008,及骨干节点之间和从骨干节点到支持基因表达节点组1010、1012和1014的边。图10中的每条边都是有向的(即,代表原因和效果关系的方向)和带符号的(即,代表正或负调节)。这种类型的网络可以代表在某些生物实体或机制(例如,范围从具体到如特定酶的充裕度或激活的增加的量到复杂到如反映生长因素信令过程状态的量)与被正或负调节的其它下游实体(例如,基因表达级别)之间存在的一组因果关系。
在某些实现中,当细胞暴露给香烟烟雾时,系统100可以包含或者生成用于细胞增殖机制的计算机化模型。在这种例子中,系统100还可以包含或生成代表与香烟烟雾暴露相关的各种健康状况的一个或多个网络模型,其中的健康状况包括但不限于癌症、肺病和心血管疾病。在某些方面,这些网络模型是基于所施加的扰动(例如,暴露给制剂)、各种条件下的响应、感兴趣的可测量量、所研究的结果(例如,细胞增殖、细胞应激、发炎、DNA修复)、实验数据、临床数据、流行病数据和文献中的至少一个。
作为一个说明性例子,网络建模引擎112可以配置为用于生成细胞应激的网络模型。网络建模引擎112可以接收描述从文献数据库已知的应激响应中所涉及的相关机制的网络。网络建模引擎112可以基于已知响应于肺和心血管背景下应激而操作的生物机制选择一个或多个网络。在某些实现中,网络建模引擎112识别生物系统中的一个或多个功能单元并且通过基于它们的功能性组合较小的网络来建立更大的网络。特别地,对于细胞应激模型,网络建模引擎112可以考虑与对氧化、基因毒性、缺氧、渗透、异型生物质和剪切力的响应相关的功能单元。因此,用于细胞应激模型的网络组件可以包括异型生物质代谢响应、基因毒性应激、内皮剪切力、缺氧响应、渗透应力和氧化应力。网络建模引擎112还可以从公共可用的转录数据的计算分析接收内容,这些转录数据是来自在特定细胞组中执行的应力相关实验。
当生成生物机制的网络模型时,网络建模引擎112可以包括一条或多条规则。这种规则可以包括用于选择网络内容、节点类型等的规则。网络建模引擎112可以从实验数据数据库106选择一个或多个数据集,包括试管和活体实验结果的组合。网络建模引擎112可以利用实验数据来验证在文献中识别出的节点与边。在建模细胞应激的例子中,网络建模引擎112可以基于实验多好地表示无病的肺或心血管组织中生理相关应力来选择用于实验的数据集。数据集的选择可以基于,例如,表型应力端点数据的可用性、基因表达概述实验的统计严密性以及实验背景与正常无病的肺或心血管生物学的相关性。
在识别出相关网络的集合之后,网络建模引擎112可以进一步处理并精细化那些网络。例如,在有些实现中,多个生物实体及它们的连接可以分组并且被新的一个或多个节点表示(例如,利用群集或者其它技术)。
网络建模引擎112还可以包括关于所识别出的网络中的节点与边的描述性信息。如以上所讨论的,例如,节点可以通过其关联的生物实体、相关联的生物实体是否是可测量量的指示或者生物实体的任何其它描述符来描述,而边可以通过它所代表的关系类型(例如,诸如上调节或下调节的因果关系、相关、条件依赖或独立)、那个关系的强度或者那个关系中的统计置信度来描述。在有些实现中,对于每种治疗,表示可测量实体的每个节点都与响应于该治疗而活性变化的预期方向(即,增加或减少)关联。例如,当支气管上皮细胞暴露给诸如肿瘤坏死因子(TNF)的制剂时,特定基因的活性可以增加。这种增加可能由于从文献知道(并且在由网络建模引擎112识别出的一个网络中表示)或者由通过由网络建模引擎112识别出的一个或多个网络的边来跟踪多个调节关系(例如,自分泌信令)知道的直接调节关系所导致。在有些情况下,响应于特定的扰动,网络建模引擎112可以为每个可测量的实体识别预期的变化方向。当网络中的不同过程对于一个特定实体指示矛盾的预期变化方向时,可以更具体地检查这两个过程,以确定净变化方向,或者那个特定实体的测量可以被丢弃。
这里提供的计算方法与系统基于实验数据与计算网络模型计算NPA得分。计算网络模型可以由系统100生成、导入系统100中或者在系统100中识别(例如,从生物知识的数据库)。被识别为网络模型中扰动的下游效果的实验测量在生成特定于网络的响应得分时组合。因此,在步骤216,网络评分引擎114利用在步骤214由网络建模引擎112识别出的网络和在步骤212由SRP引擎100生成的SRP为每个扰动生成NPA得分。在生物实体的底层关系(用识别出的网络标识)的背景下,NPA得分量化对治疗的生物响应(用SRP表示)。网络评分引擎114可以包括用于为网络建模引擎112中所包含的或者被其识别出的每个网络生成NPA得分的硬件与软件组件。
网络评分引擎114可以配置为实现多种技术中任意一种,包括生成指示网络对扰动的响应的量级与拓扑分布的标量-或向量-值得分的技术。
在某些应用中,额外的评分技术可以有利地应用,并且可以扩展成启用关于相同生物网络的不同实验之间的比较(在这里被称为“可比性”)或者物种、系统或机制之间类似生物网络之间的比较(在这里被称为“可译性”)。现在描述多种评分技术及用于评估可比性和可译性的技术。
图5是用于量化响应于制剂的生物系统扰动的说明性过程500的流程图。例如,过程500可以由网络评分引擎114或者系统100的任何其它合适配置的一个或多个组件实现。特别地,第一组生物实体可以被测量(即,对第一组生物实体测量治疗数据和控制数据),而第二组生物实体不能测量(即,不对第二组生物实体测量治疗数据和控制数据)。出于任何数量的原因,可能不能为第二组生物实体容易地获得数据(或者只能获得有限的量)。作为例子,对应于第二组生物实体的数据可能是特别难获得的,或者第二组生物实体可能与另一组容易测量的生物实体相关,使得数据可以从可测量的集合合理地推断。
为了量化响应于制剂的生物系统的扰动,网络评分引擎114可以计算NPA得分,这是代表生物机制对扰动的响应的数值。计算NPA得分的一条途径是只使用直接测出的数据(即,对应于以上例子中第一组生物实体)。但是,这种方法局限于有可能用于确定扰动对生物机制影响的数据子集。具体地,可以存在不直接测量但是可以提供用于NPA得分的信息的另一组生物实体(即,对应于以上例子中第二组生物实体)。在这种情况下,未测量的生物实体集合可以与测出的集合相关,使得网络评分引擎114可以从可测量的集合推断与未测量集合相关的数据。因而,NPA得分可以基于测出的数据、推断出的数据或者这二者的组合。图5中的过程500描述了基于推断出的数据计算NPA得分的方法。
在步骤502,网络评分引擎114接收用于生物系统中第一组生物实体的治疗与控制数据。治疗数据对应于第一组生物实体对制剂的响应,而控制数据对应于第一组生物实体对缺乏该制剂的响应。生物系统包括第一组生物实体(在步骤502中为其接收了治疗和控制数据),以及第二组生物实体(没有为其接收治疗和控制数据)。生物系统中的每个生物实体与该生物系统中的至少一个其它生物实体相互作用,并且特别地,第一组中的至少一个生物实体与第二组中的至少一个生物实体相互作用。生物系统中生物实体之间的关系可以由一个计算网络模型来表示,这个模型包括代表第一组生物实体的第一组节点、代表第二组生物实体的第二组节点、以及连接节点并且代表生物实体之间关系的边。该计算网络模型还可以包括用于节点的方向值,这代表控制与治疗数据之间预期的变化方向(例如,激活或抑制)。以上具体描述了这种网络模型的例子。
在步骤504,网络评分引擎114为第一组生物实体中的生物实体计算活性测量。第一组活性测量中的每个活性测量代表对于第一组中一个特定生物实体的治疗数据与控制数据之间的差异。因为第一组生物实体与计算网络模型中第一组节点之间的对应性,所以步骤504也为计算网络模型中的第一组节点计算活性测量。在有些实现中,活性测量可以包括倍数变化。倍数变化可以是描述一个节点测量在控制数据与治疗数据之间,或者在代表不同治疗条件的两组数据之间,从初始值到最终值变化了多少的一个数字。倍数变化数字可以代表两种条件之间生物实体活性的倍数变化的对数。用于每个节点的活性测量可以包括,对于由对应节点表示的生物实体,治疗数据与控制数据之间的差异的对数。在某些实现中,计算机化方法包括利用处理器生成用于每个所生成得分的置信间隔。
在步骤506,网络评分引擎114为第二组生物实体中的生物实体生成活性值。因为没有为第二组中的生物实体接收治疗和控制数据,所以在步骤506生成的活性值代表推断出的活性值,并且是基于第一组活性测量和计算网络模型。为第二组生物实体(对应于计算网络模型中的第二组节点)推断出的活性值可以根据多种推断技术中的任何一种生成;以下参考图6描述几种实现。在步骤506为非测量实体生成的活性值利用由网络模型提供的实体之间的关系阐明了不直接测量的生物实体的行为。
在步骤508,网络评分引擎114基于在步骤506生成的活性值计算NPA得分。NPA得分代表由制剂造成的生物系统扰动(如在控制与治疗数据之间的差异中所反映的),并且是基于在步骤506生成的活性值及计算网络模型。在有些实现中,在步骤508计算的NPA得分可以根据下式计算:
其中,V0表示第一组生物实体(即,在步骤502为其接收治疗和控制数据的那些实体),f(x)表示在步骤508为生物实体x生成的活性值,而sign(x→y)表示计算网络模型中把表示生物实体x的节点连接到表示生物实体y的节点的边的方向值。如果与第二组生物实体关联的活性值的向量表示为f2,则网络评分引擎114可以配置为经二次形式计算NPA得分:
其中
diag(out)表示对角矩阵,其具有第二组节点中每个节点的出度(out-degree),diag(in)表示对角矩阵,其具有第二组节点中每个节点的入度(in-degree),而A表示仅限于第二组中根据下式定义的那些节点的计算网络模型的邻接矩阵:
如果A是加权的邻接矩阵,则A的元素(x,y)可以用权重因子w(x→y)去乘。
步骤508还可以包括为NPS得分计算置信间隔。在有些实现中,假定活性值f2遵循多元正态分布N(μ,∑),于是根据等式2计算出的NPA得分将具有可以根据下式计算的相关联的变差(variance):
var(fTQf)=2tr(Q∑Q∑)+4μTQ∑Qμ. (5)
在有些实现中,诸如根据等式5操作的那些实现,NPA得分具有对活性值的二次依赖性。网络评分引擎114可以进一步配置为,除其它方法之外,通过采用切比雪夫(Chebyshev)不等式或者依赖于中心极限定理,使用根据等式5计算出的变差来生成保守置信间隔。
图6是用于为一组节点生成活性值的说明性过程600的流程图。例如,过程600可以在图5过程500的步骤506执行,并且为了容易说明而描述为由网络评分引擎114执行。在步骤602,网络评分引擎114识别差异声明(difference statement)。差异声明可以是代表特定生物实体的活性测量或值与该特定生物实体连接到的生物实体的活性测量或值之间差异的表达或其它可执行声明。在表示感兴趣的生物系统的计算网络模型的语言中,差异声明代表网络模型中特定节点的活性测量或值与该特定节点经边连接到的节点的活性测量或值之间的差异。差异声明可以依赖于计算网络模型中的任何一个或多个节点。在有些实施例中,差异声明依赖于以上关于图5步骤506描述的第二组节点中每个节点(即,没有治疗或控制数据对其可用的那些节点,而且其活性值是从与其它节点关联的治疗或控制数据及计算网络模型推断出来的)的活性值。
在有些实现中,网络评分引擎114在步骤602识别以下差异声明:
其中f(x)表示活性值(对于第二组节点中的节点x)或者测量(对于第一组节点中的节点x),sign(x→y)表示计算网络模型中把代表生物实体x的节点连接到代表生物实体y的节点的边的方向值,而w(x→y)表示与连接代表实体x和y的节点的边关联的权重。为了容易说明,剩余的讨论将假定w(x→y)等于一,但本领域普通技术人员将通过对等式6的差异声明的讨论容易地跟踪非单位权重(即,通过使用如以上参考等式4描述的加权邻接矩阵)。
网络评分引擎114可以许多不同的途径实现等式6的差异声明,包括以下等价声明中任何一个:
在步骤604,网络评分引擎114识别差异目标。差异目标代表网络评分引擎114将朝着其选择用于第二组生物实体的活性值的差异声明的值的优化目标。差异目标可以规定差异声明要最大化、最小化或者尽可能接近目标值。差异目标可以规定要为其选择活性值的生物实体,并且可以确立对为每个实体所允许的活性值范围的约束。在有些实现中,在第一组生物实体(即,治疗和控制数据对其可用的那些实体)的活性等于在图5步骤504计算出的活性测量的约束下,差异目标要对以上参考图5步骤506讨论的第二组节点中的所有生物实体最小化等式6的差异声明。这个差异目标可以写成以下计算优化问题:
为了解决在步骤604中识别出的差异目标,网络评分引擎114配置为前进到步骤606,以基于该差异目标计算性地特征化网络模型。表示生物系统的计算网络模型可以任何多种途径特征化(例如,经如上讨论的加权或不加权的邻接矩阵A)。不同的特征化可以更好地适合不同的差异目标,从而改善网络评分引擎114在计算NPA得分过程中的性能。例如,当差异目标根据以上等式8用公式表示时,网络评分引擎114可以配置为利用根据下式定义的带符号拉普拉斯矩阵特征化计算网络模型:
L=diag(out)+diag(in)-(A+AT). (9)
给定这种特征化,等式8的差异目标可以表示为:
网络评分引擎114可以配置为通过把网络模型分成四个组成部分在第二级特征化计算网络模型:第一组节点内部的连接、从第一组节点到第二组节点的连接、从第二组节点到第一组节点的连接以及第二组节点内部的连接。从计算上来说,网络评分引擎114可以通过把拉普拉斯矩阵分成四个子矩阵(这些组成部分中每个部分一个子矩阵)并且把活性向量f分成两个子向量(第一组节点的活性f1一个子向量并且第二组节点的活性f2一个子向量)实现这个附加特征化。等式10的差异声明的这种重新特征化可以写成:
在步骤606,网络评分引擎114选择实现或近似差异目标的活性值。许多不同的计算优化例程在本领域中是已知的,并且可以适用于在步骤604中识别出的任何差异目标。在其中等式10的差异目标在步骤604中识别出的实现中,网络评分引擎114可以配置为通过取等式11对f2的导数(数值的或者分析的)、把该导数设置成等于零并且重排以便隔离用于f2的表达来选择最小化等式11表达的f2的值。由于
因此网络评分引擎114可以配置为根据下式计算f2:
由于f1是为第一组生物实体(治疗和控制数据对其可用的实体)计算出的活性测量的向量,因此用于第二组生物实体的活性值可以表示为根据等式13计算出的活性测量的线性组合。就像在等式13中一样,活性值可以依赖于第一计算网络模型(即,L2)中第一组节点中的节点与第二组节点中的节点之间的边,并且还可以依赖于计算因果网络模型(即,L3)中第二组节点中节点之间的边。在有些实现中(诸如根据等式13操作的那些实现),活性值不依赖于计算网络模型中第一组节点中节点之间的边。
在步骤608,网络评分引擎114提供在步骤606生成的活性值。在有些实现中,活性值显示给用户。在有些实现中,活性值在图5的步骤508中用于计算NPA得分,如上所述。在有些实现中,用于活性值的变差和置信信息也可以在步骤608生成。例如,如果活性值和测量可以假定为大致遵循多元正态分布,N(μ,∑),则Af也将遵循多元正态分布,其中:
var(Af)=A∑AT. (14)在这种情况下,用于推导出的活性值的置信间隔可以利用其中和∑=diag(var(β))的标准统计技术来计算。
在图5步骤504计算出的活性测量和在图5步骤506生成的活性值(例如,根据图6的过程600)可以用于提供反映应用到相同生物系统的不同制剂与治疗条件之间一致性或不一致性的可比性信息。图7是用于提供可比性信息的说明性过程700的流程图。例如,在图5的步骤506中生成用于第二组节点的活性值之后,过程700可以由网络评分引擎114或系统100的任何其它合适配置的一个或多个组件执行。
在步骤702,网络评分引擎114把第一组活性值表示为第一活性值向量。这种类型的表示在上面参考等式11讨论过了,其中一组活性值表示为向量f2。在步骤704,网络评分引擎114把第一活性值向量分解成第一起作用向量和第一不起作用向量。第一起作用向量和第一不起作用向量依赖于活性值向量与NPA得分之间的关系。如果NPA得分表示为第一活性值向量v1的变换g,使得
NPA=g(h(v1)), (15)则v1可以在步骤704分成两个向量v1c和v1nc之和,使得
v1=vlC+vlnc (16)
并且
g(vlne)=0. (17)数学上,当g严格正定时,不起作用的向量v1nc被说成是变换h的内核,而起作用的向量v1c被说成是在变换h的图像空间中。标准计算技术可以适用于确定各种类型变换的内核与图像空间。如果网络评分引擎114根据等式5和13从活性值向量v1计算出一个NPA得分,则那个NPA得分变换的内核是矩阵积的内核,而且那个NPA得分变换的图像空间是矩阵积的图像空间。因而,活性值向量可以利用标准的计算投影技术分解成处于矩阵积的图像空间中的起作用向量v1c和矩阵积的内核中的不起作用向量v1nc,并且NPA得分不会依赖于不起作用的向量v1nc。
由于NPA得分可以计算为二次形式(如上所示),因此,即使输入数据不反映模型中机制的实际扰动,网络评分引擎114也会生成显著的(关于生物变异)得分。为了评估网络是否实际被扰动(即,模型中所描述的生物是否在数据中反映出来),同伴统计可以用于帮助确定提取出的信号是否特定于该网络结构还是所收集到的数据中固有的。几种类型的置换测试对于评估观察到的信息是否更代表数据固有的属性还是由因果生物网络模型给出的结构可能是特别有用的。
图11和12说明了给定因果网络模型和具体的数据集,可以由网络评分引擎114用于确定推荐的NPA得分的统计显著性的过程1100和1200。确定推荐的NPA得分的统计显著性对于指示由该网络建模的生物系统是否被扰动会是有用的。为了确定所推荐的NPA得分的统计显著性,网络评分引擎114可以让数据接受如下所述的一个或两个测试。
这两个测试(在此被称为置换测试)都基于生成因果网络模型的一个或多个方面的随机置换,利用结果产生的测试模型基于与生成所推荐NPA得分的相同的数据集和算法来计算测试NPA得分,并且比较测试NPA得分与推荐的NPA得分或者给测试NPA得分和推荐的NPA得分分级,以确定所推荐的NPA得分的统计显著性。可以随机分类以生成测试模型的因果网络模型的各方面包括支持节点的标签、把骨干节点连接到支持节点的边,或者把骨干节点彼此连接的边。
在一种实现中,在此被称为“O-统计”测试的置换测试评估因果网络模型中支持节点位置的重要性。过程1100包括评估计算出的NPA得分的统计显著性的方法。特别地,在步骤1102,基于对生物系统中实体的因果关系的知识,第一推荐NPA得分基于网络来计算,该网络也称为未修改的网络。在步骤1106,基因标签并且因此每个支持节点的对应值在网络模型中的支持节点当中随机地重新分配。随机重新分配重复多次,例如,C次,并且在步骤1112,测试NPA得分基于该随机重新分配来计算,导致C个测试NPA得分的分布。网络评分引擎114可以根据以上为基于网络计算NPA得分所述的任何方法计算推荐的和测试NPA得分。在步骤1114,推荐的NPA得分与测试NPA得分的分布进行比较或者对照其进行分级,以确定推荐的NPA得分的统计显著性。
在某些实现中,量化生物系统的扰动的方法包括基于因果网络模型计算推荐的NPA得分,并且确定该得分的统计显著性。显著性可以由一种方法来计算,该方法包括随机地重新分配因果网络模型的支持节点的标签以创建测试模型、基于该测试模型计算测试NPA得分并且比较推荐的NPA得分与测试NPA得分以确定生物系统是否被扰动。支持节点的标签与活性测量关联。
整数C可以是由网络评分引擎确定的任何数字并且可以基于用户输入。整数C可以足够大,使得基于随机重新分配产生的NPA得分的分布大致是平滑的。整数C可以是固定的,使得重新分配执行预定多次。作为替代,整数C可以依赖结果产生的NPA得分变化。例如,整数C可以迭代增加,并且,如果结果产生的NPA分布不平滑,则可以执行附加的重新分配。此外,任何其它对分布的附加需求都可以使用,诸如增加C直到分布像某种形式,诸如高斯或任何其它合适的分布。在某些实现中,整数C从大约500到大约1000变动。
在步骤1110,网络评分引擎114基于在步骤1106生成的随机重新分配计算C个NPA得分。特别地,NPA得分为在步骤1106生成的每个重新分配计算。在某些实现中,所有C次重新分配都首先在步骤1106生成,然后对应的NPA得分在步骤1110基于C次重新分配计算。在其它实现中,对应的NPA得分在生成每个重新分配集合之后计算,并且这个过程重复C次。如果C的值依赖于前面计算出的N个值,则后一种场景可以节省存储器成本并且可能是期望的。在步骤1112,网络评分引擎114汇聚结果产生的C个NPA得分,以形成或生成NPA值的分布,对应于在步骤1106生成的随机重新分配。该分布可以对应于NPA值的柱状图或者该柱状图的正规化版本。
在步骤1114,网络评分引擎114比较第一NPA得分与在步骤1112生成的NPA得分的分布。作为一个例子,该比较可以包括确定代表推荐的NPA得分与分布之间关系的“p-值”。特别地,p-值可以对应于所述分布高于或低于所推荐NPA得分值的百分比。小的,例如小于0.5%、小于1%、小于5%或者任何其它分数的,p-值指示推荐的NPA得分是统计显著的。例如,在步骤1114计算出的具有低p-值(<0.05或者低于5%,例如)的所推荐NPA得分指示推荐的NPA得分与从随机基因标签重新分配产生的显著数量的测试NPA得分高度相关。
在某些实现中,在此被称为“K-统计”测试的另一种置换测试评估因果网络模型中骨干节点结构的重要性。过程1200包括评估所推荐的NPA得分的统计显著性的方法。过程1200与过程1100类似,因为因果网络模型的一方面被随机分类,以创建多个测试模型,在这些模型之上计算多个测试NPA得分。建立于生物系统中实体的因果关系的知识之上的因果网络模型也被称为未修改的网络。在这种模型当中,边可以带符号,因而边可以代表两个骨干节点之间的正或负关系。因此,因果网络模型包括n条连接导致正影响的骨干节点的边,和m条连接导致负影响的骨干节点的边。
在步骤1202,推荐的NPA得分基于建立在生物系统中实体的因果关系的知识之上的网络来计算。然后,在步骤1204中,确定负边的条数n和正边的条数m。在步骤1206,骨干节点对每个都随机地与n条负边中的一条或者m条正边中的一条连接。这个生成与n+m条边的随机连接的过程重复C次。如前面所描述的,迭代次数C可以由用户输入或者由测试NPA得分的分布的平滑性来确定。在步骤1212,基于包括随机连接到其它骨干节点的骨干节点的多个测试模型计算多个测试NPA得分。网络评分引擎114可以根据以上为基于网络计算NPA得分所述的任何方法来计算推荐和测试NPA得分。在步骤1214,推荐的NPA得分与测试NPA得分进行比较或者对照其分级,以确定推荐的NPA得分的统计显著性。
在步骤1210,网络评分引擎114基于在步骤1206形成的随机重新连接计算C个NPA得分。在步骤1212,基于从在步骤1106生成的随机重新连接产生的测试模型,网络评分引擎114汇聚结果产生的C个NPA得分,以生成测试NPA值的分布。这种分布可以对应于NPA值的柱状图或者该柱状图的正规化版本。
在步骤1214,网络评分引擎114比较推荐的NPA得分与在步骤1212生成的NPA得分的分布。作为一个例子,该比较可以包括确定代表所推荐的NPA得分与所述分布之间关系的“p-值”。特别地,p-值可以对应于该分布高于或低于所推荐NPA得分值的百分比。小的,例如小于0.1%、小于0.5%、小于1%、小于5%或者任何中间分数,的p-值指示推荐的NPA得分是统计显著的。例如,在步骤1214计算出的具有低p-值(<0.05或者低于5%,例如)的推荐NPA得分指示推荐的NPA得分与从骨干节点的随机重新连接产生的显著数量的测试NPA得分高度相关。
在某些实现中,可能需要(在图11和12中计算出的)两个p-值对于被认为统计显著的所推荐NPA得分是低的。在其它实现中,为了找出显著的所推荐NPA得分,网络评分引擎114可能需要一个或多个p-值为低。
图13是用于识别前导骨干与基因节点的说明性过程1300的流程图。在步骤1302,网络评分引擎114基于识别出的网络模型生成骨干算子。骨干算子作用于支持节点的活性测量向量并且输出用于骨干节点的活性值向量。在有些实现中,合适的骨干算子是在以上等式13中定义的算子K。
在步骤1304,网络评分引擎114利用在步骤1302生成的骨干算子生成前导骨干节点列表。前导骨干节点可以代表在治疗与控制数据和因果生物网络模型的分析过程中识别出的最显著的骨干节点。为了生成这个列表,网络评分引擎114可以使用骨干算子形成内核,然后该内核可以在用于骨干节点的活性值的向量与其自己之间的内积中使用。在有些实现中,通过按降序给从这种内积产生的和中的项排序,并且选择对应于对这个和起最大作用者的固定数量的节点或者获得总和的指定百分比(例如,60%)所需的多个最显著起作用节点,网络评分引擎114生成前导骨干节点列表。等价地,通过经计算等式1中有序项的累加和来包括构成NPA得分80%的骨干节点,网络评分引擎114可以生成前导骨干节点列表。如以上所讨论的,这个累加和可以作为以下内积的项的累加和来计算(利用骨干算子K):
因而,前导节点的识别既依赖于活性测量,又依赖于网络拓扑结构。
在步骤1306,网络评分引擎114利用在步骤1302生成的骨干算子生成前导基因节点列表。如由等式2所示的,NPA得分可以以倍数变化表示为二次形式。因而,在有些实现中,前导基因列表是通过识别以下标量积的有序和的项生成的:
前导基因列表的两端可能都是重要的,因为对NPA得分起负作用的基因也具有生物显著性。
在有些实现中,网络评分引擎114还在步骤1306为每个基因生成结构重要性值。由于基因在模型中的位置,该结构重要性值独立于实验数据并且代表有些基因可能比其它基因对推断骨干节点值更重要的事实。结构重要性可以通过下式为基因j定义:
前导骨干节点列表中的生物实体和前导基因节点列表中的基因是治疗条件(相对于控制条件)激活底层网络的生物标志的候选。这两个列表可以单独地或者一起用来为将来的研究识别目标,或者可以在其它生物标志识别过程中使用,如以下描述的。
现在参考图7,在有些实现中,基于以下拉普拉斯矩阵的内核与图像空间,网络评分引擎114把步骤704中的第一活性向量分别分解成不起作用和起作用的分量:
其中,计算网络模型已经被约束到对应于第二组生物实体中生物实体的节点,如以上参考图5的步骤506所讨论的。网络评分引擎114还可以配置为作为等式21拉普拉斯算子的矩阵指数计算“带符号的”扩散内核并且把第一活性值投影到空间分量上,以生成用于将来分析的至少一个起作用成分,如以下所描述的。
在步骤706,网络评分引擎114比较(在步骤704确定的)第一起作用向量与从来自不同实验的第二组活性值确定的第二起作用向量。为了确定这个第二起作用向量,步骤702和704可以利用不同的治疗和控制数据对第一组节点重复(根据图5)。在有些实施例中,相同的治疗和/或控制数据可以用于确定第二起作用向量。第二起作用向量代表利用对用于不同实验的NPA得分起作用的不同治疗(和可选地,不同控制数据)从不同实验得到的活性值的分量。由于两个实验中感兴趣的生物系统是相同的,因此底层计算网络模型是相同的并且因此第二不起作用和起作用向量分别依赖于矩阵积的内核和矩阵积的图像空间。
在步骤708,网络评分引擎114基于步骤706的比较提供可比性信息。在有些实现中,可比性信息是第一和第二起作用向量之间的相关性。在有些实现中,可比性信息是第一和第二起作用向量之间的距离。用于比较向量的多种技术中任何一种都可以用于在步骤708提供可比性信息。
在图5步骤504计算出的活性测量和在图5步骤506生成的活性值(例如,根据图6的过程600)可以用于提供可译性信息,该可译性信息反映两个不同生物系统对由相同制剂或治疗条件造成的扰动类似地响应的程度。在一个例子中,两个不同的生物系统可以是试管系统、活体系统、小鼠系统、大鼠系统、非人灵长类动物系统及人体系统的任意组合。图8是用于提供可译性信息的说明性过程800的流程图。例如,在图5的步骤506生成用于第二组节点的活性值之后,过程800可以由网络评分引擎114或者系统100的任何其它合适配置的一个或多个组件执行。在步骤802,网络评分引擎114确定用于第一生物系统中实体的第一组活性值,并且在步骤804,网络评分引擎114确定用于第二生物系统中实体的第二组活性值。第一和第二生物系统中每一个由对应的第一和第二计算网络模型表示。例如,活性值可以根据图5的步骤506或者图6的过程600来确定。
在步骤806,网络评分引擎114比较在步骤802确定的第一组活性值与在步骤804确定的第二组活性值。在有些实现中,网络评分引擎114配置为分析用于第一生物系统的第一活性值(V(1))与用于第二生物系统的第二活性值(V(2))之间的以下关系:
其中h1和h2分别代表在活性测量级别的第一和第二生物系统之间的映射(例如,从用于对第一生物系统的实验的治疗与控制数据到用于对第二生物系统的实验的治疗与控制数据的映射)和在推断出的活性值级别的第一和第二生物系统之间的映射(例如,从用于第一生物系统的推断活性值到用于第二生物系统的推断活性值的映射)。虽然这些映射可能是未知的,但是网络评分引擎114可以配置为通过在活性测量级别和推断的活性值级别执行比较来确定关于这些映射的信息。例如,在有些实现中,网络评分引擎114配置为计算投影到对应矩阵积的图像空间中或者投影到相关矩阵(例如以上参考等式21所讨论的拉普拉斯矩阵)的空间分量上的活性值之间的相关性。在有些实现中,网络评分引擎114可以通过应用内核规范相关分析(KCCA)技术来比较第一和第二组活性值,这些技术中许多是本领域中众所周知的。
在步骤808,网络评分引擎114基于在步骤806的比较提供可译性信息。如以上参考在图7步骤708提供的可比性信息所讨论的,用于比较向量的多种技术中任何一种都可以用于在步骤808提供可比性信息。例如,在有些实现中,网络评分引擎114配置为计算投影到对应矩阵积的图像空间中或者投影到相关矩阵(诸如以上参考等式21所讨论的拉普拉斯矩阵)的空间分量上的活性值之间的相关性。在有些实现中,网络评分引擎114可以比较第一和第二组活性值并且通过应用内核规范相关分析(KCCA)技术来提供可译性信息,这些技术中许多是本领域中众所周知的。
图9是用于计算用于活性值和NPA得分的置信间隔的说明性过程900的流程图。在步骤902,网络评分引擎114计算如以上参考图5步骤504所描述的活性测量(在这里表示为β)。在有些实现中,活性测量可以是由Limma R统计分析包或者由另一种标准统计技术确定的倍数变化值或者加权的倍数变化值(例如,利用关联的错误未发现率加权)。在步骤904,网络评分引擎114计算与步骤902中计算出的活性测量(或者加权的活性测量)关联的变差。在有些实现中,在步骤904,矩阵Σ定义为Σ=diag(var(β))在步骤906,相关网络的结构用于生成拉普拉斯矩阵(例如,如以下参考等式9所描述的)。网络可以是加权的、带符号的及有向的,或者其任意组合。在步骤908,网络评分引擎114通过令左手侧等于零来求解等式12的拉普拉斯表达式,以生成f2(活性值的向量)。在步骤910,网络评分引擎114计算活性值向量的变差。在有些实现中,这个向量是根据下式计算的:
其中,L2和L3如在等式11中定义的。在步骤912中,网络评分引擎114根据下式计算f2的每个输入的置信间隔:
或者
图14是用于量化生物扰动的影响的分布式计算机化系统1400的框图。系统1400的组件类似于图1系统100中的那些组件,但是系统100的布置使得每个组件通过网络接口1410通信。这种实现对于经多个通信系统——包括可以共享对公共网络资源的访问的无线通信系统,诸如“云计算”范例——的分布式计算可能是合适的。
图15是计算设备的框图,诸如用于执行在此所述的过程的图1系统100或图11系统1100的任何组件。系统100的每个组件,包括系统响应剖面引擎110、网络建模引擎112、网络评分引擎114、汇聚引擎116及一个或多个数据库,可以在一个或多个计算设备1500上实现,其中的数据库包括结果数据库、扰动数据库和文献数据库。在某些方面,以上的组件和数据库中的多个可以包括在一个计算设备1500中。在某些实现中,组件和数据库可以跨几个计算设备1500实现。
计算设备1500包括至少一个通信接口单元、输入/输出控制器1510、系统存储器及一个或多个数据存储设备。系统存储器包括至少一个随机存取存储器(RAM1502)和至少一个只读存储器(ROM1504)。所有这些元件都与中央处理单元(CPU1506)通信,以方便计算设备1500的操作。计算设备1500可以许多不同的途径配置。例如,计算设备1500可以是常规的独立计算机或者,作为替代,计算设备1500的功能可以跨多个计算机系统和体系结构分布。计算设备1500可以配置为执行建模、评分和汇聚操作中的一些或全部。在图15中,计算设备1500经网络或局部网络链接到其它服务器或系统。
计算设备1500可以在分布式体系架构中配置,其中数据库和处理器放置在分开的单元或位置中。有些这种单元执行主要的处理功能并且至少包括一个通用控制器或处理器及一个系统存储器。在这一方面,这些单元中每一个都经通信接口单元1508附连到充当与其它服务器、客户端或用户计算机和其它相关设备的主要通信链路的通信集线器或端口(未示出)。通信集线器或端口自己可以具有最小化的处理能力,主要充当通信路由器。多种通信协议可以是系统的一部分,包括但不限于:以太网、SAP、SASTM、ATP、BLUETOOTHTM、GSM和TCP/IP。
CPU1506包括处理器,诸如一个或多个常规的微处理器,以及一个或多个补充的协处理器,诸如用于从CPU1506卸载工作量的数学协处理器。CPU1506与通信接口单元1508和输入/输出控制器1510通信,CPU1506可以通过通信接口单元1508和输入/输出控制器1510与诸如其它服务器、用户终端或设备的其它设备通信。通信接口单元1508和输入/输出控制器1510可以包括用于与例如其它处理器、服务器或客户终端同时通信的多个通信通道。彼此通信的设备不需要持续地向彼此发送。相反,这种设备只需根据需要向彼此发送、实际上可以大部分时间避免交换数据,而且可能需要执行几个步骤来确立设备之间的通信链路。
CPU1506还与数据存储设备通信。数据存储设备可以包括磁、光或半导体存储器的适当组合,而且可以包括例如RAM1502、ROM1504、闪存驱动器、诸如致密盘(compact disc)的光盘(opticaldisc)或者硬盘或驱动器。CPU1506和数据存储设备每个都可以例如完全位于单个计算机或其它计算设备中;或者通过通信介质彼此连接,其中的通信介质诸如UBS端口、串口电缆、同轴电缆、以太网类型电缆、电话线、射频收发器或者其它类似的无线或有线介质或者以上所述的组合。例如,CPU1506可以经通信接口单元1508连接到数据存储设备。CPU1506可以配置为执行一个或多个特定的处理功能。
数据存储设备可以存储例如(i)用于计算设备1500的操作系统1512;(ii)适于根据在此所述的系统和方法,尤其是根据关于CPU1506具体描述的过程,指引CPU1506的一个或多个应用1514(例如,计算机程序代码或计算机程序产品);或者(iii)适于存储程序所需信息的数据库1516。在有些方面,数据库包括存储实验数据及已发表的文献模型的数据库。
操作系统1512和应用1514可以例如以压缩、未压缩和加密的格式存储,并且可以包括计算机程序代码。程序的指令可以从除数据存储设备之外的计算机可读介质,诸如从ROM1504或者从RAM1502,读到处理器的主存储器中。在程序中指令序列的执行使CPU1506执行在此所述的过程步骤的同时,硬连线的电路系统可以代替,或者与软件指令结合来实现本公开内容的过程。因而,所述系统与方法不限于硬件与软件的任何具体组合。
可以提供合适的计算机程序代码,用于执行与在此所述的建模、评分和汇聚相关的一个或多个函数。程序还可以包括诸如操作系统1512、数据库管理系统和“设备驱动器”的程序元素,其中“设备驱动器”允许处理器经输入/输出控制器1510与计算机外围设备(例如,视频显示器、键盘、计算机鼠标等)接口。
如在此所使用的,术语“计算机可读介质”指向计算设备1500的处理器(或者在此所述的设备的任何其它处理器)提供或参与提供要执行的指令的任何非临时性介质。这种介质可以采取许多形式,包括但不限于非易失性介质和易失性介质。非易失性介质包括,例如,光、磁或光-磁盘,或者集成电路存储器,诸如闪存存储器。易失性介质包括一般构成主存储器的动态随机存取存储器(DRAM)。计算机可读介质的常见形式包括,例如,软盘、软磁盘、硬盘、磁带、任何其它磁性介质、CD-ROM、DVD、任何其它光学介质、穿孔卡片、纸带、任何其它具有孔模式的物理介质、RAM、PROM、EPROM或EEPROM(电可擦除可编程只读存储器)、闪存EEPROM、任何其它存储器芯片或盒式磁带、或者计算机可以从其读的任何其它非临时性介质。
各种形式的计算机可读介质可以用于把一条或多条指令的一个或多个序列携带到CPU1506(或者在此所述的设备的任何其它处理器)以供执行。例如,指令可以最初在远程计算机(未示出)的磁盘上产生。该远程计算机可以把指令加载到其动态存储器中并且经以太网连接、电缆线或者甚至利用调制解调器经电话线发送指令。计算设备1500(例如,服务器)本地的通信设备可以在对应的通信线路上接收数据并且把数据放到用于处理器的系统总线上。系统总线把数据携带到主存储器,处理器从主存储器接收并执行指令。在被处理器执行之前或之后,由主存储器接收的指令可以可选地存储在存储器中。此外,指令可以作为电、电磁或光信号经通信端口接收,这些是可以携带各种类型信息的无线通信或数据流的示例性形式。
虽然本公开内容的实现已经参考具体的例子特别示出并进行了描述,但是本领域技术人员应当理解,在不背离由所附权利要求定义的本公开内容范围的情况下可以对其形式与细节进行各种改变。因而,本公开内容的范围是由所附权利要求指示的,而且因此在权利要求等价意义与范围内的所有变化都要被涵盖。
在此所述的系统与方法已经利用能很好理解的细胞培养实验进行了测试。正常的人体支气管上皮(NHBE)细胞通过暴露给PD-0332991、一种吸引G1中细胞的CDK4/6抑制剂(CDKI),来治疗。然后,通过从介质除去CDKI并清洗,允许处理过的细胞重新进入细胞循环。通过在CDKI被除去并且细胞被清洗之后2、4、6和8小时以S-相位荧光标记细胞,实验上确认细胞循环的重新进入。获得在CDKI除去之后2、4、6和8小时采样的细胞的基因转录剖面。获得介质中持续地暴露给CDKI的细胞的剖面。为了识别在CDKI被除去时有区别地被激活的生物过程和机制,网络扰动量值得分利用在各个时间点所获得的清洗后的细胞的基因转录剖面来计算。对于用于与CDKI的去除关联的扰动的NPA得分的计算,使用包括127个节点和240条边的细胞循环子网络。这是在Schlage等人发表的细胞增殖网络模型(2011,“A computable cellular stressnetwork model for non-diseased pulmonary and cardiovasculartissue”,BMC Syst Biol.Oct19;5:158,在此引入其全部作为参考)的一个子网络。
发现NPA得分(图18)在从2小时时间点到8小时时间点的时间点范围上增加,这与荧光激活的细胞分类(FACS)分析(图17)的结果一致,其中FACS分析示出了S-相位中细胞数量的对应增加。NPA得分在P-值<0.05接受两个置换测试,如以上所描述的,而且统计(“O”和“K”统计)都指示实验的NHBE细胞中这个特定的生物系统,即,细胞循环,实际上被扰动了。该分析还识别出细胞循环网络模型中的前导节点,该前导节点精确地对应于已知在S-相位的输入中所涉及的密钥机制:E2F蛋白质与RbP构成联合体,而RbP又在p53和CHEK1的(间接)控制下被Cdk磷酸化。而且还结合Cdk,G1/S-细胞周期蛋白是前导节点过程的一部分,如所预期的。由该方法识别出的前导节点是:taof(TFDP1)、taof(E2F2)、CHEK1、TFDP1、kaof(CHEK1)、taof(E2F3)、taof(E2F1)、taof(RB1)、有丝分裂细胞周期的G1/S过渡、CDC2、E2F2、CCNA2、CCNE1、THAP1、CDKN1A、TP53PS20、E2F3、kaof(CDK2)。Taof是“...的转录活性”的缩写,而kaof是“…的激酶活性”的缩写。TP53PS20是TP53中位置20的丝氨酸被磷酸化的缩写。结果显示基因表达数据与充分利用包含在因果网络模型中的生物系统的知识的机制驱动方法的组合可以用于量化生物系统的扰动。
本发明进一步在以下带标号的段落中进行了定义:
一种用于量化生物系统的扰动的计算机化方法,包括:
在第一处理器接收与第一组生物实体对第一治疗的响应对应的第一组治疗数据,其中第一生物系统包括生物实体,所述生物实体包括第一组生物实体和第二组生物实体,第一生物系统中的每个生物实体与第一生物系统中的至少一个其它生物实体相互作用;
在第二处理器接收与第一组生物实体对与第一治疗不同的第二治疗的响应对应的第二组治疗数据;
在第三处理器提供第一计算因果网络模型,所述第一计算因果网络模型代表第一生物系统并且包括:
代表第一组生物实体的第一组节点,
代表第二组生物实体的第二组节点,
连接节点并且代表生物实体之间的关系的边,及
方向值,代表第一治疗数据与第二治疗数据之间预期的变化方向;
利用第四处理器为第一组节点中的对应节点计算代表第一治疗数据与第二治疗数据之间的差异的第一组活性测量;及
基于第一计算因果网络模型和第一组活性测量,利用第五处理器为第二组节点中的对应节点生成第二组活性值。
段落137的方法,还包括:
基于第一计算因果网络模型和第二组活性值,利用第六处理器为第一计算因果网络模型生成代表由第一和第二治疗造成的第一生物系统的扰动的得分。
段落137的方法,其中生成第二组活性值包括:为第二组节点中的每个特定节点识别最小化差异声明的活性值,所述差异声明表示特定节点的活性值与该特定节点利用第一计算因果网络模型中的边连接到的节点的活性值或活性测量之间的差异,其中差异声明依赖于第二组节点中每个节点的活性值。
段落139的方法,其中差异声明还依赖于第二组节点中每个节点的方向值。
段落137的方法,其中第二组活性值中的每个活性值是第一组活性测量的活性测量的线性组合。
段落141的方法,其中线性组合依赖于第一计算因果网络模型中第一组节点中的节点与第二组节点中的节点之间的边,而且还依赖于第一计算因果网络模型中第二组节点中节点之间的边。
段落141的方法,其中线性组合不依赖于第一计算因果网络模型中第一组节点中节点之间的边。
段落138的方法,其中得分对第二组活性值具有二次依赖性。
段落137的方法,还包括:通过为第一组活性测量的每个活性测量形成变差估计的线性组合,为第二组活性值中的每个活性值提供变差估计。
段落138的方法,其中用于得分的变差估计对第二组活性值具有二次依赖性。
段落138的方法,还包括:
把第二组活性值表示为第一活性值向量;
把第一活性值向量分解成第一起作用向量和第一不起作用向量,使得第一起作用和不起作用向量之和是第一活性值向量。
段落147的方法,其中得分不依赖于第一不起作用向量。
段落148的方法,其中得分是作为第二组活性值的二次函数计算的,而且第一不起作用向量是该二次函数的内核。
段落147的方法,其中,第一不起作用向量在与第一计算因果网络模型关联的带符号拉普拉斯算子的二次函数的内核中。
段落147的方法,还包括:
在第一处理器接收与第一组生物实体对第三治疗的响应对应的第三组治疗数据;
在第二处理器接收与第一组生物实体对第四治疗的响应对应的第四组治疗数据;
利用第四处理器计算对应于第一组节点的第三组活性测量,第三组活性测量中的每个活性测量代表用于第一组节点中的对应节点的第三组治疗数据与第四组治疗数据之间的差异;
基于第一计算因果网络模型和第三组活性测量,利用第五处理器生成第四组活性值,每个活性值代表用于第二组节点中的对应节点的活性值;
把第四组活性值表示为第二活性值向量;
把第二活性值向量分解成第二起作用向量和第二不起作用向量,使得第二起作用和不起作用向量之和是第二活性值向量;及
比较第一和第二起作用向量。
段落151的方法,其中比较第一和第二起作用向量包括:计算第一和第二起作用向量之间的相关性以指示第一组治疗数据和第三组治疗数据的可比性。
段落151的方法,其中比较第一和第二起作用向量包括:把第一和第二起作用向量投影到计算网络模型的带符号拉普拉斯算子的图像空间上。
段落151的方法,其中第二组治疗数据包含与第四组治疗数据相同的信息。
段落137的方法,还包括:
在第一处理器接收与第三组生物实体对与第一治疗不同的第三治疗的响应对应的第三组治疗数据,其中第二生物系统包括多个生物实体,所述生物实体包括第三组生物实体和第四组生物实体,第二生物系统中的每个生物实体都与第二生物系统中的至少一个其它生物实体相互作用;
在第二处理器接收与第三组生物实体对与第三治疗不同的第四治疗的响应对应的第四组治疗数据;
在第三处理器提供第二计算因果网络模型,所述第二计算因果网络模型代表第二生物系统并且包括:
代表第三组生物实体的第三组节点,
代表第四组生物实体的第四组节点,
连接节点并且代表生物实体之间的关系的边,及
方向值,代表第三治疗数据与第四治疗数据之间预期的变化方向;
利用第四处理器计算对应于第三组节点的第三组活性测量,第三组活性测量中的每个活性测量代表用于第三组节点中的对应节点的第三组治疗数据与第四组治疗数据之间的差异;
基于第二计算因果网络模型和第三组活性测量,利用第五处理器生成第四组活性值,每个活性值代表用于第四组节点中的对应节点的活性值;及
比较第四组活性值与第二组活性值。
段落155的方法,其中比较第四组活性值与第二组活性值包括:应用基于与第一计算因果网络模型关联的带符号拉普拉斯算子和与第二计算因果网络模型关联的带符号拉普拉斯算子的内核规范相关性分析。
以上段落137-156任何一段的计算机化方法,其中活性测量是倍数变化值,且用于每个节点的倍数变化值包括用于由对应节点表示的生物实体的对应各组治疗数据之间的差异的对数。
以上段落137-157任何一段的计算机化方法,其中生物系统包括细胞增殖机制、细胞应激机制、细胞发炎机制和DNA修复机制中的至少一个。
以上段落137-158任何一段的计算机化方法,其中第一治疗包括暴露给通过加热烟草生成的浮质、暴露给通过燃烧烟草生成的浮质、暴露给烟草烟雾及暴露给香烟烟雾中的至少一个。
以上段落137-159任何一段的计算机化方法,其中第一治疗包括暴露给异类物质(heterogeneous substance),包括生物系统中不存在或者不能从其得到的分子或实体。
以上段落137-160任何一段的计算机化方法,其中第一治疗包括暴露给毒素、治疗用化合物、刺激物、弛缓剂、天然产物、制造产物及食品物质。
段落155和156任何一段的计算机化方法,其中第一生物系统和第二生物系统是包括试管系统、活体系统、小鼠系统、大鼠系统、非人灵长类系统和人体系统的组中的两个不同元素。
段落137的计算机化方法,其中:
第一治疗数据对应于暴露给制剂的第一生物系统;及
第二治疗数据对应于不暴露给制剂的第一生物系统。
段落138的计算机化方法,还包括确定得分的统计显著性,所述统计显著性指示生物系统的扰动。
段落164的计算机化方法,其中得分的统计显著性是通过比较该得分与多个测试得分来确定的,其中每个测试得分是从多个随机生成的测试计算因果网络模型计算出来的。
段落165的计算机化方法,其中随机生成的测试计算因果网络模型是通过随机分类第一计算因果网络模型的一个或多个方面生成的。
段落166的计算机化方法,其中第一计算因果网络模型的一个或多个方面包括第一组节点的标签、把第二组节点连接到第一组节点的边或者把第二组节点彼此连接的边。
Claims (17)
1.一种用于量化生物系统的扰动的计算机化方法,包括:
在第一处理器接收与第一组生物实体对第一治疗的响应对应的第一组治疗数据,其中第一生物系统包括生物实体,所述生物实体包括第一组生物实体和第二组生物实体,第一生物系统中的每个生物实体与第一生物系统中的至少一个其它生物实体相互作用;
在第二处理器接收与第一组生物实体对与第一治疗不同的第二治疗的响应对应的第二组治疗数据;
在第三处理器提供第一计算因果网络模型,所述第一计算因果网络模型代表第一生物系统并且包括:
代表第一组生物实体的第一组节点,
代表第二组生物实体的第二组节点,
连接节点并且代表生物实体之间的关系的边,及
方向值,代表第一治疗数据与第二治疗数据之间预期的变化方向;
利用第四处理器为第一组节点中的对应节点计算代表第一治疗数据与第二治疗数据之间的差异的第一组活性测量;及
基于第一计算因果网络模型和第一组活性测量,利用第五处理器为第二组节点中的对应节点生成第二组活性值。
2.如权利要求1所述的方法,还包括:
基于第一计算因果网络模型和第二组活性值,利用第六处理器为第一计算因果网络模型生成代表由第一和第二治疗造成的第一生物系统的扰动的得分。
3.如权利要求1所述的方法,其中生成第二组活性值包括:
为第二组节点中的每个特定节点识别最小化差异声明的活性值,所述差异声明表示特定节点的活性值与该特定节点利用第一计算因果网络模型中的边连接到的节点的活性值或活性测量之间的差异,其中差异声明依赖于第二组节点中每个节点的活性值。
4.如权利要求1所述的方法,其中第二组活性值中的每个活性值是第一组活性测量的活性测量的线性组合。
5.如权利要求1所述的方法,还包括:
通过为第一组活性测量的每个活性测量形成变差估计的线性组合,为第二组活性值中的每个活性值提供变差估计。
6.如权利要求2所述的方法,还包括:
把第二组活性值表示为第一活性值向量;
把第一活性值向量分解成第一起作用向量和第一不起作用向量,使得第一起作用和不起作用向量之和是第一活性值向量。
7.如权利要求6所述的方法,其中,第一不起作用向量在基于与第一计算因果网络模型关联的带符号拉普拉斯算子的二次函数的内核中。
8.如权利要求6所述的方法,还包括:
在第一处理器接收与第一组生物实体对第三治疗的响应对应的第三组治疗数据;
在第二处理器接收与第一组生物实体对第四治疗的响应对应的第四组治疗数据;
利用第四处理器计算对应于第一组节点的第三组活性测量,第三组活性测量中的每个活性测量代表用于第一组节点中的对应节点的第三组治疗数据与第四组治疗数据之间的差异;
基于第一计算因果网络模型和第三组活性测量,利用第五处理器生成第四组活性值,每个活性值代表用于第二组节点中的对应节点的活性值;
把第四组活性值表示为第二活性值向量;
把第二活性值向量分解成第二起作用向量和第二不起作用向量,使得第二起作用和不起作用向量之和是第二活性值向量;及
比较第一和第二起作用向量。
9.如权利要求8所述的方法,其中比较第一和第二起作用向量包括:
计算第一和第二起作用向量之间的相关性以指示第一组治疗数据和第三组治疗数据的可比性。
10.如权利要求8所述的方法,其中比较第一和第二起作用向量包括:
把第一和第二起作用向量投影到计算网络模型的带符号拉普拉斯算子的图像空间上。
11.如权利要求1所述的方法,还包括:
在第一处理器接收与第三组生物实体对与第一治疗不同的第三治疗的响应对应的第三组治疗数据,其中第二生物系统包括多个生物实体,所述生物实体包括第三组生物实体和第四组生物实体,第二生物系统中的每个生物实体都与第二生物系统中的至少一个其它生物实体相互作用;
在第二处理器接收与第三组生物实体对与第三治疗不同的第四治疗的响应对应的第四组治疗数据;
在第三处理器提供第二计算因果网络模型,所述第二计算因果网络模型代表第二生物系统并且包括:
代表第三组生物实体的第三组节点,
代表第四组生物实体的第四组节点,
连接节点并且代表生物实体之间的关系的边,及
方向值,代表第三治疗数据与第四治疗数据之间预期的变化方向;
利用第四处理器计算对应于第三组节点的第三组活性测量,第三组活性测量中的每个活性测量代表用于第三组节点中的对应节点的第三组治疗数据与第四组治疗数据之间的差异;
基于第二计算因果网络模型和第三组活性测量,利用第五处理器生成第四组活性值,每个活性值代表用于第四组节点中的对应节点的活性值;及
比较第四组活性值与第二组活性值。
12.如权利要求11所述的方法,其中比较第四组活性值与第二组活性值包括:
应用基于与第一计算因果网络模型关联的带符号拉普拉斯算子和与第二计算因果网络模型关联的带符号拉普拉斯算子的内核规范相关性分析。
13.如前面任何一项权利要求所述的计算机化方法,其中活性测量是倍数变化值,且用于每个节点的倍数变化值包括用于由对应节点表示的生物实体的对应各组治疗数据之间的差异的对数。
14.如权利要求11或权利要求12所述的计算机化方法,其中第一生物系统和第二生物系统是包括试管系统、活体系统、小鼠系统、大鼠系统、非人灵长类系统和人体系统的组中的两个不同元素。
15.如权利要求1所述的计算机化方法,其中:
第一治疗数据对应于暴露给制剂的第一生物系统;及
第二治疗数据对应于不暴露给制剂的第一生物系统。
16.如权利要求2所述的计算机化方法,还包括:
确定得分的统计显著性,所述统计显著性指示生物系统的扰动。
17.如权利要求16所述的计算机化方法,其中得分的统计显著性是通过比较该得分与多个测试得分来确定的,其中每个测试得分是从多个随机生成的测试计算因果网络模型计算出来的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710237916.2A CN107391961B (zh) | 2011-09-09 | 2012-09-07 | 用于基于网络的生物活性评估的系统与方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161532972P | 2011-09-09 | 2011-09-09 | |
US61/532,972 | 2011-09-09 | ||
PCT/EP2012/003760 WO2013034300A2 (en) | 2011-09-09 | 2012-09-07 | Systems and methods for network-based biological activity assessment |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710237916.2A Division CN107391961B (zh) | 2011-09-09 | 2012-09-07 | 用于基于网络的生物活性评估的系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103782301A true CN103782301A (zh) | 2014-05-07 |
CN103782301B CN103782301B (zh) | 2017-05-17 |
Family
ID=46963652
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710237916.2A Active CN107391961B (zh) | 2011-09-09 | 2012-09-07 | 用于基于网络的生物活性评估的系统与方法 |
CN201280043499.3A Active CN103782301B (zh) | 2011-09-09 | 2012-09-07 | 用于基于网络的生物活性评估的系统与方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710237916.2A Active CN107391961B (zh) | 2011-09-09 | 2012-09-07 | 用于基于网络的生物活性评估的系统与方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20140214336A1 (zh) |
EP (1) | EP2754075A2 (zh) |
JP (3) | JP6138793B2 (zh) |
CN (2) | CN107391961B (zh) |
WO (1) | WO2013034300A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106471508A (zh) * | 2014-06-20 | 2017-03-01 | 康涅狄格儿童医疗中心 | 自动化细胞培养系统及对应的方法 |
WO2017211059A1 (zh) * | 2016-06-07 | 2017-12-14 | 王�忠 | 一种判别或比较药物作用模块的方法 |
CN107992720A (zh) * | 2017-12-14 | 2018-05-04 | 浙江工业大学 | 基于共表达网络的癌症靶向标志物测绘方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2608122A1 (en) | 2011-12-22 | 2013-06-26 | Philip Morris Products S.A. | Systems and methods for quantifying the impact of biological perturbations |
JP6313757B2 (ja) | 2012-06-21 | 2018-04-18 | フィリップ モリス プロダクツ エス アー | 統合デュアルアンサンブルおよび一般化シミュレーテッドアニーリング技法を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 |
WO2013190084A1 (en) | 2012-06-21 | 2013-12-27 | Philip Morris Products S.A. | Systems and methods for generating biomarker signatures with integrated bias correction and class prediction |
CA2910061C (en) * | 2013-04-23 | 2023-08-15 | Philip Morris Products S.A. | Systems and methods for using mechanistic network models in systems toxicology |
WO2015022336A1 (en) * | 2013-08-12 | 2015-02-19 | Philip Morris Products S.A. | Systems and methods for crowd-verification of biological networks |
CA2923335C (en) | 2013-09-13 | 2023-11-07 | Philip Morris Products S.A. | Systems and methods for evaluating perturbation of xenobiotic metabolism |
CN104298593B (zh) * | 2014-09-23 | 2017-04-26 | 北京航空航天大学 | 一种基于复杂网络理论的soa系统可靠性评价方法 |
KR101721528B1 (ko) * | 2015-05-28 | 2017-03-31 | 아주대학교산학협력단 | 질병 네트워크로부터 동반 발병 확률을 제공하는 방법 |
US20170059554A1 (en) * | 2015-09-02 | 2017-03-02 | R. J. Reynolds Tobacco Company | Method for monitoring use of a tobacco product |
TWI693612B (zh) * | 2018-01-10 | 2020-05-11 | 國立臺灣師範大學 | 環境賀爾蒙與人體基因的關聯性運算平台 |
CN108614536B (zh) * | 2018-06-11 | 2020-10-27 | 云南中烟工业有限责任公司 | 一种卷烟制丝工艺关键因素的复杂网络构建方法 |
US11515005B2 (en) * | 2019-02-25 | 2022-11-29 | International Business Machines Corporation | Interactive-aware clustering of stable states |
CN110706749B (zh) * | 2019-09-10 | 2022-06-10 | 至本医疗科技(上海)有限公司 | 一种基于组织器官分化层次关系的癌症类型预测系统和方法 |
CN115798598B (zh) * | 2022-11-16 | 2023-11-14 | 大连海事大学 | 一种基于超图的miRNA-疾病关联预测模型及方法 |
CN115861275B (zh) * | 2022-12-26 | 2024-02-06 | 中南大学 | 细胞计数方法、装置、终端设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050086035A1 (en) * | 2003-09-02 | 2005-04-21 | Pioneer Hi-Bred International, Inc. | Computer systems and methods for genotype to phenotype mapping using molecular network models |
US20060177827A1 (en) * | 2003-07-04 | 2006-08-10 | Mathaus Dejori | Method computer program with program code elements and computer program product for analysing s regulatory genetic network of a cell |
US20070198653A1 (en) * | 2005-12-30 | 2007-08-23 | Kurt Jarnagin | Systems and methods for remote computer-based analysis of user-provided chemogenomic data |
US20090326897A1 (en) * | 2006-07-11 | 2009-12-31 | Bayer Technology Services Gmbh | Method for determining the behavior of a biological system after a reversible perturbation |
US20100216660A1 (en) * | 2006-12-19 | 2010-08-26 | Yuri Nikolsky | Novel methods for functional analysis of high-throughput experimental data and gene groups identified therefrom |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6983227B1 (en) * | 1995-01-17 | 2006-01-03 | Intertech Ventures, Ltd. | Virtual models of complex systems |
US20030130798A1 (en) * | 2000-11-14 | 2003-07-10 | The Institute For Systems Biology | Multiparameter integration methods for the analysis of biological networks |
WO2005052181A2 (en) * | 2003-11-24 | 2005-06-09 | Gene Logic, Inc. | Methods for molecular toxicology modeling |
CA2593355A1 (en) * | 2005-01-24 | 2006-07-27 | The Board Of Trustees Of The Leland Stanford Junior University | Method for modeling cell signaling systems by means of bayesian networks |
DE102005030136B4 (de) * | 2005-06-28 | 2010-09-23 | Siemens Ag | Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten |
-
2012
- 2012-09-07 CN CN201710237916.2A patent/CN107391961B/zh active Active
- 2012-09-07 CN CN201280043499.3A patent/CN103782301B/zh active Active
- 2012-09-07 WO PCT/EP2012/003760 patent/WO2013034300A2/en active Application Filing
- 2012-09-07 JP JP2014528898A patent/JP6138793B2/ja active Active
- 2012-09-07 EP EP12766580.0A patent/EP2754075A2/en not_active Ceased
- 2012-09-07 US US14/342,689 patent/US20140214336A1/en not_active Abandoned
-
2016
- 2016-12-13 JP JP2016241117A patent/JP6407242B2/ja active Active
-
2018
- 2018-03-22 JP JP2018054384A patent/JP2018116729A/ja not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060177827A1 (en) * | 2003-07-04 | 2006-08-10 | Mathaus Dejori | Method computer program with program code elements and computer program product for analysing s regulatory genetic network of a cell |
US20050086035A1 (en) * | 2003-09-02 | 2005-04-21 | Pioneer Hi-Bred International, Inc. | Computer systems and methods for genotype to phenotype mapping using molecular network models |
US20070198653A1 (en) * | 2005-12-30 | 2007-08-23 | Kurt Jarnagin | Systems and methods for remote computer-based analysis of user-provided chemogenomic data |
US20090326897A1 (en) * | 2006-07-11 | 2009-12-31 | Bayer Technology Services Gmbh | Method for determining the behavior of a biological system after a reversible perturbation |
US20100216660A1 (en) * | 2006-12-19 | 2010-08-26 | Yuri Nikolsky | Novel methods for functional analysis of high-throughput experimental data and gene groups identified therefrom |
Non-Patent Citations (7)
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106471508A (zh) * | 2014-06-20 | 2017-03-01 | 康涅狄格儿童医疗中心 | 自动化细胞培养系统及对应的方法 |
WO2017211059A1 (zh) * | 2016-06-07 | 2017-12-14 | 王�忠 | 一种判别或比较药物作用模块的方法 |
CN107992720A (zh) * | 2017-12-14 | 2018-05-04 | 浙江工业大学 | 基于共表达网络的癌症靶向标志物测绘方法 |
CN107992720B (zh) * | 2017-12-14 | 2021-08-03 | 浙江工业大学 | 基于共表达网络的癌症靶向标志物测绘方法 |
Also Published As
Publication number | Publication date |
---|---|
US20140214336A1 (en) | 2014-07-31 |
JP6407242B2 (ja) | 2018-10-17 |
WO2013034300A3 (en) | 2013-09-19 |
JP2014532205A (ja) | 2014-12-04 |
CN107391961A (zh) | 2017-11-24 |
JP2017073163A (ja) | 2017-04-13 |
EP2754075A2 (en) | 2014-07-16 |
CN103782301B (zh) | 2017-05-17 |
WO2013034300A2 (en) | 2013-03-14 |
JP2018116729A (ja) | 2018-07-26 |
CN107391961B (zh) | 2020-11-17 |
JP6138793B2 (ja) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103782301B (zh) | 用于基于网络的生物活性评估的系统与方法 | |
JP6335260B2 (ja) | ネットワークに基づく生物学的活性評価のためのシステムおよび方法 | |
JP6320999B2 (ja) | ネットワークベースのバイオマーカシグネチャに関連するシステムおよび方法 | |
CN103843000B (zh) | 用于表征拓扑网络扰动的系统和方法 | |
CN105308604A (zh) | 在系统毒理学中使用机理网络模型的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1197698 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1197698 Country of ref document: HK |